Jump to content

Почему железо выходит из строя после ребута


Recommended Posts

Posted

Рассматривая патчи в ядро, заметил очень любопытный:

Date: Tue Oct 25 11:37:59 2016 +0200

 

power: reset: at91-poweroff: timely shutdown LPDDR memories

 

commit 0b0408745e7ff24757cbfd571d69026c0ddb803c upstream.

 

LPDDR memories can only handle up to 400 uncontrolled power off. Ensure the

proper power off sequence is used before shutting down the platform.

И ведь действительно, спека на Micron LPDDR2 https://forums.xilinx.com/xlnx/attachments/xlnx/EMBEDDED/9539/1/U80M_4Gb_mobile_lpddr2_s4_sdram.pdf , раздел "Uncontrolled Power-Off". Пошерстив форумы выяснилось что дело в традиционном защелкивании.

И держать ножку надо около 2-х секунд, что очень немало и немногие устройства могут столько "продержать" питание, если питание пропало неожиданно, ну и при контролируемом shutdown банально другие программеры могут схалтурить, и БП отключит питание раньше, чем памяти выдержат необходимую паузу. И кстати во многих устройствах функции shutdown не предусмотрена, и возможно этот нюанс нигде не учитывается вообще, т.е. устройство с LPDDR3 можно выключить лишь не более 400 раз.

P.S. LPDDR3 болеет тем же. Вобщем, ставьте UPS-ы господа.

Posted

И держать ножку надо около 2-х секунд, что очень немало и немногие устройства могут столько "продержать" питание, если питание пропало неожиданно

речь же не о мобильных устройствах - технической проблемы поставить конденсатор не может быть

 

это же LP, питания надо совсем чуть-чуть )))

 

BTW, а где такая память используется? всё-таки первое слово в заголове "Mobile"

Posted

Например некоторые Atom-ы, а вообще в embedded много где могут использовать, просто обычно нет смысла афишировать такие детали. О микротиках я не в курсе, навскидку LPDDR нигде не упоминается.

По поводу конденсатора - питание должно быть по всей системе, иначе возникает много нюансов.

Posted

Наиболее часто при ребуте умирает железо, которое перед этим самым ребутом проработало без выключения несколько лет...

Posted

nuclearcat

visir

именно так про... несколько 72х

отработало несколько лет к ряду, после ребута - не включилось.

одну потеряли после sh ver ...

всегда под замену.

память.

 

Saab95

страдает. благо только умиранием прошивки наглухо. лично пришлось реанимировать несколько 951 после отвала питания.

Posted

страдает. благо только умиранием прошивки наглухо. лично пришлось реанимировать несколько 951 после отвала питания.

 

Возможно там были другие проблемы, т.к. используется большое количество микротиков, которые по питанию никаким образом не резервированы - работают и ничего не слетает. И вообще, что бы микротик просто так взял и сломался после отключения питания - не припомню.

Posted

Saab95 к сожалению специально, именно это устройство, насиловали. убить не смогли.

но на объекте - "горит". после "свет отключали".

привозят - благо уже такой же комплект готов - меняют и опять ждём "свет отключали".

привезённое прошивается, конфига наваливается и в коробочку на склад)

Posted

visir

именно так про... несколько 72х

отработало несколько лет к ряду, после ребута - не включилось.

одну потеряли после sh ver ...

всегда под замену.

память.

Охотно верю, что память. Но явно не из-за превышения количества циклов неправильного выключения.

Или что-то более сложное, типа с увеличением аптайма критичность правильного выключения растет.

С другой стороны, много примеров где ребут не по питанию, а правильный.

Posted

Ну лично я сталкивался у Микротиков с намного более банальной вещью, "типа outdoor" SXT - не обработан никакой защитой от влаги и дыряв, и ожидаемо дохнет в климате где много мелкодисперсной влаги с примесями (смог, туманы и прибрежные регионы).

Posted

Наиболее часто при ребуте умирает железо, которое перед этим самым ребутом проработало без выключения несколько лет...

Это же вполне объяснимо. Кондёры при устоявшемся режиме лишь сглаживают пульсации, при старте же возникает большой ток заряда. Охлаждение может убрать отвалившийся контакт, который держался из последних сил нагретым от расширения. Так что только горячий+холодный резерв, профилактика с выключением и пылесосеньем и прочим осмотром... :)

Posted

С другой стороны, много примеров где ребут не по питанию, а правильный.

 

Это не исключает ситуации, что контроллер обесточивает память. И если он обесточивает в неправильной последовательности...

Posted

Похожее слышал о некоторых матрицах тепловизоров.

там не много другой прикол, если они охлаждаемые(хотя бы элемент пельтье).

А так да, в 90% проработавшее долго и не включается- не выдерживает стартовые токи, токи заряда... Соответственно если хреновое питание то при старте все что угодно может случится с памятью... В одном блоке нашей разработки мы находили косяк что стирается память флэш. А причина оказалась банальная при не правильном ресете в ПЛИС вместо адреса ОЗУ в регистре оказывалась впереди 1- что соответствовало адресу Флэш. И Плисина упорно с флэша на флэш записывала тем самым приводя прошивку в негодность...

Saab, Микротик RB951, rb2011, RB750, RB450, RB433, проблемы с флэшем знакомы... :)

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.

Guest
Reply to this topic...

×   Pasted as rich text.   Paste as plain text instead

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.

×
×
  • Create New...
На сайте используются файлы cookie и сервисы аналитики для корректной работы форума и улучшения качества обслуживания. Продолжая использовать сайт, вы соглашаетесь с использованием файлов cookie и с Политикой конфиденциальности.