Jump to content

Recommended Posts

Posted

mb foxconn, cpu amd x2 3800+ (35 Вт), 512 ram

Уже незнаю на что думать. Задачи элементарны iptables на 100 правил, tc комманды около 50 шт, и каджые 5 минут mrtg генерит отчет. Зависает примерно раз в 1-2 недели. в var/log/messages все чисто. службы лишнии отключены.

chkconfig --list | grep 3:on

apache2

atd

cron

dbus

fbset

fw

haldaemon

hddtemp

kbd

lm_sensors

named

network

nscd

policykitd

random

resmgr

running-kernel

smpppd

splash

splash_early

sshd

syslog

Есть небольшое подозрение на hdd

smartctl -a /dev/hda | grep Error

Error: UNC 3 sectors at LBA = 0x001f0024 = 2031652

Error: WP at LBA = 0x0015757f = 1406335

WP at LBA = 0x0015757f = 1406335 .........

Помогите плиз, какие есть варианты???

Posted
в smartctl Reallocated_Event_Count значение чему равно?
Это может быть из-за hdd ? Или больше похоже на железо ?

ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE

1 Raw_Read_Error_Rate 0x000f 200 035 051 Pre-fail Always In_the_past 2

3 Spin_Up_Time 0x0003 167 163 021 Pre-fail Always - 2641

4 Start_Stop_Count 0x0032 099 099 000 Old_age Always - 1348

5 Reallocated_Sector_Ct 0x0033 200 200 140 Pre-fail Always - 0

7 Seek_Error_Rate 0x000f 200 200 051 Pre-fail Always - 0

9 Power_On_Hours 0x0032 089 089 000 Old_age Always - 8758

10 Spin_Retry_Count 0x0013 100 100 051 Pre-fail Always - 0

11 Calibration_Retry_Count 0x0012 100 100 051 Old_age Always - 0

12 Power_Cycle_Count 0x0032 099 099 000 Old_age Always - 1312

194 Temperature_Celsius 0x0022 106 090 000 Old_age Always - 37

196 Reallocated_Event_Count 0x0032 200 200 000 Old_age Always - 0

197 Current_Pending_Sector 0x0012 200 181 000 Old_age Always - 0

198 Offline_Uncorrectable 0x0010 200 183 000 Old_age Offline - 0

199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always - 6

200 Multi_Zone_Error_Rate 0x0009 200 188 051 Pre-fail Offline - 0

 

 

Posted

Смотрите еще /var/log/dmesg.0 (это от лог от предыдущей загрузки).

А вообще что значит "зависает"? Перестает отвечать по сети? Тогда даже если сетвая карточка глюкнет, оно отвечать перестанет.

 

Рекомендую отключить скринсейвер в консоли (не знаю как это в Сусе делается), и в следующий раз когда зависнет и будете перезапускать, позабодтесь о киборде и мониторе, посмотреть что и как. Если там все катастрофически зависло, то ядро обычно успевает диагностику на консоль выплюнуть. А если сама машина еще работоспособна, можно будет проблему понаблюдать наглядно.

 

Еще помогает сесть и подумать, что менялось с тех пор как машина работала нормально. Заменили/добавили компонент, поставили/удалили софт, что-то воткнули в другое место. Это может сузить поле поисков, т.к. если по совести расследование проводить, надо начинать со стабильности напряжения в сети и блока питания, вплоть то стресс-теста каждого компонента по отдельности и в разных комбинациях. Рентабельнее получится просто тупо заменить весь комп.

 

Posted
в smartctl Reallocated_Event_Count значение чему равно?
Это может быть из-за hdd ? Или больше похоже на железо ?

ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE

1 Raw_Read_Error_Rate 0x000f 200 035 051 Pre-fail Always In_the_past 2

3 Spin_Up_Time 0x0003 167 163 021 Pre-fail Always - 2641

4 Start_Stop_Count 0x0032 099 099 000 Old_age Always - 1348

5 Reallocated_Sector_Ct 0x0033 200 200 140 Pre-fail Always - 0

7 Seek_Error_Rate 0x000f 200 200 051 Pre-fail Always - 0

9 Power_On_Hours 0x0032 089 089 000 Old_age Always - 8758

10 Spin_Retry_Count 0x0013 100 100 051 Pre-fail Always - 0

11 Calibration_Retry_Count 0x0012 100 100 051 Old_age Always - 0

12 Power_Cycle_Count 0x0032 099 099 000 Old_age Always - 1312

194 Temperature_Celsius 0x0022 106 090 000 Old_age Always - 37

196 Reallocated_Event_Count 0x0032 200 200 000 Old_age Always - 0

197 Current_Pending_Sector 0x0012 200 181 000 Old_age Always - 0

198 Offline_Uncorrectable 0x0010 200 183 000 Old_age Offline - 0

199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always - 6

200 Multi_Zone_Error_Rate 0x0009 200 188 051 Pre-fail Offline - 0

может, если винт сыпется.

Reallocated_Event_Count показывает сколько битых секторов было переразмечено винтом. У вас он жив и здоров.

согласен с lugoblin

Posted

У меня на одной машинке сетевая карточка уходила в офф, 3ком бумеранг.

Началось оно строго как начал на ней 802.1q юзать. Но там была ругань ядра постоянная про это в дмесг.

  • 3 weeks later...
Posted

Если кому интересно, при зависании все таки даже консоль отключалась (черный экран)

1 шаг - Заменил память блок питания и шлейф - толку ноль, завис

2 шаг - Заменил материнку, CPU, жесткий и сетевые карты (поставил пока обычные REALTEC ), кстати 802.1q юзаю прямо с сетевой, пока 13 дней аптайма....

жду

 

Posted

это, простите, эквивалентно "протер фары, постучал по колесам - глохнет. Сменил корпус, движок, салон, опции - ездит" применительно к авто =)

Posted
Если кому интересно, при зависании все таки даже консоль отключалась (черный экран)
Так делали?

 

2 шаг - Заменил материнку, CPU, жесткий и сетевые карты (поставил пока обычные REALTEC ), кстати 802.1q юзаю прямо с сетевой, пока 13 дней аптайма....
А какой типичный аптайм был до этого?

 

Как я понял - колеса он оставил :-)
Значит, хорошие попались.
Posted
Если кому интересно, при зависании все таки даже консоль отключалась (черный экран)
Так делали?

 

 

2 шаг - Заменил материнку, CPU, жесткий и сетевые карты (поставил пока обычные REALTEC ), кстати 802.1q юзаю прямо с сетевой, пока 13 дней аптайма....
А какой типичный аптайм был до этого?

 

 

Как я понял - колеса он оставил :-)
Значит, хорошие попались.

 

 

1. все было на 9 консоли и она постоянно включена

2. не болше двух недель, но уже 20 дней

3. анекдот не первой свежести. Колеса (корпус и бп) простоял в заземленной стойке и по нему около недели стекало 110 В переменки (разница между обычной розеткой и хорошим заземлением ). Пока не запитали от нормального источника (48 => 220). Но бп выжил, другие не выживали. Так что с колесами тоже бывают проблеммы.

 

Из старого железа методом перебора нашел из-за чего висло. Всем спасибо.

 

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.

Guest
Reply to this topic...

×   Pasted as rich text.   Paste as plain text instead

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.

×
×
  • Create New...
На сайте используются файлы cookie и сервисы аналитики для корректной работы форума и улучшения качества обслуживания. Продолжая использовать сайт, вы соглашаетесь с использованием файлов cookie и с Политикой конфиденциальности.