Перейти к содержимому
Калькуляторы

kernel panic freebsd 7.0 + mpd5

Добрый день.

 

Имею серьезную проблему (точнее она имеет меня).

Есть такое дело FreeBSD 7.0 + mpd5. Сервер используется в качестве NAS.

 

Время от времени система вываливается в kernel panic.

Есть такие соображения насчет причин:

1. Кривое железо - но сервер работал без проблем 2 месяца. Нагрузка почти не возросла.

2. Криво собрана и настроена сама ОС.

3. Криво работает mpd5.

 

Говорят есть такая в фре фича когда система отправляется в kernel panic, то через указаный промежуток времени она сама рестартнет.

Плюс ко всем этим бедам не пишется в файл coredump.

Но это можно списать на неправильность настроек.

 

У меня к Олл 2 вопроса.

1. Как сконфигурировать автоматический ребут после kernel panic. Вернее достаточно ли в конфигурации ядра option PANIC_REBOOT_WAIT_TIME=15 ?

2. Похоже ли это, что причина все-таки в mpd5, никто ли не сталкивался с проблемами с md5.

 

Буду признателен за ответы и помощь.

 

 

 

P.S.

 

[root@vpn /usr/src/sys/amd64]# uname -a

FreeBSD vpn 7.0-RELEASE-p3 FreeBSD 7.0-RELEASE-p3 #0: Wed Aug 27 09:26:13 UTC 2008 root@vpn:/usr/obj/usr/src/sys/VPN_kern amd64

 

mpd5.1

 

 

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Кстати на других серверах опция PANIC_REBOOT_WAIT_TIME=15 работает без проблем.

Единственное отличие между все машинами

На тех где все нормально ребутится стоит ОС для I386

А на том что виснет и не рестартует amd64.

 

Возможно совпадение...

 

 

 

 

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

У меня твот такая связка как часы работает, аптайм маленький из-за того, что надо было сервер перегружать по необходимости.

gw# uptime

8:13PM up 27 days, 7:24, 1 user, load averages: 0.00, 0.04, 0.06

gw# uname -a

FreeBSD gw.my.ru 6.1-RELEASE FreeBSD 6.1-RELEASE #0: Sat Apr 5 23:44:22 MS

D 2008 me@gw.my.ru:/usr/obj/usr/src/sys/vpn2-5.04.2008 i386

gw# pkg_info

...

mpd-4.4.1_1 Multi-link PPP daemon based on netgraph(4)

...

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

У меня твот такая связка как часы работает, аптайм маленький из-за того, что надо было сервер перегружать по необходимости.

gw# uptime

8:13PM up 27 days, 7:24, 1 user, load averages: 0.00, 0.04, 0.06

gw# uname -a

FreeBSD gw.my.ru 6.1-RELEASE FreeBSD 6.1-RELEASE #0: Sat Apr 5 23:44:22 MS

D 2008 me@gw.my.ru:/usr/obj/usr/src/sys/vpn2-5.04.2008 i386

gw# pkg_info

...

mpd-4.4.1_1 Multi-link PPP daemon based on netgraph(4)

...

Надо mpd5

И вообще у Вас принципиально схема похожа, но софт совсем другой.

 

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Говорят есть такая в фре фича когда система отправляется в kernel panic, то через указаный промежуток времени она сама рестартнет.

Вообще-то оно такое по умолчанию. И надо явно от этого отказываться.

 

Но по данному треду я понял, что у вас скорее всего материнка чуть кривая и там не работает стандартный ребут через ACPI. Тогда надо попробовать покрутить sysctl'и hw.acpi.disable_on_reboot и hw.acpi.handle_reboot.

 

2. Похоже ли это, что причина все-таки в mpd5, никто ли не сталкивался с проблемами с md5.

Почитайте тематические места. Например, ньюсгруппу fido7.ru.unix.bsd. Там несколько раз подымался вопрос качества mpd5, freebsd7 и присутствует один из разработчиков mpd.

 

 

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Говорят есть такая в фре фича когда система отправляется в kernel panic, то через указаный промежуток времени она сама рестартнет.

Вообще-то оно такое по умолчанию. И надо явно от этого отказываться.

 

Но по данному треду я понял, что у вас скорее всего материнка чуть кривая и там не работает стандартный ребут через ACPI. Тогда надо попробовать покрутить sysctl'и hw.acpi.disable_on_reboot и hw.acpi.handle_reboot.

 

2. Похоже ли это, что причина все-таки в mpd5, никто ли не сталкивался с проблемами с md5.

Почитайте тематические места. Например, ньюсгруппу fido7.ru.unix.bsd. Там несколько раз подымался вопрос качества mpd5, freebsd7 и присутствует один из разработчиков mpd.

 

Спасибо за совет :) .

Насчет ACPI.

Есть такая фича как динамическая частота процессора. При ее включении на материнке система эту фичу распознала, но сервак работает 3 минути и виснет. Перекомпилил ядро с отключением этой фичи ну и отключил ее на мамке. Теперь

Sep 6 12:18:54 vpn kernel: acpi0: <PTLTD RSDT> on motherboard

Sep 6 12:18:54 vpn kernel: acpi0: [iTHREAD]

Sep 6 12:18:54 vpn kernel: acpi0: Power Button (fixed)

Sep 6 12:18:54 vpn kernel: Timecounter "ACPI-fast" frequency 3579545 Hz quality 1000

Sep 6 12:18:54 vpn kernel: acpi_timer0: <24-bit timer at 3.579545MHz> port 0x1008-0x100b on acpi0

Sep 6 12:18:54 vpn kernel: cpu0: <ACPI CPU> on acpi0

Sep 6 12:18:54 vpn kernel: acpi_throttle0: <ACPI CPU Throttling> on cpu0

Sep 6 12:18:54 vpn kernel: cpu1: <ACPI CPU> on acpi0

Sep 6 12:18:54 vpn kernel: acpi_throttle1: <ACPI CPU Throttling> on cpu1

Sep 6 12:18:54 vpn kernel: acpi_throttle1: failed to attach P_CNT

Ситуация не поменялась. Сервак вис дальше. Но было замечено, когда рестрартую mpd5, сервер отправляется в панику.

Было принято решение поставить mpd4.

 

На сегодняшний день

[root@vpn /usr/home/user]# uptime

9:59AM up 1 day, 21:43, 2 users, load averages: 0.08, 0.29, 0.39

 

 

 

 

 

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Есть такое дело. Вы случайно не используете вдобавок ко всему dummynet? Там в релизе 7.0 очень много наковыряли с dummynet и с netgraph. В связи с чем при использовании вместе, а иногда и раздельно система регулярно честно уходит в панику из-за переполнения стека, по этой же причине не пишеться и корка - ее как правило из переполненного стека некому писать. Ну и трабла с ребутом из этой же серии. В 7-STABLE уже закатано много патчей - часть из них уменьшает прожорливость netgraph к стеку, а часть правит проблемы в dummynet. Так что или ждать релиза 7.1, или для пробы накатится до STABLE.

 

PS: Если при панике пишет что-то вроде "Double fault чего-то там 12", то вероятность 99% что в данном случае это трабла со стеком.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Есть такое дело. Вы случайно не используете вдобавок ко всему dummynet? Там в релизе 7.0 очень много наковыряли с dummynet и с netgraph. В связи с чем при использовании вместе, а иногда и раздельно система регулярно честно уходит в панику из-за переполнения стека, по этой же причине не пишеться и корка - ее как правило из переполненного стека некому писать. Ну и трабла с ребутом из этой же серии. В 7-STABLE уже закатано много патчей - часть из них уменьшает прожорливость netgraph к стеку, а часть правит проблемы в dummynet. Так что или ждать релиза 7.1, или для пробы накатится до STABLE.

 

PS: Если при панике пишет что-то вроде "Double fault чего-то там 12", то вероятность 99% что в данном случае это трабла со стеком.

 

Где поподробнее об этом можно узнать, так как имею такую же проблему. И каковы действия по решению.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Кстати у меня стоит 7.0-RELEASE с mpd-4.4.1_1. До не давнего времени все было неплохо, позавчера сервак завис тупо и все и терь постоянно загружается вот с такой траблой :

vpn kernel: WARNING: attempt to net_add_domain(netgraph) after domainfinalize()

 

В message бывает валится вот такая шняга:

Oct 10 16:21:33 vpn kernel: ng_mppc_decompress: rec'd unexpectedly compressed packetng_mppc_decompress: rec'd unexpectedly compressed packetng_mppc_decompres

Oct 10 16:22:00 vpn kernel: ng_mppc_decompress: rec'd unexpectedly compressed packet

...

 

Гул ничего не сказал вразумительного.

На 6.1 траблов вообще не было :( вот терь готовлю тачку под нее.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Есть такое дело. Вы случайно не используете вдобавок ко всему dummynet? Там в релизе 7.0 очень много наковыряли с dummynet и с netgraph. В связи с чем при использовании вместе, а иногда и раздельно система регулярно честно уходит в панику из-за переполнения стека, по этой же причине не пишеться и корка - ее как правило из переполненного стека некому писать. Ну и трабла с ребутом из этой же серии. В 7-STABLE уже закатано много патчей - часть из них уменьшает прожорливость netgraph к стеку, а часть правит проблемы в dummynet. Так что или ждать релиза 7.1, или для пробы накатится до STABLE.

 

PS: Если при панике пишет что-то вроде "Double fault чего-то там 12", то вероятность 99% что в данном случае это трабла со стеком.

 

Где поподробнее об этом можно узнать, так как имею такую же проблему. И каковы действия по решению.

Надо поискать по рассылке FreeBSD, связанной с ipfw. ТАм где-то это обсуждалось примерно зимой-весной 2008 года. Там же где-то вероятно приводится патчик. А еще лучше попробовать накатиться до STABLE и посмотреть. Вероятно развалится система не должна будет. :)

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Нада до 7-STABLE обновиться, у меня получилось 7.1-PRERELEASE и еще я поставил mpd 5.2 - вышел недели 3 назад, в портах его небыло, собрал руками. До 1000 рррое, до 30 кппс на аплинковом интерфейсе. mppe/mppc запрещены, правил ipfw мало, но есть, шейпинг на ng_car радиусом, 20 дней аптайма, по 200+ часов сессии у клиентов, где тут дерево постучать...

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Нада до 7-STABLE обновиться, у меня получилось 7.1-PRERELEASE и еще я поставил mpd 5.2 - вышел недели 3 назад, в портах его небыло, собрал руками. До 1000 рррое, до 30 кппс на аплинковом интерфейсе. mppe/mppc запрещены, правил ipfw мало, но есть, шейпинг на ng_car радиусом, 20 дней аптайма, по 200+ часов сессии у клиентов, где тут дерево постучать...

Не надо стучать. :) Насчет баги я общался с разработчиками, собственно тогда же родился патч, после детального описания проблемы, высланного им. Спустя время, когда отписал им, что патч работает стабильно - видел этот патчик среди коммитов. Потому на STABLE уже несколько месяцев должно быть все ок. :)

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.

Гость
Ответить в тему...

×   Вставлено в виде отформатированного текста.   Вставить в виде обычного текста

  Разрешено не более 75 смайлов.

×   Ваша ссылка была автоматически встроена.   Отобразить как ссылку

×   Ваш предыдущий контент был восстановлен.   Очистить редактор

×   Вы не можете вставить изображения напрямую. Загрузите или вставьте изображения по ссылке.