tartila Posted September 27, 2012 (edited) Добрый день. Господа, кто встречал такую "весч"? Имеем шейпер 2.6.32-71.el6.x86_64, загружаем правила (хэш) через tc batch , все OK, но иногда сервер выпадает в лок, перезапускается по watchdog. Решил обновить ядро до 3.4.11 с kernel.org. Тоже все OK - пока ребутов спонтанных не было. Но возникла неприятная фигня - при загрузке tc правил через batch tc уходит в большой CPU usage (user space), откатились на старое ядро 2.6.32-71.el6.x86_64 - там такой фигни нет, tc эти же правила загружает мгновенно и без особого потребления CPU. Приводить сами правила не буду - там хэш по HTB. Да и проблема то вроде где-то порылась в несовместимости tc vs нового ядра. Версия iproute2 - 2.6.32.20.el6 - вот сижу и думаю, собирать что-ли новый iproute2? Edited September 27, 2012 by tartila Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
Иванов Денис Posted September 27, 2012 Нужно собрать сообщения ядра в момент падения, тогда может быть хоть что-то будет понятно. Можно сфотографировать экран, но данных на нём может быть недостаточно. :) Более разумное решение: http://www.cyberciti.biz/tips/linux-netconsole-log-management-tutorial.html Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
tartila Posted September 27, 2012 Нужно собрать сообщения ядра в момент падения, тогда может быть хоть что-то будет понятно. Можно сфотографировать экран, но данных на нём может быть недостаточно. :) Более разумное решение: http://www.cyberciti.biz/tips/linux-netconsole-log-management-tutorial.html Тут вопрос больше не про падения ядра, а про совместимость старого tc+нового ядра. Стоит ли заниматься пересборкой iproute2? А по поводу падений: netconsole стоит - пусто (работоспособность 100%, проверено). На сервере стоит watchdog (аппаратный), который ребутает машину если она повисла. Снимать экран не вариант - нужно максимально быстро восстановить работоспособность. Падения могут быть через 30 дней, а могут быть и через 130 дней. :) Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
Alex/AT Posted September 27, 2012 (edited) Если уж сменили ядро на сильно новую версию - обязательно пересоберите все взаимодействующие с ядром на уровне NETLINK сетевые приложения. В частности - iptables, ipset (если есть) и iproute2. На деле - надо пересобирать не только эти приложения, но и вообще всё, что напрямую работает с ядром, поскольку могло смениться API/ABI между ядром и userspace. Edited September 27, 2012 by Alex/AT Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
tartila Posted September 27, 2012 Если уж сменили ядро на сильно новую версию - обязательно пересоберите все взаимодействующие с ядром на уровне NETLINK сетевые приложения. В частности - iptables, ipset (если есть) и iproute2. На деле - надо пересобирать не только эти приложения, но и вообще всё, что напрямую работает с ядром, поскольку могло смениться API/ABI между ядром и userspace. Уже :). Да, пересобрал tc отдельно - все сразу стало замечательно. Всем спасибо за внимание. Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...