tartila Опубликовано 27 сентября, 2012 (изменено) · Жалоба Добрый день. Господа, кто встречал такую "весч"? Имеем шейпер 2.6.32-71.el6.x86_64, загружаем правила (хэш) через tc batch , все OK, но иногда сервер выпадает в лок, перезапускается по watchdog. Решил обновить ядро до 3.4.11 с kernel.org. Тоже все OK - пока ребутов спонтанных не было. Но возникла неприятная фигня - при загрузке tc правил через batch tc уходит в большой CPU usage (user space), откатились на старое ядро 2.6.32-71.el6.x86_64 - там такой фигни нет, tc эти же правила загружает мгновенно и без особого потребления CPU. Приводить сами правила не буду - там хэш по HTB. Да и проблема то вроде где-то порылась в несовместимости tc vs нового ядра. Версия iproute2 - 2.6.32.20.el6 - вот сижу и думаю, собирать что-ли новый iproute2? Изменено 27 сентября, 2012 пользователем tartila Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
Иванов Денис Опубликовано 27 сентября, 2012 · Жалоба Нужно собрать сообщения ядра в момент падения, тогда может быть хоть что-то будет понятно. Можно сфотографировать экран, но данных на нём может быть недостаточно. :) Более разумное решение: http://www.cyberciti.biz/tips/linux-netconsole-log-management-tutorial.html Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
tartila Опубликовано 27 сентября, 2012 · Жалоба Нужно собрать сообщения ядра в момент падения, тогда может быть хоть что-то будет понятно. Можно сфотографировать экран, но данных на нём может быть недостаточно. :) Более разумное решение: http://www.cyberciti.biz/tips/linux-netconsole-log-management-tutorial.html Тут вопрос больше не про падения ядра, а про совместимость старого tc+нового ядра. Стоит ли заниматься пересборкой iproute2? А по поводу падений: netconsole стоит - пусто (работоспособность 100%, проверено). На сервере стоит watchdog (аппаратный), который ребутает машину если она повисла. Снимать экран не вариант - нужно максимально быстро восстановить работоспособность. Падения могут быть через 30 дней, а могут быть и через 130 дней. :) Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
Alex/AT Опубликовано 27 сентября, 2012 (изменено) · Жалоба Если уж сменили ядро на сильно новую версию - обязательно пересоберите все взаимодействующие с ядром на уровне NETLINK сетевые приложения. В частности - iptables, ipset (если есть) и iproute2. На деле - надо пересобирать не только эти приложения, но и вообще всё, что напрямую работает с ядром, поскольку могло смениться API/ABI между ядром и userspace. Изменено 27 сентября, 2012 пользователем Alex/AT Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
tartila Опубликовано 27 сентября, 2012 · Жалоба Если уж сменили ядро на сильно новую версию - обязательно пересоберите все взаимодействующие с ядром на уровне NETLINK сетевые приложения. В частности - iptables, ipset (если есть) и iproute2. На деле - надо пересобирать не только эти приложения, но и вообще всё, что напрямую работает с ядром, поскольку могло смениться API/ABI между ядром и userspace. Уже :). Да, пересобрал tc отдельно - все сразу стало замечательно. Всем спасибо за внимание. Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...