Перейти к содержимому
Калькуляторы

Непонятный reboot роутера Где искать причину?

Роутер на CentOS-5, ядро 2.6.34 x86_64.

Основная задача железки - роутинг и NAT, трафик порядка 450 Мбит/с, 60/48 kpps.

Из сетевых задач кроме NAT-a крутится iptables и quagga (RIP и Zebra).

Сетевая - Intel Corporation 82576 Gigabit Network Connection (двухпортовая), подключена к порту DGS-3100-24.

Суть проблемы - самопризвольный ребут. В логах практически ничего..(/var/log/messages

Jan  5 11:46:05 bras snmpd[4076]: Received SNMP packet(s) from UDP: [10.254.213.2]:25065
Jan  5 11:46:05 bras snmpd[4076]: Connection from UDP: [10.254.213.2]:25065
Jan  5 11:46:05 bras snmpd[4076]: Connection from UDP: [10.254.213.2]:57276
Jan  5 11:48:54 bras syslogd 1.4.1: restart.
Jan  5 11:48:54 bras kernel: klogd 1.4.1, log source = /proc/kmsg started.
... и т.д., как при обычном ребуте

Единственное, что удалось обнаружить, это совершенно непонятный громадный скачок ппс на интерфейсе, смотрящем в Интернет (см. рис). На аплинке (sfp в том же коммутаторе) рост ппс не зафиксирован, там соотв. "провал".

По-видимому, это и есть причина ребута, т.к. 100% совпадает по времени.

Собственно вопрос - что могло породить такой громадный рость ппс?

pps.JPG

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

IMHO это просто глюк мониторинга в момент смерти. Ну а сама смерть из-за железа.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Недавно одна из моиз бздей походу дела словила тоже самое - правда в ребут не ушла, а срала в консоль штормом по прерываниям (em1) (аптайм был 380 дней), запаниковала и сделала дамп мозга.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

что могло породить такой громадный рость ппс?

Если у вас есть AS, и маршрут на эту AS не вывернут в blackhole - флуд на любой из непользующихся адресов AS будет многократно усилен бордюром (ибо он по дефолту перешлет пакет на аплинк, аплинк - вернет обратно и т.д.).

Хотя ребутиться все арвно не должен. Если железо стабильное.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

AS-ки нет, аптайм мелкий совсем (в декабре 2011 ребутал).

Может это quagga куролесит? Или действительно проблема в железе?

Железка относительно новая - серверная интеловская платформа, 2 Xeon-а E5503 2 GHz.

Изменено пользователем AlKov

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Логи ядра на serial, журналирование на второй машине. И думать. По кернел паник ессно в логах на винте ничего не останется.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

rrdtool считает разницу между прошлым показанием и текущим(дельту). Поэтому для него новое показание счетчика в 0, что это был большой объем трафика, который успел скрутить счетчик полностью и заново начать.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.

Гость
Ответить в тему...

×   Вставлено в виде отформатированного текста.   Вставить в виде обычного текста

  Разрешено не более 75 смайлов.

×   Ваша ссылка была автоматически встроена.   Отобразить как ссылку

×   Ваш предыдущий контент был восстановлен.   Очистить редактор

×   Вы не можете вставить изображения напрямую. Загрузите или вставьте изображения по ссылке.