AlKov Опубликовано 5 января, 2012 · Жалоба Роутер на CentOS-5, ядро 2.6.34 x86_64. Основная задача железки - роутинг и NAT, трафик порядка 450 Мбит/с, 60/48 kpps. Из сетевых задач кроме NAT-a крутится iptables и quagga (RIP и Zebra). Сетевая - Intel Corporation 82576 Gigabit Network Connection (двухпортовая), подключена к порту DGS-3100-24. Суть проблемы - самопризвольный ребут. В логах практически ничего..(/var/log/messages Jan 5 11:46:05 bras snmpd[4076]: Received SNMP packet(s) from UDP: [10.254.213.2]:25065 Jan 5 11:46:05 bras snmpd[4076]: Connection from UDP: [10.254.213.2]:25065 Jan 5 11:46:05 bras snmpd[4076]: Connection from UDP: [10.254.213.2]:57276 Jan 5 11:48:54 bras syslogd 1.4.1: restart. Jan 5 11:48:54 bras kernel: klogd 1.4.1, log source = /proc/kmsg started. ... и т.д., как при обычном ребуте Единственное, что удалось обнаружить, это совершенно непонятный громадный скачок ппс на интерфейсе, смотрящем в Интернет (см. рис). На аплинке (sfp в том же коммутаторе) рост ппс не зафиксирован, там соотв. "провал". По-видимому, это и есть причина ребута, т.к. 100% совпадает по времени. Собственно вопрос - что могло породить такой громадный рость ппс? Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
kayot Опубликовано 5 января, 2012 · Жалоба IMHO это просто глюк мониторинга в момент смерти. Ну а сама смерть из-за железа. Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
terrible Опубликовано 5 января, 2012 · Жалоба Недавно одна из моиз бздей походу дела словила тоже самое - правда в ребут не ушла, а срала в консоль штормом по прерываниям (em1) (аптайм был 380 дней), запаниковала и сделала дамп мозга. Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
NiTr0 Опубликовано 5 января, 2012 · Жалоба что могло породить такой громадный рость ппс? Если у вас есть AS, и маршрут на эту AS не вывернут в blackhole - флуд на любой из непользующихся адресов AS будет многократно усилен бордюром (ибо он по дефолту перешлет пакет на аплинк, аплинк - вернет обратно и т.д.). Хотя ребутиться все арвно не должен. Если железо стабильное. Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
AlKov Опубликовано 5 января, 2012 (изменено) · Жалоба AS-ки нет, аптайм мелкий совсем (в декабре 2011 ребутал). Может это quagga куролесит? Или действительно проблема в железе? Железка относительно новая - серверная интеловская платформа, 2 Xeon-а E5503 2 GHz. Изменено 5 января, 2012 пользователем AlKov Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
NiTr0 Опубликовано 5 января, 2012 · Жалоба Логи ядра на serial, журналирование на второй машине. И думать. По кернел паник ессно в логах на винте ничего не останется. Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
SLon26 Опубликовано 18 января, 2012 · Жалоба rrdtool считает разницу между прошлым показанием и текущим(дельту). Поэтому для него новое показание счетчика в 0, что это был большой объем трафика, который успел скрутить счетчик полностью и заново начать. Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...