avb1987 Posted November 29, 2015 (edited) · Report post Здравствуйте. Может кто-то сталкивался? Есть PC-роутер на VyOS последней версии. Железо: 2 x AMD Opteron 6212 Память: 16 гб Сетевые: 3 x Intel 82576 (медные). Драйвер igb последней версии с сайта intel. Трафик: около 1 гбит/с, 50-150 kpps. На роутере настроено: 2 FULL BGP пира, десяток правил ната, пара правил файрвола. Шейперов нет. Суть проблемы: через неопределенный (всегда разный) интервал после загрузки начинает залипать. Т.е. примерно раз в 30-60 секунд роутер как бы подвисает на 0,5-1 секунду. Причем подвисают все процессы, например если что то печатать в SSH то этот процесс замирает. Если через роутер бегает трафик то трафик дропается или доставляется с задержкой в 1 сек. По top загрузка почти по нулям По mpstat 4 ядра заняты обработкой прерываний на 20-40 % По perf top основные две задачи это irq_entries_start и native_safe_halt Функции энергосбережения в BIOS отключены. В момент зависания обработка прерываний как будто прекращается (судя по mpstat сразу после отлипания загрузка становится по нулям, потом сразу на 100% а потом снова постоянно 40%)/ Также в моменты залипаний увеличиваются счетчики RX overrun на всех интерфейсах (даже на тех на которых трафика совсем немного). Интерфейсы настраивал таким образом: ethtool -K eth0 tso off gso off gro off rx off tx offethtool -G eth0 rx 4096 tx 4096 ethtool -C eth0 rx-usecs 0 Вот вывод mpstat при нормальной работе: 15:10:56 CPU %usr %nice %sys %iowait %irq %soft %steal %guest %idle 15:10:56 all 0.16 0.00 0.03 0.01 0.00 5.36 0.00 0.00 94.44 15:10:56 0 0.18 0.00 0.09 0.08 0.00 25.32 0.00 0.00 74.33 15:10:56 1 0.02 0.00 0.01 0.00 0.00 0.01 0.00 0.00 99.96 15:10:56 2 1.45 0.00 0.06 0.01 0.00 19.47 0.00 0.00 79.01 15:10:56 3 0.08 0.00 0.02 0.00 0.00 0.00 0.00 0.00 99.90 15:10:56 4 0.13 0.00 0.07 0.01 0.00 20.82 0.00 0.00 78.97 15:10:56 5 0.02 0.00 0.02 0.00 0.00 0.00 0.00 0.00 99.95 15:10:56 6 0.52 0.00 0.17 0.01 0.00 20.79 0.00 0.00 78.52 15:10:56 7 0.04 0.00 0.03 0.00 0.00 0.00 0.00 0.00 99.93 15:10:56 8 0.03 0.00 0.03 0.00 0.00 0.00 0.00 0.00 99.93 15:10:56 9 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 99.99 15:10:56 10 0.01 0.00 0.01 0.00 0.00 0.00 0.00 0.00 99.98 15:10:56 11 0.00 0.00 0.01 0.00 0.00 0.00 0.00 0.00 99.99 15:10:56 12 0.03 0.00 0.02 0.00 0.00 0.00 0.00 0.00 99.95 15:10:56 13 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 100.00 15:10:56 14 0.02 0.00 0.01 0.00 0.00 0.00 0.00 0.00 99.97 15:10:56 15 0.00 0.00 0.01 0.00 0.00 0.00 0.00 0.00 99.99 Дополнение: в dmesg пусто. Только сообщения о том что иногда роутер получает некорректные UDP пакеты (неправильной длины и т.п.). В чем может быть проблема? Edited November 29, 2015 by avb1987 Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
Pavel.M.A Posted November 29, 2015 · Report post А по графикам на сам сервер ничего не прилетает ? unicast broadcast и прочее ? Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
avb1987 Posted November 29, 2015 · Report post А по графикам на сам сервер ничего не прилетает ? unicast broadcast и прочее ? В следующий раз когда повторится - посмотрю через tcpdump, но если говорить о графиках нагрузки внешних каналов то никаких аномалий нет. И после перезагрузки машины глюки сразу пропадают на длительное время. Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
NiTr0 Posted November 29, 2015 · Report post Я бы откатился на более старые ядра (3.10, а то и 3.2/3.4). Какая это версия VyOS - не скажу. Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
avb1987 Posted November 30, 2015 (edited) · Report post Похоже что проблема была вызвана недостаточным размером таблицы conntrack. Сначала никаких сообщений в dmesg небыло, но затем появилось много повтояющихся "ip_conntrack: table full, dropping packet". После увеличения размера таблицы уже в течение более чем суток проблема не повторяется. Edited November 30, 2015 by avb1987 Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...