Jump to content
Калькуляторы

Потеря связи к Linux-based бордер с 10G

Добрый день.

 

В продакшене используется Linux бордер с сетевой карточкой 82599EB, ядро 3.2.7 драйвер сетевой ixgbe 3.11.33.

Наблюдалось пропадание связи с сервером, в логах следующее:

 

kernel: Modules linked in: cls_u32 sch_sfq sch_htb bonding iptable_filter ip_tables ip6table_filter ip6_tables ipv6 ext2 dm_mod pcspkr i2c_i801 i2c_core sg   iTCO_wdt iTCO_vendor_support i7core_edac edac_core ixgbe(O) igb(O) e1000e ext4 mbcache jbd2 sd_mod crc_t10dif pata_acpi ata_generic ata_piix [last unloaded:  scsi_wait_scan]
kernel: Pid: 3773, comm: bgpd Tainted: G           O 3.2.7-gw #1
kernel: Call Trace:
kernel: <IRQ>  [<ffffffff8105bd0f>] warn_slowpath_common+0x7f/0xc0
kernel: [<ffffffff8105be06>] warn_slowpath_fmt+0x46/0x50
kernel: [<ffffffff8141caa1>] dev_watchdog+0x231/0x240
kernel: [<ffffffff8141c870>] ? __netdev_watchdog_up+0x80/0x80
kernel: [<ffffffff8106a819>] call_timer_fn+0x49/0x130
kernel: [<ffffffff8141c870>] ? __netdev_watchdog_up+0x80/0x80
kernel: [<ffffffff8106abf2>] run_timer_softirq+0x132/0x240
kernel: [<ffffffff810628b7>] __do_softirq+0xb7/0x200
kernel: [<ffffffff8108184f>] ? hrtimer_interrupt+0x13f/0x230
kernel: [<ffffffff814d3aec>] call_softirq+0x1c/0x30
kernel: [<ffffffff81015255>] do_softirq+0x65/0xa0
kernel: [<ffffffff810626dd>] irq_exit+0x7d/0x90
kernel: [<ffffffff814d448e>] smp_apic_timer_interrupt+0x6e/0x99
kernel: [<ffffffff814d2f5e>] apic_timer_interrupt+0x6e/0x80
kernel: <EOI>
kernel: ---[ end trace 949647e97a0efd7b ]---
kernel: net_ratelimit: 1794 callbacks suppressed
kernel: dst cache overflow
kernel: dst cache overflow

 

Подскажите пожалуйста в чем проблема и как исправить данный баг ?

Share this post


Link to post
Share on other sites

Спасибо за ответ, постараюсь в ближайшее время обновить и отписать о результате.

Share this post


Link to post
Share on other sites

поставил последний слакварь с 3.2.29, последние драйвера с сайта интела - так железка тупо висла (!) через несколько часов прокачивания трафика в 2,5гбита. Висла из-за того, что кончалась память ядра. Пробовал ставить ядро 3.4.22 - тоже самое!

 

В итоге откатился на старое доброе 2.6.37.6 (+ патчик, тут пробегал, vlan_dev.c.patch)... полет нормальный.... так что осторожнее со "самым последним ядром"... и не забудьте гипертрединг в биосе отключить ;)

 

Карта, правда, 82598EB 10-Gigabit AT CX4

Edited by Savaoff

Share this post


Link to post
Share on other sites

Спасибо, гипертрейдинг отключен.

Сейчас пока все работает на прежней настройке, за последние 5 дней пока падений не было.

Share this post


Link to post
Share on other sites

На счет HT не согласен это заблуждение, надо по уму включать,

так что бы прерывания сыпались с карты на тот HT, который относится к нужному физическому core,

так что бы кэш не вымывался, а наоборот.

Share this post


Link to post
Share on other sites

Create an account or sign in to comment

You need to be a member in order to leave a comment

Create an account

Sign up for a new account in our community. It's easy!

Register a new account

Sign in

Already have an account? Sign in here.

Sign In Now
Sign in to follow this