Jump to content
Калькуляторы

Потеря связи к Linux-based бордер с 10G

Добрый день.

 

В продакшене используется Linux бордер с сетевой карточкой 82599EB, ядро 3.2.7 драйвер сетевой ixgbe 3.11.33.

Наблюдалось пропадание связи с сервером, в логах следующее:

 

kernel: Modules linked in: cls_u32 sch_sfq sch_htb bonding iptable_filter ip_tables ip6table_filter ip6_tables ipv6 ext2 dm_mod pcspkr i2c_i801 i2c_core sg   iTCO_wdt iTCO_vendor_support i7core_edac edac_core ixgbe(O) igb(O) e1000e ext4 mbcache jbd2 sd_mod crc_t10dif pata_acpi ata_generic ata_piix [last unloaded:  scsi_wait_scan]
kernel: Pid: 3773, comm: bgpd Tainted: G           O 3.2.7-gw #1
kernel: Call Trace:
kernel: <IRQ>  [<ffffffff8105bd0f>] warn_slowpath_common+0x7f/0xc0
kernel: [<ffffffff8105be06>] warn_slowpath_fmt+0x46/0x50
kernel: [<ffffffff8141caa1>] dev_watchdog+0x231/0x240
kernel: [<ffffffff8141c870>] ? __netdev_watchdog_up+0x80/0x80
kernel: [<ffffffff8106a819>] call_timer_fn+0x49/0x130
kernel: [<ffffffff8141c870>] ? __netdev_watchdog_up+0x80/0x80
kernel: [<ffffffff8106abf2>] run_timer_softirq+0x132/0x240
kernel: [<ffffffff810628b7>] __do_softirq+0xb7/0x200
kernel: [<ffffffff8108184f>] ? hrtimer_interrupt+0x13f/0x230
kernel: [<ffffffff814d3aec>] call_softirq+0x1c/0x30
kernel: [<ffffffff81015255>] do_softirq+0x65/0xa0
kernel: [<ffffffff810626dd>] irq_exit+0x7d/0x90
kernel: [<ffffffff814d448e>] smp_apic_timer_interrupt+0x6e/0x99
kernel: [<ffffffff814d2f5e>] apic_timer_interrupt+0x6e/0x80
kernel: <EOI>
kernel: ---[ end trace 949647e97a0efd7b ]---
kernel: net_ratelimit: 1794 callbacks suppressed
kernel: dst cache overflow
kernel: dst cache overflow

 

Подскажите пожалуйста в чем проблема и как исправить данный баг ?

Share this post


Link to post
Share on other sites

Поставить ядро последнее, дрова на сетевуху последние: http://downloadcenter.intel.com/detail_desc.aspx?agr=y&dwnldid=14687&lang=rus и компилить с ключом make CFLAGS_EXTRA="-DIXGBE_NO_LRO" install

Share this post


Link to post
Share on other sites

поставил последний слакварь с 3.2.29, последние драйвера с сайта интела - так железка тупо висла (!) через несколько часов прокачивания трафика в 2,5гбита. Висла из-за того, что кончалась память ядра. Пробовал ставить ядро 3.4.22 - тоже самое!

 

В итоге откатился на старое доброе 2.6.37.6 (+ патчик, тут пробегал, vlan_dev.c.patch)... полет нормальный.... так что осторожнее со "самым последним ядром"... и не забудьте гипертрединг в биосе отключить ;)

 

Карта, правда, 82598EB 10-Gigabit AT CX4

Edited by Savaoff

Share this post


Link to post
Share on other sites

Спасибо, гипертрейдинг отключен.

Сейчас пока все работает на прежней настройке, за последние 5 дней пока падений не было.

Share this post


Link to post
Share on other sites

На счет HT не согласен это заблуждение, надо по уму включать,

так что бы прерывания сыпались с карты на тот HT, который относится к нужному физическому core,

так что бы кэш не вымывался, а наоборот.

Share this post


Link to post
Share on other sites

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.

Guest
Reply to this topic...

×   Pasted as rich text.   Paste as plain text instead

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.