Перейти к содержимому
Калькуляторы

Потеря связи к Linux-based бордер с 10G

Добрый день.

 

В продакшене используется Linux бордер с сетевой карточкой 82599EB, ядро 3.2.7 драйвер сетевой ixgbe 3.11.33.

Наблюдалось пропадание связи с сервером, в логах следующее:

 

kernel: Modules linked in: cls_u32 sch_sfq sch_htb bonding iptable_filter ip_tables ip6table_filter ip6_tables ipv6 ext2 dm_mod pcspkr i2c_i801 i2c_core sg   iTCO_wdt iTCO_vendor_support i7core_edac edac_core ixgbe(O) igb(O) e1000e ext4 mbcache jbd2 sd_mod crc_t10dif pata_acpi ata_generic ata_piix [last unloaded:  scsi_wait_scan]
kernel: Pid: 3773, comm: bgpd Tainted: G           O 3.2.7-gw #1
kernel: Call Trace:
kernel: <IRQ>  [<ffffffff8105bd0f>] warn_slowpath_common+0x7f/0xc0
kernel: [<ffffffff8105be06>] warn_slowpath_fmt+0x46/0x50
kernel: [<ffffffff8141caa1>] dev_watchdog+0x231/0x240
kernel: [<ffffffff8141c870>] ? __netdev_watchdog_up+0x80/0x80
kernel: [<ffffffff8106a819>] call_timer_fn+0x49/0x130
kernel: [<ffffffff8141c870>] ? __netdev_watchdog_up+0x80/0x80
kernel: [<ffffffff8106abf2>] run_timer_softirq+0x132/0x240
kernel: [<ffffffff810628b7>] __do_softirq+0xb7/0x200
kernel: [<ffffffff8108184f>] ? hrtimer_interrupt+0x13f/0x230
kernel: [<ffffffff814d3aec>] call_softirq+0x1c/0x30
kernel: [<ffffffff81015255>] do_softirq+0x65/0xa0
kernel: [<ffffffff810626dd>] irq_exit+0x7d/0x90
kernel: [<ffffffff814d448e>] smp_apic_timer_interrupt+0x6e/0x99
kernel: [<ffffffff814d2f5e>] apic_timer_interrupt+0x6e/0x80
kernel: <EOI>
kernel: ---[ end trace 949647e97a0efd7b ]---
kernel: net_ratelimit: 1794 callbacks suppressed
kernel: dst cache overflow
kernel: dst cache overflow

 

Подскажите пожалуйста в чем проблема и как исправить данный баг ?

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Поставить ядро последнее, дрова на сетевуху последние: http://downloadcenter.intel.com/detail_desc.aspx?agr=y&dwnldid=14687&lang=rus и компилить с ключом make CFLAGS_EXTRA="-DIXGBE_NO_LRO" install

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Спасибо за ответ, постараюсь в ближайшее время обновить и отписать о результате.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

поставил последний слакварь с 3.2.29, последние драйвера с сайта интела - так железка тупо висла (!) через несколько часов прокачивания трафика в 2,5гбита. Висла из-за того, что кончалась память ядра. Пробовал ставить ядро 3.4.22 - тоже самое!

 

В итоге откатился на старое доброе 2.6.37.6 (+ патчик, тут пробегал, vlan_dev.c.patch)... полет нормальный.... так что осторожнее со "самым последним ядром"... и не забудьте гипертрединг в биосе отключить ;)

 

Карта, правда, 82598EB 10-Gigabit AT CX4

Изменено пользователем Savaoff

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Спасибо, гипертрейдинг отключен.

Сейчас пока все работает на прежней настройке, за последние 5 дней пока падений не было.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

На счет HT не согласен это заблуждение, надо по уму включать,

так что бы прерывания сыпались с карты на тот HT, который относится к нужному физическому core,

так что бы кэш не вымывался, а наоборот.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.

Гость
Ответить в тему...

×   Вставлено в виде отформатированного текста.   Вставить в виде обычного текста

  Разрешено не более 75 смайлов.

×   Ваша ссылка была автоматически встроена.   Отобразить как ссылку

×   Ваш предыдущий контент был восстановлен.   Очистить редактор

×   Вы не можете вставить изображения напрямую. Загрузите или вставьте изображения по ссылке.