Jump to content

Recommended Posts

Posted (edited)

TSO/GSO отключены надеюсь?

У меня шейперы много где работают, в т.ч. ingress, но такого не встречал.

Ух ты!

В rc.local вписано кровью:

ethtool -K eth0 gro off
ethtool -K eth1 gro off

Больше ничего не менялось.

# ethtool -k eth0
Offload parameters for eth0:
rx-checksumming: on
tx-checksumming: on
scatter-gather: on
tcp-segmentation-offload: on
udp-fragmentation-offload: off
generic-segmentation-offload: on
generic-receive-offload: off
large-receive-offload: off
rx-vlan-offload: on
tx-vlan-offload: on
ntuple-filters: off
receive-hashing: off

 

А чем TSO/GSO плох? У меня вроде проблем не вызывали. Попробую отключить. Спасибо за подсказку.

Edited by Abram
Posted

GSO тоже выключить

Очень интересный эффект они дают, собирают в skb пакеты по 40кб, которые шейпер не очень хорошо переваривает

Упало с отключенными GSO, TSO и GRO.

Может ради интереса вообще все offload-ы отключить?

Видимо, таки придется сходить опять на работу и посмотреть на kernel panic - интерес перевешивает лень. :)

Posted (edited)

Странно. Упало вообще по-другому: http://dl.dropbox.com/u/12495607/IMG_20110521_173622.jpg .

Удалил Intel-овский igb, пока я был в серверной - опять упало, и опять по-другому: http://dl.dropbox.com/u/12495607/IMG_20110522_111832.jpg .

Запустил на всякий случай тест памяти.

 

Еще есть идеи?

Возможен ли глюк сетевой? У меня еще одна есть, могу поменять.

Edited by Abram
Posted (edited)

Тест памяти говорит, что все оке.

Только что поменял сетевуху, запустил, только вышел из серверной - опять упал.

http://dl.dropbox.com/u/12495607/IMG_20110522_122826.jpg

Это уже с Intel-овским igb драйвером и новой сетевухой. Еще подозрения: bonding. Для эксперимента отключил один порт - то же самое.

Завтра буду пробовать вообще его убрать.

Edited by Abram
Posted

Если все так печально, почему тогда не рассматривается вариант собрать ядро другой версии или поставить FreeBSD?

Уже рассматриваю вариант поставить 2.6.39.

А FreeBSD стоит сбоку. Сыплет время от времени ошибку 651, да и местным BSD-танцам с бубном я не обучен и как-то учиться не хочу :).

Posted
местным BSD-танцам с бубном я не обучен и как-то учиться не хочу :)

А чего там учиться? Шейпер настраивается под Фряхой проще, чем под Линуксом. Главное с железом угадать, чтобы не напороться на неработающий драйвер сетевухи или чего-нибудь еще.

Posted
местным BSD-танцам с бубном я не обучен и как-то учиться не хочу :)

А чего там учиться? Шейпер настраивается под Фряхой проще, чем под Линуксом. Главное с железом угадать, чтобы не напороться на неработающий драйвер сетевухи или чего-нибудь еще.

Шейпер - дело десятое. А вот крутить эти все параметры в loader.conf... Брр. Не могу.

У меня тоже 2.6.38 падало...

Поставил стоковое из дебиан. Стоит как вкопанное.

Попробую .39 и что-нибудь постарее. Спасибо.

Posted

Хм, разработчики вообще очень недолюбливают aufs2, по крайней мере пару лет назад.

Хотя на сетевую часть не должно повлиять, там ничего сетевого нет.

Posted

На .38 ведре помогает стабилизировать работу параметр slub_nomerge=1 в загрузку.

У меня все также - 2.6.38.6, x86_64, бондинг и интеловые сетевухи. Правда не igb, а e1000.

Posted (edited)

На .38 ведре помогает стабилизировать работу параметр slub_nomerge=1 в загрузку.

У меня все также - 2.6.38.6, x86_64, бондинг и интеловые сетевухи. Правда не igb, а e1000.

nuclearcat уже отправил багрепорт. Похоже, это sfq.

Посмотри http://marc.info/?l=linux-netdev&m=130614491524959&w=2 - похоже?

Edited by Abram
Posted

На .38 ведре помогает стабилизировать работу параметр slub_nomerge=1 в загрузку.

У меня все также - 2.6.38.6, x86_64, бондинг и интеловые сетевухи. Правда не igb, а e1000.

в 2.6.38 еще был баг(32772) с глубиной стека в net/ipv4/inetpeer.c, фикс-патч попал в 2.6.39 и проблема была устранена

Posted

Никто не сталкивался с подобным? http://dl.dropbox.com/u/12495607/IMG_20110520_120128.jpg

x86_64, 2.6.38, accel-ppp, тупой ingress policer.

также на 2.6.31-gentoo-r6 x86_64 Intel® Core™ i7 CPU 920 @ 2.67GHz

начал выдавать такие ошибки после выгорания интегрированных сетевых карт

Вряд ли это то же самое.

 

На .38 ведре помогает стабилизировать работу параметр slub_nomerge=1 в загрузку.

У меня все также - 2.6.38.6, x86_64, бондинг и интеловые сетевухи. Правда не igb, а e1000.

в 2.6.38 еще был баг(32772) с глубиной стека в net/ipv4/inetpeer.c, фикс-патч попал в 2.6.39 и проблема была устранена

Проверили на 2.6.39, падает. Отправили баг-репорт.

Posted

у меня падал шейпер на 37-м и стабилизировалось на

Linux sirmax 2.6.38.2-sirmax1 #1 SMP PREEMPT Sat Apr 9 16:26:46 EEST 2011 x86_64 AMD Athlon(tm) 64 X2 Dual Core Processor 4400+ AuthenticAMD GNU/Linux

Ванильное, без патчей

 

Шейпер простейший, ifb+sfq, причем падал от траффика. В тесте по вай-фаю все в норме, в том же влане первый ще тест по кабелю - и паника.

Posted (edited)

Увы, разобраться, что к чему, так и не получилось. Откатился на 2.6.35, все работает. Сервер уже в продакшене (нужно было срочно поставить), дальше разбираться возможности нет.

Точно стало известно:

 

* sfq тут ни при чем. Как и вообще что-либо другое в шейпере - отключил шейпер полностью, все равно упало.

* igb ни при чем. Падает как с родным, так и с интеловским драйвером.

* slub_nomerge тоже ни при чем.

* Баг 32772 на мое ядро не влиял. Хотя вполне возможно, что истина где-то рядом - валится вроде бы в том же районе.

* Железо у меня тоже нормальное, на совсем другой машине точно так же валится.

* tso/gso/gro ни при чем (хотя gro все равно лучше отключить ;) ).

 

Что я не проверял - это модуль pptp. В .38/.39 использовал ядерный. Хотя вроде xeb говорил, что в ядре он стабильный.

 

Вот такая вот фигня.

Edited by Abram

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.

Guest
Reply to this topic...

×   Pasted as rich text.   Paste as plain text instead

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.

×
×
  • Create New...
На сайте используются файлы cookie и сервисы аналитики для корректной работы форума и улучшения качества обслуживания. Продолжая использовать сайт, вы соглашаетесь с использованием файлов cookie и с Политикой конфиденциальности.