Jump to content
Калькуляторы

FreeBSD 8.2 +MPD 5.5=kernel panic при нагрузке

FreeBSD 8.2-PRERELEASE/amd64 and mpd-5.5 (/usr/ports/net/mpd5)

 

терминация PPPOE, примерно 500Мбит на сервер. Несколько серверов с разной начинкой. Глюки примерно одинаковы, раз в пару суток кернел паник.

 

У народа есть какие-нибудь идеи? Что добавить в пост из технических данных?

Edited by a380

Share this post


Link to post
Share on other sites
FreeBSD 8.2-PRERELEASE/amd64 and mpd-5.5 (/usr/ports/net/mpd5)

 

терминация PPPOE, примерно 500Мбит на сервер. Несколько серверов с разной начинкой. Глюки примерно одинаковы, раз в пару суток кернел паник.

 

У народа есть какие-нибудь идеи? Что добавить в пост из технических данных?

что, кроме мпд установлено и используется?

ng_car|dumminet

какие сетевые платы и дрова к ним?

Share this post


Link to post
Share on other sites

Может быть не поможет, но... А вы случайно не последние дрова от wawa используете?

У меня были похожие проблемы из-за этого. Откатился на предпоследнюю версию - полет нормальный уже около месяца. Тьфу-тьфу чтобы не сглазить...

 

Upd: Пардон, не заметил.

8.2-PRERELEASE with stock em(4) driver version 7.1.8 panices

Edited by morom

Share this post


Link to post
Share on other sites

Кстати 3 дня как похожая проблема. Но 7.3, сначала с 7.0.5, потом с тем же 7.1.8 драйвером. безо всяких ppp* Чиста маршрутизация на 3 канала. bgpd с обрезанной до 22 бит вулвью+еще немного. нетграф есть, там трафик считается. До того стояло и работало с месяц от последнего бута. Трап по времени совпадает с большой нагрузкой. Но нагрузка и раньше бывала. ipfw, 78 правил, других фаерволов нету. ната нету. Ядро похожее, но нетграф модулями (оно в таком виде не первый год и не на одном десятке машин).

 

пока сделал 8.2 и драва от яндекса. по любому там 4 ядра и 2 сетевых, нагрузка расползется на все 4 ядра. Ждем вечера. :(

Share this post


Link to post
Share on other sites
Видел в рассылке.

 

Не обязательно что именно ем драйвер виноват.

мбуф мог быть освобождён где то ещё, после того как попал в ем, и ем на тот момент пытается освободить его второй раз.

У меня такая фигня была когда я свою ноду IPv4 стёка отлаживал: она освобождала мбуф, а потом передавала его на отправку сетевухе, и там оно крашилось.

 

Потому не зацикливайтесь на ем, скорее всего проблема где то сильно раньше.

 

 

 

Не менее интересно откуда:

arp: unknown hardware address format (0x1100)
17 - хм.

 

 

/etc/sysctl.conf:

net.inet.ip.ttl=128

...

net.inet.ip.ttl=130

:)

 

bsnmpd, syslogd, ntpd, quagga (ospfd), sshd, cron, sendmail, inetd.
Фигня, я бы смотрел код в ядре, который с мбуфами работает, в первую очередь.

Это прикладной софт юзерспейса, будь в нём проблема многие бы заметили схожие симптомы.

Share this post


Link to post
Share on other sites

Народ, а подскажите на чем вы терминируете PPPOE? Что-то вроде: железо, версия ос, модули, версия мпд, версия дров сетевых карт, нагрузка?

Хочется собрать информацию в каких вариантах подобной проблемы точно нет.

Edited by a380

Share this post


Link to post
Share on other sites
bsnmpd, syslogd, ntpd, quagga (ospfd), sshd, cron, sendmail, inetd.

есть dummynet, нет nat.

Сетевые intel (em) две штуки.

вот подробно. http://www.freebsd.org/cgi/query-pr.cgi?pr=kern/153671

netisr_init: forcing maxthreads from 4 to 2

...

net.isr.maxthreads=4

Вообще без какого-либо тюнинга оно себя так же ведет? :)

 

Я бы еще попробовал bsnmpd отключить.

 

 

 

Share this post


Link to post
Share on other sites

Баги в ядре, вызывавшие панику при большой нагрузке и/или частом отключении пользователей, на днях исправлены в 8.2-STABLE и, таким образом, исправление войдет в 8.3. С этими фиксами железка (4 гигабитных интерфейса и 4 ядра) совершенно стабильно работает, тянет более 1500 юзеров PPPoE при трафике более 1.1Gbit в сторону юзеров и около гигабита в обратную сторону, 520Kpps и менее 75% загрузки каждого ядра. Интерфейсы - две набортных em и двухпортовая igb.

Share this post


Link to post
Share on other sites

Баги в ядре, вызывавшие панику при большой нагрузке и/или частом отключении пользователей, на днях исправлены в 8.2-STABLE и, таким образом, исправление войдет в 8.3. С этими фиксами железка (4 гигабитных интерфейса и 4 ядра) совершенно стабильно работает, тянет более 1500 юзеров PPPoE при трафике более 1.1Gbit в сторону юзеров и около гигабита в обратную сторону, 520Kpps и менее 75% загрузки каждого ядра. Интерфейсы - две набортных em и двухпортовая igb.

 

А что за исправление такое было? Вы про драйвер е1000? Или? Киньте линк на svn.

Share this post


Link to post
Share on other sites

Create an account or sign in to comment

You need to be a member in order to leave a comment

Create an account

Sign up for a new account in our community. It's easy!

Register a new account

Sign in

Already have an account? Sign in here.

Sign In Now
Sign in to follow this