Перейти к содержимому
Калькуляторы

сделал проверку конфига, обновись и глянь в emerg.log

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Добрый день, xeb. С какой версией ядра вы проводите тестирование? Возникли некоторые проблемы после перехода с 0.8.3 на версию из git и использование accel-pptp для pppoe. Хотелось бы исключить этот фактор и еще потестировать.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

С какой версией ядра вы проводите тестирование?
в даанный момент у меня стоит
Linux dima 2.6.35-gentoo-r5 #4 SMP Tue Oct 12 08:46:44 MSD 2010 x86_64 AMD Phenom™ II X4 955 Processor AuthenticAMD GNU/Linux
но полномасштабное тестирование проводить своими силами не могу, т.к. не имею "зоопарка клиентов", я тестирую сентетическим тестом, т.е. со второго компа запускаю скрипт который поднимает заданное кол-во сессий и начинает с заданной интенсивностью их дёргать (комп так-же на линуксе), ну и тестирую единичные коннекты с венды ХР/7, это всё, в остальном тестирование проводят добровольцы в своих сетях

 

Возникли некоторые проблемы после перехода с 0.8.3 на версию из git и использование accel-pptp для pppoe
пиши подробней, может быть уже есть решения твоих проблем

 

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

пиши подробней, может быть уже есть решения твоих проблем
Полутестовый BRAS: малая честь клиентов - около 50 (pppoe)

# uname -a

Linux bras-2 2.6.35.7 #1 SMP Tue Oct 5 15:03:44 EEST 2010 x86_64 AMD Athlon 64 Processor 3000+ AuthenticAMD GNU/Linux

 

Все pppoe сессии падают в один и то же время с одинаковой периодичностю (время сессии приблизительно 15900 c)

 

Лог приблизительно такого содержания в этот момент (только warn).

 

[2010-11-30 10:31:03]: warn: ppp23: radius:acct: no response, terminating session...

[2010-11-30 10:31:03]: warn: ppp23: radius:acct_stop: no response

[2010-11-30 10:31:57]: warn: ppp29: radius:acct: no response, terminating session...

[2010-11-30 10:31:57]: warn: ppp29: radius:acct_stop: no response

[2010-11-30 10:32:01]: warn: ppp24: radius:acct: no response, terminating session...

[2010-11-30 10:32:01]: warn: ppp24: radius:acct_stop: no response

[2010-11-30 10:32:05]: warn: ppp13: radius:acct: no response, terminating session...

[2010-11-30 10:32:06]: warn: ppp13: radius:acct_stop: no response

[2010-11-30 10:32:36]: warn: ppp9: radius:acct: no response, terminating session...

[2010-11-30 10:32:36]: warn: ppp9: radius:acct_stop: no response

[2010-11-30 10:32:50]: warn: ppp20: radius:acct: no response, terminating session...

[2010-11-30 10:32:50]: warn: ppp20: radius:acct_stop: no response

[2010-11-30 10:33:18]: warn: ppp5: radius:acct: no response, terminating session...

[2010-11-30 10:33:18]: warn: ppp5: radius:acct_stop: no response

[2010-11-30 10:33:21]: warn: ppp33: radius:acct: no response, terminating session...

[2010-11-30 10:33:21]: warn: ppp33: radius:acct_stop: no response

[2010-11-30 10:33:29]: warn: ppp6: radius:acct: no response, terminating session...

[2010-11-30 10:33:29]: warn: ppp6: radius:acct_stop: no response

 

При этом приходит 3 стоповых пакета. В логе (БД) радиуса такое:

 

452740 2cb16c498f67710e <login> 2010-11-30 06:03:58 2010-11-30 10:29:05 15907 21.7 MB 664.7 MB

453254 2cb16c498f67710e <login> 2010-11-30 06:03:58 2010-11-30 10:29:05 15907 21.7 MB 664.7 MB

453255 2cb16c498f67710e <login> 2010-11-30 06:03:58 2010-11-30 10:29:05 15907 21.7 MB 664.7 MB

 

Есть еще БРАС, который в продакшене, но там версия 0.8.3 и pptp - с тем же радиусом работает хорошо. PPPoE-Сервер с пакета rp-pppoe работает тоже хорошо на той же машине с тем же радиусом

Изменено пользователем paganmind

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

похоже радиус напрочь отказывается отвечать на Interim-Update пакеты, это лучше посмотреть в более подробных логах, в частности в [radius] поставить interim-verbose=1

 

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

похоже радиус напрочь отказывается отвечать на Interim-Update пакеты, это лучше посмотреть в более подробных логах, в частности в [radius] поставить interim-verbose=1
Попробовал то же самое с pptp - 15912 секунд и разрыв. В логе аналогичное.

 

Поставил

[radius]

verbose=1

interim-verbose=1

 

Завтра отпишусь.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

ну плюс ещё в [log] level=4 нужно поставь

Изменено пользователем xeb

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

hiller, попробуй сетевуху выкинуть фтопку, отваливается она у тебя

 

ЗЫ. недавно у меня тоже трабла с падением сетевухи была, в дмесг точно такой же срачь, вот только у меня там ни впна, ни ната не было - тупо бордер, оказалось что встроенная сетевуха десктопная интеловая 82575 говно полное, поставил внешнюю двухпортовую интел 82576 - траблы прекратились

 

ЗЗЫ. да кстате как раз в районе 200мбит глюки и вылезали

У меня и так 576 :(

 

0a:00.0 Ethernet controller: Intel Corporation 82576 Gigabit Network Connection (rev 01)

0a:00.1 Ethernet controller: Intel Corporation 82576 Gigabit Network Connection (rev 01)

 

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Упали.

 

Program received signal SIGSEGV, Segmentation fault.

[switching to Thread 0xb6c8cb70 (LWP 27803)]

0x0805ae76 in _md_malloc (size=134605060,

fname=0x2fdfafe1 <Address 0x2fdfafe1 out of bounds>, line=-1270932056)

at /usr/local/src/accel2/accel-pptp/accel-pptpd/memdebug.c:49

49mem->size = size;

(gdb) bt

#0 0x0805ae76 in _md_malloc (size=134605060,

fname=0x2fdfafe1 <Address 0x2fdfafe1 out of bounds>, line=-1270932056)

at /usr/local/src/accel2/accel-pptp/accel-pptpd/memdebug.c:49

#1 0x0805e904 in ?? ()

#2 0x0805b0da in md_free (ptr=0xb2d41080,

fname=0xb74903b0 "/usr/local/src/accel2/accel-pptp/accel-pptpd/extra/pppd_compat.c", line=303)

at /usr/local/src/accel2/accel-pptp/accel-pptpd/memdebug.c:94

#3 0xb748f7f9 in ev_ppp_finished (ppp=0x0)

at /usr/local/src/accel2/accel-pptp/accel-pptpd/extra/pppd_compat.c:303

#4 0x00000000 in ?? ()

 

Не уверен что самая распоследнияя версия, но не старее 2-3 дней.

 

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

nicolnx, блин аська опять не работает, скинь пожалуйста логов на xeb@mail.ru

 

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

да собственно это все что удалось с того тазика вытащить. логи были отключены бо оно на флешке...

 

Кстати, напоминаю

 

[client-ip-range]

192.168.0.0/17

 

[2010-12-01 01:09:14]: warn: ppp0: ppp:ipcp: to avoid kernel soft lockup requested IP cannot be assigned (192.168.240.2)

 

Патчик для iprange.c с правильным подсчетом маски подсети я высылал

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

hiller, попробуй сетевуху выкинуть фтопку, отваливается она у тебя

 

ЗЫ. недавно у меня тоже трабла с падением сетевухи была, в дмесг точно такой же срачь, вот только у меня там ни впна, ни ната не было - тупо бордер, оказалось что встроенная сетевуха десктопная интеловая 82575 говно полное, поставил внешнюю двухпортовую интел 82576 - траблы прекратились

 

ЗЗЫ. да кстате как раз в районе 200мбит глюки и вылезали

У меня и так 576 :(

 

0a:00.0 Ethernet controller: Intel Corporation 82576 Gigabit Network Connection (rev 01)

0a:00.1 Ethernet controller: Intel Corporation 82576 Gigabit Network Connection (rev 01)

попробуй просто другую или в другой слот воткнуть

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Работает демон стабильно, только вот если кильнеш, потом хер запустишь в дмесе такую вот ругать пишет:

 

[554604.103858] accel-pptpd[28980]: segfault at 30203028 ip 00c11e4d sp b67fe2a0 error 4 in libtriton.so[c0d000+6000]

[554914.940431] accel-pptpd[29964]: segfault at b402cd94 ip 0040313f sp b402cd90 error 6 in libc-2.12.90.so[327000+18d000]

[555102.500704] accel-pptpd[30414]: segfault at 30203028 ip 00c11e4d sp b67432a0 error 4 in libtriton.so[c0d000+6000]

[555145.084283] accel-pptpd[31045]: segfault at 30203028 ip 00c11e4d sp b5fb42a0 error 4 in libtriton.so[c0d000+6000]

[555333.918455] accel-pptpd[31320]: segfault at b3f0cdb4 ip 0040313f sp b3f0cdb0 error 6 in libc-2.12.90.so[327000+18d000]

[555894.995099] accel-pptpd[32529]: segfault at 30203028 ip 00c11e4d sp b5fb62a0 error 4 in libtriton.so[c0d000+6000]

[555966.658298] accel-pptpd[32760]: segfault at 30203028 ip 00c11e4d sp b67bf2a0 error 4 in libtriton.so[c0d000+6000]

[556075.205935] accel-pptpd[701]: segfault at 30203028 ip 00c11e4d sp b57212a0 error 4 in libtriton.so[c0d000+6000]

 

[557867.963444] accel-pptpd[12590]: segfault at 30203028 ip 00c11e4d sp b677f2a0 error 4 in libtriton.so[c0d000+6000]

[557930.086766] accel-pptpd[14866]: segfault at b4002d74 ip 0040313f sp b4002d70 error 6 in libc-2.12.90.so[327000+18d000]

 

В дебаге bt одного из таких запусков:

Program received signal SIGSEGV, Segmentation fault.

[switching to Thread 0xb6febb70 (LWP 31834)]

0x00c11e4d in mempool_free (ptr=0xb47cf024) at /root/accel-pptp/accel-pptpd/triton/mempool.c:168

warning: Source file is more recent than executable.

168 uint32_t size = sizeof(*it) + it->owner->size + 8;

(gdb) bt

#0 0x00c11e4d in mempool_free (ptr=0xb47cf024) at /root/accel-pptp/accel-pptpd/triton/mempool.c:168

#1 0x00c0fdcf in triton_thread (thread=0x811f398) at /root/accel-pptp/accel-pptpd/triton/triton.c:113

#2 0x004c9f19 in start_thread () from /lib/libpthread.so.0

#3 0x00403c5e in clone () from /lib/libc.so.6

 

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

чето я туплю... обновился из гита, теперь роутер с прошивкой асуса от олега не коннектится, в логе акселя:

[2010-12-01 13:40:32]:  info: pptp: new connection from 10.19.17.5
[2010-12-01 13:40:32]:  info: : recv [PPTP Start-Ctrl-Conn-Request <Version 1> <Framing 3> <Bearer 3> <Max-Chan 65535>]
[2010-12-01 13:40:32]:  info: : send [PPTP Start-Ctrl-Conn-Reply <Version 1> <Result 1> <Error 0> <Framing 3> <Bearer 3> <Max-Chan 1>]
[2010-12-01 13:40:33]:  info: : recv [PPTP Outgoing-Call-Request <Call-ID 42e> <Call-Serial 0> <Min-BPS 2400> <Max-BPS 1000000000> <Bearer 3> <Framing 3> <Wi
ndow-Size 50> <Delay 0>]
[2010-12-01 13:40:33]:  info: : send [PPTP Outgoing-Call-Reply <Call-ID 16> <Peer-Call-ID 42e> <Result 1> <Error 0> <Cause 0> <Speed 1000000000> <Window-Size
50> <Delay 0> <Channel 0>]

и дальше тишина

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

На дебиан squeeze проработало с обеда субботы 4 дня. Около 200 пользователей в среднем.

 

Dec  1 10:44:32 vpn6 kernel: [377392.172821] accel-pptpd[16529]: segfault at 0 ip (null) sp 000000004089dec8 error 14 in accel-pptpd[400000+1c000]

 

С такой периодичностью дебагером не дождемся.

 

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Возможно, вот оно

 

Program received signal SIGSEGV, Segmentation fault.

[switching to Thread 0xb7489b70 (LWP 13450)]

0x0805afe7 in _md_malloc (size=134603180,

fname=0xc9beadde <Address 0xc9beadde out of bounds>, line=-1270473336)

at /usr/local/src/accel2/accel-pptp/accel-pptpd/memdebug.c:52

52*(uint64_t*)(mem->data + size) = mem->magic2;

(gdb) bt

#0 0x0805afe7 in _md_malloc (size=134603180,

fname=0xc9beadde <Address 0xc9beadde out of bounds>, line=-1270473336)

at /usr/local/src/accel2/accel-pptp/accel-pptpd/memdebug.c:52

#1 0x0805e1ac in ?? ()

#2 0x0805b1be in md_free (ptr=0xb2b61ae0, fname=0xb7cb6284 "\244Q",

line=-1270473064)

at /usr/local/src/accel2/accel-pptp/accel-pptpd/memdebug.c:94

#3 0x00000094 in ?? ()

#4 0xb7cb40c7 in ppp_finished (ppp=0xb3a39548)

at /usr/local/src/accel2/accel-pptp/accel-pptpd/ctrl/pptp/pptp.c:591

#5 0x0804b104 in destablish_ppp (ppp=0x949804c)

at /usr/local/src/accel2/accel-pptp/accel-pptpd/ppp/ppp.c:220

#6 0x0804b817 in ppp_layer_finished (ppp=0x949804c, d=0xb3e22b34)

at /usr/local/src/accel2/accel-pptp/accel-pptpd/ppp/ppp.c:406

#7 0x0804d76a in lcp_layer_finished (fsm=0xb26fa5a0)

at /usr/local/src/accel2/accel-pptp/accel-pptpd/ppp/ppp_lcp.c:179

#8 0x0804ce25 in ppp_fsm_recv_term_ack (layer=0xb26fa5a0)

at /usr/local/src/accel2/accel-pptp/accel-pptpd/ppp/ppp_fsm.c:421

#9 0x0804f0bf in lcp_recv (h=0xb7fb6e77)

at /usr/local/src/accel2/accel-pptp/accel-pptpd/ppp/ppp_lcp.c:759

#10 0x0804b30f in ppp_chan_read (h=0xb4463078)

at /usr/local/src/accel2/accel-pptp/accel-pptpd/ppp/ppp.c:288

#11 0xb7fda34a in ctx_thread (ctx=0xb7ff6390)

---Type <return> to continue, or q <return> to quit---

at /usr/local/src/accel2/accel-pptp/accel-pptpd/triton/triton.c:180

#12 0xb7fe07b8 in ?? ()

Backtrace stopped: previous frame inner to this frame (corrupt stack?)

(gdb) info locals

mem = 0x1050

 

Последние слова его были:

 

[2010-12-01 15:06:44]: info: ppp8: recv [RADIUS Accounting-Response id=67]

[2010-12-01 15:06:44]: info: ppp8: send [RADIUS Accounting-Request id=168 <User-Name "venix"> <NAS-Identifier "accel-pptp"> <NAS-IP-Address 10.0.2.22> <NAS-Port 8> <NAS-Port-Type Virtual> <Service-Type Framed-User> <Framed-Protocol PPP> <Calling-Station-Id "10.3.26.116"> <Called-Station-Id "10.0.2.24"> <Acct-Status-Type Stop> <Acct-Authentic RADIUS> <Acct-Session-Id "06655a9309de5109"> <Acct-Session-Time 15909> <Acct-Input-Octets 3770901> <Acct-Output-Octets 20256464> <Acct-Input-Packets 31830> <Acct-Output-Packets 29004> <Acct-Input-Gigawords 0> <Acct-Output-Gigawords 0> <Acct-Delay-Time 0> <Framed-IP-Address 172.16.10.105> <Acct-Terminate-Cause NAS-Error>]

[2010-12-01 15:06:44]: info: ppp8: recv [RADIUS Accounting-Response id=68]

[2010-12-01 15:06:44]: info: ppp8: send [RADIUS Accounting-Request id=169 <User-Name "venix"> <NAS-Identifier "accel-pptp"> <NAS-IP-Address 10.0.2.22> <NAS-Port 8> <NAS-Port-Type Virtual> <Service-Type Framed-User> <Framed-Protocol PPP> <Calling-Station-Id "10.3.26.116"> <Called-Station-Id "10.0.2.24"> <Acct-Status-Type Stop> <Acct-Authentic RADIUS> <Acct-Session-Id "06655a9309de5109"> <Acct-Session-Time 15909> <Acct-Input-Octets 3770901> <Acct-Output-Octets 20256464> <Acct-Input-Packets 31830> <Acct-Output-Packets 29004> <Acct-Input-Gigawords 0> <Acct-Output-Gigawords 0> <Acct-Delay-Time 0> <Framed-IP-Address 172.16.10.105> <Acct-Terminate-Cause NAS-Error>]

[2010-12-01 15:06:44]: info: ppp8: recv [RADIUS Accounting-Response id=69]

[2010-12-01 15:06:44]: warn: ppp8: radius:acct_stop: no response

 

Вообще что-то странное происходит с радиус-запросами. Время от времени на аккаунтинг-апдейт отсылается очередь из 3 запросов, после чего делается вывод о no response и сессия отстреливается. Судя по логу отправляются они вообще один за одним. Такое впечатление, что аксель не ждет ответа от радиуса вообще. Отсюда рендомные дисконнекты сессий.

 

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

hiller, попробуй сетевуху выкинуть фтопку, отваливается она у тебя

 

ЗЫ. недавно у меня тоже трабла с падением сетевухи была, в дмесг точно такой же срачь, вот только у меня там ни впна, ни ната не было - тупо бордер, оказалось что встроенная сетевуха десктопная интеловая 82575 говно полное, поставил внешнюю двухпортовую интел 82576 - траблы прекратились

 

ЗЗЫ. да кстате как раз в районе 200мбит глюки и вылезали

У меня и так 576 :(

 

0a:00.0 Ethernet controller: Intel Corporation 82576 Gigabit Network Connection (rev 01)

0a:00.1 Ethernet controller: Intel Corporation 82576 Gigabit Network Connection (rev 01)

попробуй просто другую или в другой слот воткнуть

Другие на более нагруженных серверах стоят. Для этого сервера взяли запасную. Ждем новые :(

 

По поводу слотов - спасибо за совет, мало ли, вдруг плохой контакт или мамка взглючила. Попробую...

 

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Вообще что-то странное происходит с радиус-запросами. Время от времени на аккаунтинг-апдейт отсылается очередь из 3 запросов, после чего делается вывод о no response и сессия отстреливается. Судя по логу отправляются они вообще один за одним. Такое впечатление, что аксель не ждет ответа от радиуса вообще. Отсюда рендомные дисконнекты сессий.

Была такая же проблема, сегодня ночью автор исправил. Обновитесь с гита. У меня работает уже хорошо.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Обновил вчера ядро и accel-pptp 0.8.3 больше не хочет работать :) сделал все как в инструкции по новой, заново собрал и установил, а работать не хочет :(

PPTP: failed to create PPTP socket (Address family not supported by protocol)

Linux 2.6.35-23-server #41-Ubuntu SMP Wed Nov 24 12:12:17 UTC 2010 x86_64 GNU/Linux

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

разобрался, заработало :)

теперь другой вопрос :)

в chap-secrets прописаны адреса пользователей, как теперь заставить pptpd их выдавать?) сейчас они выдаются просто из пула адресов

Изменено пользователем MAKAPOH

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

спасибо, будем тестить

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

nicolnx, пожалуста настрой вывод логов на удалённый комп, без логов не понять что происходит, настраивается просто:

[modules]

log_tcp

 

[log]

log-tcp=x.x.x.x:port

 

на удалённом ловим например с помощью netcat:

nc -l -p port > accel-pptp.log

 

Изменено пользователем xeb

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.

Гость
Ответить в тему...

×   Вставлено в виде отформатированного текста.   Вставить в виде обычного текста

  Разрешено не более 75 смайлов.

×   Ваша ссылка была автоматически встроена.   Отобразить как ссылку

×   Ваш предыдущий контент был восстановлен.   Очистить редактор

×   Вы не можете вставить изображения напрямую. Загрузите или вставьте изображения по ссылке.