Перейти к содержимому
Калькуляторы

Каждое завершение работы демона завершается крашем. Accel корку не создает, системный abrtd пытается, но что-то у него не сростается.

cat /var/log/messages

Sep  2 06:53:41 ipoe1 abrt[6935]: File '/usr/local/sbin/accel-pppd' seems to be deleted
Sep  2 06:53:41 ipoe1 abrt[6935]: Saved core dump of pid 18168 (/usr/local/sbin/accel-pppd) to /var/spool/abrt/ccpp-2013-09-02-06:53:41-18168 (76460032 bytes)
Sep  2 06:53:41 ipoe1 abrtd: Directory 'ccpp-2013-09-02-06:53:41-18168' creation detected
Sep  2 06:53:41 ipoe1 abrtd: Executable '/usr/local/sbin/accel-pppd' doesn't belong to any package
Sep  2 06:53:41 ipoe1 abrtd: 'post-create' on '/var/spool/abrt/ccpp-2013-09-02-06:53:41-18168' exited with 1
Sep  2 06:53:41 ipoe1 abrtd: Corrupted or bad directory /var/spool/abrt/ccpp-2013-09-02-06:53:41-18168, deleting

Sep  2 06:56:54 ipoe1 abrt[7080]: Saved core dump of pid 6968 (/usr/local/sbin/accel-pppd) to /var/spool/abrt/ccpp-2013-09-02-06:56:53-6968 (30277632 bytes)
Sep  2 06:56:54 ipoe1 abrtd: Directory 'ccpp-2013-09-02-06:56:53-6968' creation detected
Sep  2 06:56:54 ipoe1 abrtd: Executable '/usr/local/sbin/accel-pppd' doesn't belong to any package
Sep  2 06:56:54 ipoe1 abrtd: 'post-create' on '/var/spool/abrt/ccpp-2013-09-02-06:56:53-6968' exited with 1
Sep  2 06:56:54 ipoe1 abrtd: Corrupted or bad directory /var/spool/abrt/ccpp-2013-09-02-06:56:53-6968, deleting

Sep  2 07:02:03 ipoe1 abrtd: Directory 'ccpp-2013-09-02-07:02:03-7083' creation detected
Sep  2 07:02:03 ipoe1 abrt[7405]: Saved core dump of pid 7083 (/usr/local/sbin/accel-pppd) to /var/spool/abrt/ccpp-2013-09-02-07:02:03-7083 (75157504 bytes)
Sep  2 07:02:03 ipoe1 abrtd: Executable '/usr/local/sbin/accel-pppd' doesn't belong to any package
Sep  2 07:02:03 ipoe1 abrtd: 'post-create' on '/var/spool/abrt/ccpp-2013-09-02-07:02:03-7083' exited with 1
Sep  2 07:02:03 ipoe1 abrtd: Corrupted or bad directory /var/spool/abrt/ccpp-2013-09-02-07:02:03-7083, deleting

Sep  2 07:10:07 ipoe1 abrtd: Directory 'ccpp-2013-09-02-07:10:07-7429' creation detected
Sep  2 07:10:07 ipoe1 abrt[7797]: Saved core dump of pid 7429 (/usr/local/sbin/accel-pppd) to /var/spool/abrt/ccpp-2013-09-02-07:10:07-7429 (30433280 bytes)
Sep  2 07:10:07 ipoe1 abrtd: Executable '/usr/local/sbin/accel-pppd' doesn't belong to any package
Sep  2 07:10:07 ipoe1 abrtd: 'post-create' on '/var/spool/abrt/ccpp-2013-09-02-07:10:07-7429' exited with 1
Sep  2 07:10:07 ipoe1 abrtd: Corrupted or bad directory /var/spool/abrt/ccpp-2013-09-02-07:10:07-7429, deleting

Sep  2 07:13:13 ipoe1 abrtd: Directory 'ccpp-2013-09-02-07:13:13-7800' creation detected
Sep  2 07:13:13 ipoe1 abrt[7900]: Saved core dump of pid 7800 (/usr/local/sbin/accel-pppd) to /var/spool/abrt/ccpp-2013-09-02-07:13:13-7800 (38969344 bytes)
Sep  2 07:13:13 ipoe1 abrtd: Executable '/usr/local/sbin/accel-pppd' doesn't belong to any package
Sep  2 07:13:13 ipoe1 abrtd: 'post-create' on '/var/spool/abrt/ccpp-2013-09-02-07:13:13-7800' exited with 1
Sep  2 07:13:13 ipoe1 abrtd: Corrupted or bad directory /var/spool/abrt/ccpp-2013-09-02-07:13:13-7800, deleting

cat /var/log/accel-ppp/core.log

[2013-07-27 21:23:39.29]BUG:ctx:triton_unregister_ctx: handlers is not empty
[2013-07-27 21:42:27.258]BUG:ctx:triton_unregister_ctx: handlers is not empty
[2013-07-27 21:45:51.559]BUG:ctx:triton_unregister_ctx: handlers is not empty
[2013-07-27 21:52:14.70]BUG:ctx:triton_unregister_ctx: handlers is not empty
[2013-07-29 23:10:27.963]BUG:ctx:triton_unregister_ctx: handlers is not empty
[2013-07-31 13:45:29.416]BUG:ctx:triton_unregister_ctx: handlers is not empty
[2013-08-29 08:00:27.482]BUG:ctx:triton_unregister_ctx: handlers is not empty
[2013-08-31 01:37:03.273]BUG:ctx:triton_unregister_ctx: handlers is not empty
[2013-08-31 01:41:21.558]BUG:ctx:triton_unregister_ctx: handlers is not empty
[2013-08-31 02:08:41.705]BUG:ctx:triton_unregister_ctx: handlers is not empty
[2013-08-31 02:12:19.870]BUG:ctx:triton_unregister_ctx: handlers is not empty

[2013-09-02 06:53:41.89]BUG:ctx:triton_unregister_ctx: handlers is not empty
[2013-09-02 07:02:03.404]BUG:ctx:triton_unregister_ctx: handlers is not empty
[2013-09-02 07:13:13.148]BUG:ctx:triton_unregister_ctx: handlers is not empty

Как раз сегодня утром 3 раза перезапускал(accel-cmd shutdown) и 2 раза сервис падал сам.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

kayot

разобрались с rhel-овской приблудой по сбору корок?

Изменено пользователем srg555

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

srg555

Да, спасибо за пинок.

Сейчас собираю отдельный стенд для тестирования, в подакшине софт с такими глобальными изменениями тестить уже страшно.

 

Да, некорректное завершение работы с ipoe-модулем было всегда. Без активного abrtd его просто не заметно, в core.log строчка про bug писалась давно.

На работу оно никак не влияет, потому внимание и не обращали.

Изменено пользователем kayot

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

xeb, сорри что не патч:

 

<------>opt = conf_get_opt("shaper", "rate-multiplier");

<------>if (opt && atoi(opt) >= 0)

<------><------>conf_multiplier = atof(opt);

<------>else

<------><------>conf_multiplier = 1;

 

Надо бы думаю

<------>if (opt && atof(opt) >= 0.0)

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

в подакшине софт с такими глобальными изменениями тестить уже страшно.
я думаю, если нет возражений, что пока достаточно функционала запилино, надо отладить то что есть и выпустить какой-то релиз

а новые идеи уже будут в следующей версии

 

nuclearcat, я смотрю уже исправлено

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

А, ок, спасибо. А то с микротиком столкнулся :)

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

не уверен что на этом ядре исправлено

это ядро вообще помоему никем не поддерживается, я бы порекомендовал хотя бы 3.2

Подскажите, отключение модуля устранит проблему? До обновления, работало пол года стабильно. Обновил, сегодня 3 раза уже падало.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Не работает монитор вланов, или я не понял как им пользоваться.

[ipoe]
interface=re:eth0\.[1-9][0-9][0-9]\.(\d+)$,relay=10.200.0.2,giaddr=10.200.0.110
interface=re:eth0\.2[0-9][0-9][0-9]\.(\d+)$,relay=10.200.0.2,giaddr=10.200.0.110
interface=re:eth0.999,shared=0
interface=re:eth0,shared=0

vlan-mon=eth0.999,2000-2999
vlan-mon=eth0,300-312

 

[root@ipoetest etc]# tcpdump -e -nni eth0 port 67 or port 67
tcpdump: WARNING: eth0: no IPv4 address assigned
tcpdump: verbose output suppressed, use -v or -vv for full protocol decode
listening on eth0, link-type EN10MB (Ethernet), capture size 65535 bytes
13:28:48.888101 dc:0e:a1:f9:46:7d > ff:ff:ff:ff:ff:ff, ethertype 802.1Q (0x8100), length 350: vlan 310, p 0, ethertype IPv4, 0.0.0.0.68 > 255.255.255.255.67: BOOTP/DHCP, Request from dc:0e:a1:f9:46:7d, length 304
13:28:48.890880 00:15:17:9d:cd:d2 > ff:ff:ff:ff:ff:ff, ethertype 802.1Q (0x8100), length 352: vlan 310, p 0, ethertype IPv4, 10.16.40.1.67 > 255.255.255.255.68: BOOTP/DHCP, Reply, length 306
13:28:50.657665 00:1d:60:24:a1:24 > ff:ff:ff:ff:ff:ff, ethertype 802.1Q (0x8100), length 594: vlan 311, p 0, ethertype IPv4, 0.0.0.0.68 > 255.255.255.255.67: BOOTP/DHCP, Request from 00:1d:60:24:a1:24, length 548
13:28:52.519007 dc:0e:a1:f9:46:7d > ff:ff:ff:ff:ff:ff, ethertype 802.1Q (0x8100), length 346: vlan 310, p 0, ethertype IPv4, 10.16.42.88.68 > 255.255.255.255.67: BOOTP/DHCP, Request from dc:0e:a1:f9:46:7d, length 300
13:28:52.661174 00:1d:60:24:a1:24 > ff:ff:ff:ff:ff:ff, ethertype 802.1Q (0x8100), length 594: vlan 311, p 0, ethertype IPv4, 0.0.0.0.68 > 255.255.255.255.67: BOOTP/DHCP, Request from 00:1d:60:24:a1:24, length 548

 

[root@ipoetest etc]# tcpdump -e -nni eth0.999 port 67 or port 67
tcpdump: WARNING: eth0.999: no IPv4 address assigned
tcpdump: verbose output suppressed, use -v or -vv for full protocol decode
listening on eth0.999, link-type EN10MB (Ethernet), capture size 65535 bytes
13:07:33.210331 00:17:a4:14:d9:dd > ff:ff:ff:ff:ff:ff, ethertype 802.1Q (0x8100), length 353: vlan 2002, p 0, ethertype IPv4, 0.0.0.0.68 > 255.255.255.255.67: BOOTP/DHCP, Request from 00:17:a4:14:d9:dd, length 307
13:07:36.207790 00:17:a4:14:d9:dd > ff:ff:ff:ff:ff:ff, ethertype 802.1Q (0x8100), length 353: vlan 2002, p 0, ethertype IPv4, 0.0.0.0.68 > 255.255.255.255.67: BOOTP/DHCP, Request from 00:17:a4:14:d9:dd, length 307
13:07:40.465849 3c:97:0e:26:c5:ce > ff:ff:ff:ff:ff:ff, ethertype 802.1Q (0x8100), length 346: vlan 305, p 0, ethertype IPv4, 10.16.23.74.68 > 255.255.255.255.67: BOOTP/DHCP, Request from 3c:97:0e:26:c5:ce, length 300
13:07:44.207931 00:17:a4:14:d9:dd > ff:ff:ff:ff:ff:ff, ethertype 802.1Q (0x8100), length 353: vlan 2002, p 0, ethertype IPv4, 0.0.0.0.68 > 255.255.255.255.67: BOOTP/DHCP, Request from 00:17:a4:14:d9:dd, length 307

Вланы не создаются ни на qinq интерфейсе(eth0.999.xxxx), ни на базовом eth0 куда прилетает разный мусор с vid 300-312.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

to kayot

Что-то мне подсказывает, что у Вас не загружен ядерный модуль ipoe.

Насколько помню, у Вас shared=0, и модуль Вы не использовали раннее.

А для vlan monitor он нужен.

Вчера проверял - все отработало.

Сегодня xeb пофиксил еще удаление vlan.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

И еще в новой версии я вижу некое чудо в старте сессии. 3 попытки получить IP от клиента, заканчиваются странным тайм-аутом.

 

 

[2013-09-04 13:46:00]:  info: eth0.999.2002: recv [DHCPv4 Discover xid=b1fdac29 chaddr=00:17:a4:14:d9:dd <Message-Type Discover> <Option-116 01> <Client-ID 010017a414d9dd> <Ho
[2013-09-04 13:46:00]:  info: eth0.999.2002: 999.2002: authentication succeeded
[2013-09-04 13:46:00]:  info: eth0.999.2002: send [DHCPv4 relay Discover xid=b1fdac29 giaddr=10.200.0.110 chaddr=00:17:a4:14:d9:dd <Message-Type Discover> <Option-116 01> <Cli
[2013-09-04 13:46:00]:  info: eth0.999.2002: recv [DHCPv4 relay Offer xid=b1fdac29 yiaddr=194.12.94.2 giaddr=10.200.0.110 chaddr=00:17:a4:14:d9:dd <Message-Type Offer> <Server
[2013-09-04 13:46:00]:  info: eth0.999.2002: send [DHCPv4 Offer xid=b1fdac29 yiaddr=194.12.94.2 siaddr=194.12.64.1 chaddr=00:17:a4:14:d9:dd <Message-Type Offer> <Server-ID 194
[2013-09-04 13:46:03]:  info: eth0.999.2002: recv [DHCPv4 Discover xid=b1fdac29 chaddr=00:17:a4:14:d9:dd <Message-Type Discover> <Option-116 01> <Client-ID 010017a414d9dd> <Ho
[2013-09-04 13:46:03]:  info: eth0.999.2002: send [DHCPv4 relay Discover xid=b1fdac29 giaddr=10.200.0.110 chaddr=00:17:a4:14:d9:dd <Message-Type Discover> <Option-116 01> <Cli
[2013-09-04 13:46:03]:  info: eth0.999.2002: recv [DHCPv4 relay Offer xid=b1fdac29 yiaddr=194.12.94.2 giaddr=10.200.0.110 chaddr=00:17:a4:14:d9:dd <Message-Type Offer> <Server
[2013-09-04 13:46:03]:  info: eth0.999.2002: send [DHCPv4 Offer xid=b1fdac29 yiaddr=194.12.94.2 siaddr=194.12.64.1 chaddr=00:17:a4:14:d9:dd <Message-Type Offer> <Server-ID 194
[2013-09-04 13:46:06]:  info: eth0.999.2002: ipoe: session timed out
[2013-09-04 13:46:06]: debug: eth0.999.2002: terminate
[2013-09-04 13:46:06]:  info: eth0.999.2002: ipoe: session finished
[2013-09-04 13:46:06]:  info: eth0.999.2002: send [DHCPv4 relay Release xid=b1fdac29 ciaddr=194.12.94.2 giaddr=10.200.0.110 chaddr=00:17:a4:14:d9:dd <Message-Type Release> <Re

[2013-09-04 13:46:10]:  info: eth0.999.2002: recv [DHCPv4 Discover xid=b1fdac29 chaddr=00:17:a4:14:d9:dd <Message-Type Discover> <Option-116 01> <Client-ID 010017a414d9dd> <Ho
[2013-09-04 13:46:10]:  info: eth0.999.2002: 999.2002: authentication succeeded
[2013-09-04 13:46:10]:  info: eth0.999.2002: send [DHCPv4 relay Discover xid=b1fdac29 giaddr=10.200.0.110 chaddr=00:17:a4:14:d9:dd <Message-Type Discover> <Option-116 01> <Cli
[2013-09-04 13:46:10]:  info: eth0.999.2002: recv [DHCPv4 relay Offer xid=b1fdac29 yiaddr=194.12.94.2 giaddr=10.200.0.110 chaddr=00:17:a4:14:d9:dd <Message-Type Offer> <Server
[2013-09-04 13:46:10]:  info: eth0.999.2002: send [DHCPv4 Offer xid=b1fdac29 yiaddr=194.12.94.2 siaddr=194.12.64.1 chaddr=00:17:a4:14:d9:dd <Message-Type Offer> <Server-ID 194
[2013-09-04 13:46:13]:  info: eth0.999.2002: ipoe: session timed out
[2013-09-04 13:46:13]: debug: eth0.999.2002: terminate
[2013-09-04 13:46:13]:  info: eth0.999.2002: ipoe: session finished
[2013-09-04 13:46:13]:  info: eth0.999.2002: send [DHCPv4 relay Release xid=b1fdac29 ciaddr=194.12.94.2 giaddr=10.200.0.110 chaddr=00:17:a4:14:d9:dd <Message-Type Release> <Re

[2013-09-04 13:46:26]:  info: eth0.999.2002: recv [DHCPv4 Discover xid=b1fdac29 chaddr=00:17:a4:14:d9:dd <Message-Type Discover> <Option-116 01> <Client-ID 010017a414d9dd> <Ho
[2013-09-04 13:46:26]:  info: eth0.999.2002: 999.2002: authentication succeeded
[2013-09-04 13:46:26]:  info: eth0.999.2002: send [DHCPv4 relay Discover xid=b1fdac29 giaddr=10.200.0.110 chaddr=00:17:a4:14:d9:dd <Message-Type Discover> <Option-116 01> <Cli
[2013-09-04 13:46:26]:  info: eth0.999.2002: recv [DHCPv4 relay Offer xid=b1fdac29 yiaddr=194.12.94.2 giaddr=10.200.0.110 chaddr=00:17:a4:14:d9:dd <Message-Type Offer> <Server
[2013-09-04 13:46:26]:  info: eth0.999.2002: send [DHCPv4 Offer xid=b1fdac29 yiaddr=194.12.94.2 siaddr=194.12.64.1 chaddr=00:17:a4:14:d9:dd <Message-Type Offer> <Server-ID 194
[2013-09-04 13:46:29]:  info: eth0.999.2002: ipoe: session timed out
[2013-09-04 13:46:29]: debug: eth0.999.2002: terminate
[2013-09-04 13:46:29]:  info: eth0.999.2002: ipoe: session finished
[2013-09-04 13:46:29]:  info: eth0.999.2002: send [DHCPv4 relay Release xid=b1fdac29 ciaddr=194.12.94.2 giaddr=10.200.0.110 chaddr=00:17:a4:14:d9:dd <Message-Type Release> 

 

 

Ничего не меняя, дернул еще пару раз подключение и клиент взлетел.

 

 

[2013-09-04 13:49:26]:  info: : recv [DHCPv4 Discover xid=ac239d16 chaddr=00:17:a4:14:d9:dd <Message-Type Discover> <Option-116 01> <Client-ID 010017a414d9dd> <Request-IP 169.
[2013-09-04 13:49:26]:  info: eth0.999.2002: 999.2002: authentication succeeded
[2013-09-04 13:49:26]:  info: eth0.999.2002: send [DHCPv4 relay Discover xid=ac239d16 giaddr=10.200.0.110 chaddr=00:17:a4:14:d9:dd <Message-Type Discover> <Option-116 01> <Cli
[2013-09-04 13:49:26]:  info: eth0.999.2002: recv [DHCPv4 relay Offer xid=ac239d16 yiaddr=194.12.94.2 giaddr=10.200.0.110 chaddr=00:17:a4:14:d9:dd <Message-Type Offer> <Server
[2013-09-04 13:49:26]:  info: eth0.999.2002: send [DHCPv4 Offer xid=ac239d16 yiaddr=194.12.94.2 siaddr=194.12.64.1 chaddr=00:17:a4:14:d9:dd <Message-Type Offer> <Server-ID 194
[2013-09-04 13:49:26]:  info: eth0.999.2002: recv [DHCPv4 Request xid=ac239d16 chaddr=00:17:a4:14:d9:dd <Message-Type Request> <Client-ID 010017a414d9dd> <Request-IP 194.12.94
[2013-09-04 13:49:26]:  info: eth0.999.2002: send [DHCPv4 relay Request xid=ac239d16 giaddr=10.200.0.110 chaddr=00:17:a4:14:d9:dd <Message-Type Request> <Client-ID 010017a414d
[2013-09-04 13:49:26]:  info: eth0.999.2002: recv [DHCPv4 relay Ack xid=ac239d16 yiaddr=194.12.94.2 giaddr=10.200.0.110 chaddr=00:17:a4:14:d9:dd <Message-Type Ack> <Server-ID
[2013-09-04 13:49:26]:  info: eth0.999.2002: ipoe: session started
[2013-09-04 13:49:26]:  info: eth0.999.2002: send [DHCPv4 Ack xid=ac239d16 yiaddr=194.12.94.2 chaddr=00:17:a4:14:d9:dd <Message-Type Ack> <Server-ID 194.12.64.1> <Lease-Tim

 

 

xeb

В логах пусто. Для работы нужен собранный драйвер?

 

С ядром 3.10.10 ipoe_driver не собирается.

 

 

[ 98%] Generating driver/ipoe.ko
/usr/src/accel-ppp/build/drivers/ipoe/driver/ipoe.c: In function ‘ipoe_nl_cmd_add_vlan_mon’:
/usr/src/accel-ppp/build/drivers/ipoe/driver/ipoe.c:1634: error: ‘NETIF_F_HW_VLAN_FILTER’ undeclared (first use in this function)
/usr/src/accel-ppp/build/drivers/ipoe/driver/ipoe.c:1634: error: (Each undeclared identifier is reported only once
/usr/src/accel-ppp/build/drivers/ipoe/driver/ipoe.c:1634: error: for each function it appears in.)
/usr/src/accel-ppp/build/drivers/ipoe/driver/ipoe.c:1637: error: too few arguments to function ‘dev->netdev_ops->ndo_vlan_rx_add_vid’
/usr/src/accel-ppp/build/drivers/ipoe/driver/ipoe.c: In function ‘ipoe_nl_cmd_add_vlan_mon_vid’:
/usr/src/accel-ppp/build/drivers/ipoe/driver/ipoe.c:1678: error: ‘NETIF_F_HW_VLAN_FILTER’ undeclared (first use in this function)
/usr/src/accel-ppp/build/drivers/ipoe/driver/ipoe.c:1679: error: too few arguments to function ‘dev->netdev_ops->ndo_vlan_rx_add_vid’
make[4]: *** [/usr/src/accel-ppp/build/drivers/ipoe/driver/ipoe.o] Error 1
make[3]: *** [_module_/usr/src/accel-ppp/build/drivers/ipoe/driver] Error 2
make[2]: *** [drivers/ipoe/driver/ipoe.ko] Error 2
make[1]: *** [drivers/ipoe/CMakeFiles/ipoe_drv.dir/all] Error 2
make: *** [all] Error 2

 

 

Изменено пользователем kayot

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

И еще в новой версии я вижу некое чудо в старте сессии. 3 попытки получить IP от клиента, заканчиваются странным тайм-аутом.
этот таймаут был всегда, может быть не проявлялся, это таймаут между отправкой OFFER клиенту и получением REQUEST, по умолчанию 3 сек

 

С ядром 3.10.10 ipoe_driver не собирается.
ясно, щас гляну

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Собирается на свежем ядре, автосоздание и удаление вланов работает.

 

И еще в новой версии я вижу некое чудо в старте сессии. 3 попытки получить IP от клиента, заканчиваются странным тайм-аутом.
этот таймаут был всегда, может быть не проявлялся, это таймаут между отправкой OFFER клиенту и получением REQUEST, по умолчанию 3 сек

Тут все ок, тестовая машина с Windows XP имеет какое-то извращенное понятие о dhcp и стандартах. Нормально получает IP только после полного отключения/включения сетевки или ребута :)

Изменено пользователем kayot

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Все-таки кое-что в инициализации сессии изменилось в новых версиях. Вопрос в том, какой способ старта правильный?

 

Раньше старт сессии происходил при выдаче IP абоненту любым образом, включая обычный request/ack при обновлении выданной лизы.

Т.е. я мог сделать terminate сессии и через какое-то время(максимум - половина лизы) клиент обновляя себе лизу стартовал сессию. Или старт сессии мог инициализировать я, дернув абонентский порт.

Сейчас на риквесты без установленной сессии relay не отвечает, единственный способ запустить сессию - сделать полный цикл с discover/offer/request/ack.

Убив сессию(или просто перезапустив accel) я не могу заставить клиента стартовать сессию - даже после опускания/поднятия порта windows продолжает слать request на последний выданный IP, причем даже после окончания лизы какое-то время идут броадкастовые запросы от 0.0.0.0 все с тем же реквестом. Иногда на этом все и заканчивается, винда говорит 'нельзя получить IP' и прекращает попытки. Отключая/включая порт опять получаем реквесты от 0.0.0.0 и все, нужно передергивание интерфейса или ребут клиента.

 

Вот лог подобной ситуации(terminate сессии), IP в итоге был выдан, но сам vlan был создан и удален 12 раз :)

Вероятно стоит увеличить таймаут создания влана с 10 секунд до ~10 минут для избегания подобных флапов.

 

Или вот лог старта win7 после смены клиенту влана(перевод на ipoe) и дерганья интерфейса. Интерфейс пересоздан 8 раз.

Изменено пользователем kayot

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

да, действительно изменилось, с вводом offer-delay accel-ppp перестал чувствовать себя единственным сервером и отвечать на любые запросы

kayot, там в логах обрезалось, реквесты идут без явного Server-ID ?

 

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

xeb

Да, запросы на продление идут без Server-ID, но обращение идет к конкретному серверу

[2013-09-05 07:08:19]:  info: bond1.2008.1101: recv [DHCPv4 Request xid=bcbb9d7f ciaddr=194.12.68.57 chaddr=f8:1a:67:4b:38:d5 <Message-Type Request> <Max-Message-Size 1024> <Client-ID 01f81a674b38d5> <Ho
st-Name TL-WR740N> <Vendor-Class 4d53465420352e30> <Request-List Subnet,Router,DNS,Domain-Name,Route,Vendor-Specific,44,46,47,Classless-Route,249>]
[2013-09-05 07:08:19]:  info: bond1.2008.1101: send [DHCPv4 relay Request xid=bcbb9d7f ciaddr=194.12.68.57 giaddr=10.200.0.100 chaddr=f8:1a:67:4b:38:d5 <Message-Type Request> <Max-Message-Size 1024> <Cli
ent-ID 01f81a674b38d5> <Host-Name TL-WR740N> <Vendor-Class 4d53465420352e30> <Request-List Subnet,Router,DNS,Domain-Name,Route,Vendor-Specific,44,46,47,Classless-Route,249> <Relay-Agent {Agent-Circuit-ID
bond1.2008.1101} {Agent-Remote-ID accel-pppd}>]
[2013-09-05 07:08:19]:  info: bond1.2008.1101: recv [DHCPv4 relay Ack xid=bcbb9d7f ciaddr=194.12.68.57 yiaddr=194.12.68.57 giaddr=10.200.0.100 chaddr=f8:1a:67:4b:38:d5 <Message-Type Ack> <Server-ID 10.20
1.0.1> <Lease-Time 300> <Subnet 255.255.224.0> <Router 194.12.64.1> <DNS 91.203.164.27> <Vendor-Specific 020400000001010400000002ff> <Vendor-Class 4d53465420352e30> <Option-46 08> <Relay-Agent {Agent-Cir
cuit-ID bond1.2008.1101} {Agent-Remote-ID accel-pppd}>]
[2013-09-05 07:08:19]:  info: bond1.2008.1101: send [DHCPv4 Ack xid=bcbb9d7f ciaddr=194.12.68.57 yiaddr=194.12.68.57 chaddr=f8:1a:67:4b:38:d5 <Message-Type Ack> <Server-ID 194.12.64.1> <Lease-Time 300> <
Router 194.12.64.1> <Subnet 255.255.224.0> <DNS 91.203.164.27> <Vendor-Specific 020400000001010400000002ff> <Vendor-Class 4d53465420352e30> <Option-46 08> <Relay-Agent {Agent-Circuit-ID bond1.2008.1101}
{Agent-Remote-ID accel-pppd}>]

Как раз поймал, один запрос бродкастом, второй нет.

[root@ipoe1 /]# tcpdump -nni bond1.2000 -p -vv port 67
tcpdump: WARNING: bond1.2000: no IPv4 address assigned
tcpdump: listening on bond1.2000, link-type EN10MB (Ethernet), capture size 65535 bytes
07:24:43.427987 IP (tos 0x0, ttl 64, id 38733, offset 0, flags [DF], proto UDP (17), length 576)
   194.12.74.148.68 > 194.12.64.1.67: [udp sum ok] BOOTP/DHCP, Request from c8:60:00:98:f8:91, length 548, xid 0x2a336c18, Flags [broadcast] (0x8000)
         Client-IP 194.12.74.148
         Client-Ethernet-Address c8:60:00:98:f8:91
         Vendor-rfc1048 Extensions
           Magic Cookie 0x63825363
           DHCP-Message Option 53, length 1: Request
           MSZ Option 57, length 2: 1024
           Client-ID Option 61, length 7: ether c8:60:00:98:f8:91
           Hostname Option 12, length 9: "TL-WR740N"
           Vendor-Class Option 60, length 8: "MSFT 5.0"
           Parameter-Request Option 55, length 11:
             Subnet-Mask, Default-Gateway, Domain-Name-Server, Domain-Name
             Static-Route, Vendor-Option, Netbios-Name-Server, Netbios-Node
             Netbios-Scope, Classless-Static-Route, Classless-Static-Route-Microsoft
07:24:50.963159 IP (tos 0x0, ttl 64, id 33365, offset 0, flags [DF], proto UDP (17), length 306)
   91.203.165.2.68 > 91.203.164.27.67: [udp sum ok] BOOTP/DHCP, Request from 00:1a:4d:50:fb:35, length 278, xid 0x7b1a9776, Flags [none] (0x0000)
         Client-IP 91.203.165.2
         Client-Ethernet-Address 00:1a:4d:50:fb:35
         Vendor-rfc1048 Extensions
           Magic Cookie 0x63825363
           DHCP-Message Option 53, length 1: Request
           Client-ID Option 61, length 7: ether 00:1a:4d:50:fb:35
           Parameter-Request Option 55, length 9:
             Subnet-Mask, Default-Gateway, Domain-Name-Server, Hostname
             Domain-Name, BR, Static-Route, NTP
             Classless-Static-Route-Microsoft
           Vendor-Class Option 60, length 12: "udhcp 1.17.4"

 

2. При завершении работы accel с ipoe-модулем падает в 100% случаев, поймал корку с abrtd. Похоже заметить это можно только в свежих версиях centos.

[root@ipoe1 etc]# ps ax | grep accel
9014 ?        Ssl    0:05 /usr/local/sbin/accel-pppd -c /etc/accel-ppp_pppoe.conf -d --dump /tmp
24837 ?        Ssl   18:01 /usr/local/sbin/accel-pppd -c /etc/accel-ppp.conf -d --dump /tmp --internal

[root@ipoe1 etc]# accel-cmd shutdown

[root@ipoe1 etc]# ps ax | grep accel
9014 ?        Ssl    0:05 /usr/local/sbin/accel-pppd -c /etc/accel-ppp_pppoe.conf -d --dump /tmp
24837 ?        Zsl   18:01 [accel-pppd] <defunct>
26880 pts/3    S+     0:00 grep accel

[root@ipoe1 etc]# ps ax | grep accel
9014 ?        Ssl    0:06 /usr/local/sbin/accel-pppd -c /etc/accel-ppp_pppoe.conf -d --dump /tmp
27032 pts/3    S+     0:00 grep accel

 

[root@ipoe1 ccpp-2013-09-05-07:12:12-27087]# gdb /usr/local/sbin/accel-pppd coredump
(gdb) backtrace
#0  0x0000003fe1c328a5 in raise () from /lib64/libc.so.6
#1  0x0000003fe1c34085 in abort () from /lib64/libc.so.6
#2  0x00007f3ea086c768 in triton_context_unregister (ud=0x770c10) at /usr/src/accel-ppp/accel-pppd/triton/triton.c:353
#3  0x00007f3ea0421ad1 in ipoe_serv_close (ctx=0x770c10) at /usr/src/accel-ppp/accel-pppd/ctrl/ipoe/ipoe.c:1696
#4  0x00007f3ea086c24f in ctx_thread (ctx=0x770d68) at /usr/src/accel-ppp/accel-pppd/triton/triton.c:236
#5  0x00007f3ea086bebe in triton_thread (thread=0x7f3e2c000ad0) at /usr/src/accel-ppp/accel-pppd/triton/triton.c:159
#6  0x0000003f8ae07851 in start_thread () from /lib64/libpthread.so.0
#7  0x0000003fe1ce811d in clone () from /lib64/libc.so.6
(gdb)

 

3. Reload полностью починен, дергал раз 10 с сотней активных сессий - все ок.

Изменено пользователем kayot

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

xeb

Похоже то что нужно, после получения nak клиент сразу шлет discover без длительных отмираний лиз и других чудес разных реализаций dhcp-клиентов.

 

 

[2013-09-05 10:04:15]:  info: ipoe: create vlan eth0.999.2006
[2013-09-05 10:04:15]:  info: ipoe: start interface eth0.999.2006 (relay=10.200.0.2,giaddr=10.200.0.110)
[2013-09-05 10:04:19]: debug: recv [DHCPv4 Request xid=8daae9b1 chaddr=00:16:35:0c:02:97 <Message-Type Request> <Client-ID 010016350c0297> <Request-IP 10.110.1.3> <Host-Name zeus-24> <Vendor-Class 4d53
[2013-09-05 10:04:19]:  info: send [DHCPv4 Nak xid=8daae9b1 chaddr=00:16:35:0c:02:97 <Message-Type Nak>]
[2013-09-05 10:04:20]:  info: eth0.999.2006: recv [DHCPv4 Discover xid=4cd85783 chaddr=00:16:35:0c:02:97 <Message-Type Discover> <Option-116 01> <Client-ID 010016350c0297> <Host-Name zeus-24> <Vendor-C
[2013-09-05 10:04:20]:  info: eth0.999.2006: 999.2006: authentication succeeded
[2013-09-05 10:04:20]:  info: eth0.999.2006: send [DHCPv4 relay Discover xid=4cd85783 giaddr=10.200.0.110 chaddr=00:16:35:0c:02:97 <Message-Type Discover> <Option-116 01> <Client-ID 010016350c0297> <Ho
[2013-09-05 10:04:20]:  info: eth0.999.2006: recv [DHCPv4 relay Offer xid=4cd85783 yiaddr=194.12.94.6 giaddr=10.200.0.110 chaddr=00:16:35:0c:02:97 <Message-Type Offer> <Server-ID 10.201.0.1> <Lease-Tim
[2013-09-05 10:04:20]:  info: eth0.999.2006: send [DHCPv4 Offer xid=4cd85783 yiaddr=194.12.94.6 siaddr=194.12.64.1 chaddr=00:16:35:0c:02:97 <Message-Type Offer> <Server-ID 194.12.64.1> <Lease-Time 300>
[2013-09-05 10:04:20]:  info: eth0.999.2006: recv [DHCPv4 Request xid=4cd85783 chaddr=00:16:35:0c:02:97 <Message-Type Request> <Client-ID 010016350c0297> <Request-IP 194.12.94.6> <Server-ID 194.12.64.1
[2013-09-05 10:04:20]:  info: eth0.999.2006: send [DHCPv4 relay Request xid=4cd85783 giaddr=10.200.0.110 chaddr=00:16:35:0c:02:97 <Message-Type Request> <Client-ID 010016350c0297> <Request-IP 194.12.94
[2013-09-05 10:04:20]:  info: eth0.999.2006: recv [DHCPv4 relay Ack xid=4cd85783 yiaddr=194.12.94.6 giaddr=10.200.0.110 chaddr=00:16:35:0c:02:97 <Message-Type Ack> <Server-ID 10.201.0.1> <Lease-Time 30
[2013-09-05 10:04:20]:  info: eth0.999.2006: ipoe: session started

 

 

Тут как раз клиенту был выдан левый IP(10.110.1.3), и вероятно с бесконечной лизой. Все срослось.

Изменено пользователем kayot

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

UPDATE: после нескольких релоадов все-таки что-то с релеем случилось. Сервер не упал, но перестал принимать новые подключения.

Полный лог в момент начала чудес был выключен(слишком много идет мусора, 100м за сутки набирается легко)

 

 

[2013-09-05 07:16:58]:  info: bond1.2001.1128: 2001.1128: authentication succeeded
[2013-09-05 07:16:58]:  info: bond1.2001.1128: ipoe: session started
[2013-09-05 07:16:59]:  info: bond1.2009.1121: 2009.1121: authentication succeeded
[2013-09-05 07:16:59]:  info: bond1.2009.1121: ipoe: session started
[2013-09-05 07:17:00]:  info: bond1.2009.1146: 2009.1146: authentication succeeded
[2013-09-05 07:17:00]:  info: bond1.2009.1146: ipoe: session started
[2013-09-05 07:17:02]:  info: bond1.2000.1245: 2000.1245: authentication succeeded
[2013-09-05 07:17:02]:  info: bond1.2000.1245: ipoe: session started
[2013-09-05 07:17:05]:  info: bond1.2009.1136: 2009.1136: authentication succeeded
[2013-09-05 07:17:06]:  info: bond1.2000.1230: 2000.1230: authentication succeeded
[2013-09-05 07:17:08]:  info: bond1.2009.1136: ipoe: session finished
[2013-09-05 07:17:08]:  info: bond1.2000.1230: ipoe: session started
[2013-09-05 07:17:15]:  info: bond1.2009.1136: 2009.1136: authentication succeeded
[2013-09-05 07:17:15]:  info: bond1.2009.1136: ipoe: session started
[2013-09-05 07:17:31]:  info: bond1.2000.1110: 2000.1110: authentication succeeded
[2013-09-05 07:17:31]:  info: bond1.2000.1110: ipoe: session started
[2013-09-05 07:17:40]:  info: bond1.2001.1136: 2001.1136: authentication succeeded
[2013-09-05 07:17:40]:  info: bond1.2001.1136: ipoe: session started
[2013-09-05 07:17:45]:  info: bond1.2000.1233: 2000.1233: authentication succeeded
[2013-09-05 07:17:45]:  info: bond1.2000.1233: ipoe: session started
[2013-09-05 07:22:49]:  info: bond1.2008.1103: 2008.1103: authentication succeeded
[2013-09-05 07:22:49]:  info: bond1.2008.1103: ipoe: session started
------
[2013-09-05 07:23:52]:  info: bond1.2009.1138: 2009.1138: authentication succeeded
[2013-09-05 07:23:55]:  info: bond1.2009.1138: ipoe: session finished
[2013-09-05 07:24:13]:  info: bond1.2009.1122: ipoe: session finished
[2013-09-05 07:24:16]:  info: bond1.2009.1122: 2009.1122: authentication succeeded
[2013-09-05 07:24:18]:  info: bond1.2009.1122: ipoe: session started
[2013-09-05 07:27:00]:  info: bond1.2008.1219: 2008.1219: authentication succeeded
[2013-09-05 07:27:03]:  info: bond1.2008.1219: ipoe: session finished
[2013-09-05 07:28:02]:  info: bond1.2008.1219: 2008.1219: authentication succeeded
[2013-09-05 07:28:05]:  info: bond1.2008.1219: ipoe: session finished

 

 

Включил полный перед рестартом, километровый лог безуспешных попыток получить IP, так для нескольких клиентов

 

 

[2013-09-05 10:13:59]:  info: bond1.2000.1110: recv [DHCPv4 Discover xid=1705fa0e chaddr=00:24:8c:e4:05:17 <Message-Type Discover> <Request-IP 194.12.69.148> <Client-ID 0100248ce40517> <Host-Name RX3041> <Re
[2013-09-05 10:13:59]:  info: bond1.2000.1110: send [DHCPv4 relay Discover xid=1705fa0e giaddr=10.200.0.100 chaddr=00:24:8c:e4:05:17 <Message-Type Discover> <Request-IP 194.12.69.148> <Client-ID 0100248ce405
[2013-09-05 10:13:59]:  info: bond1.2000.1110: recv [DHCPv4 relay Offer xid=1705fa0e yiaddr=194.12.69.148 giaddr=10.200.0.100 chaddr=00:24:8c:e4:05:17 <Message-Type Offer> <Server-ID 10.201.0.1> <Lease-Time
[2013-09-05 10:13:59]:  info: bond1.2000.1110: send [DHCPv4 Offer xid=1705fa0e yiaddr=194.12.69.148 siaddr=194.12.64.1 chaddr=00:24:8c:e4:05:17 <Message-Type Offer> <Server-ID 194.12.64.1> <Lease-Time 300> <
[2013-09-05 10:13:59]:  info: bond1.2000.1110: recv [DHCPv4 relay Offer xid=1705fa0e yiaddr=194.12.69.148 giaddr=10.200.0.100 chaddr=00:24:8c:e4:05:17 <Message-Type Offer> <Server-ID 10.201.0.1> <Lease-Time
[2013-09-05 10:13:59]:  info: bond1.2000.1110: send [DHCPv4 Offer xid=1705fa0e yiaddr=194.12.69.148 siaddr=194.12.64.1 chaddr=00:24:8c:e4:05:17 <Message-Type Offer> <Server-ID 194.12.64.1> <Lease-Time 300> <
[2013-09-05 10:13:59]:  info: bond1.2000.1110: recv [DHCPv4 relay Offer xid=1705fa0e yiaddr=194.12.69.148 giaddr=10.200.0.100 chaddr=00:24:8c:e4:05:17 <Message-Type Offer> <Server-ID 10.201.0.1> <Lease-Time
[2013-09-05 10:13:59]:  info: bond1.2000.1110: send [DHCPv4 Offer xid=1705fa0e yiaddr=194.12.69.148 siaddr=194.12.64.1 chaddr=00:24:8c:e4:05:17 <Message-Type Offer> <Server-ID 194.12.64.1> <Lease-Time 300> <
[2013-09-05 10:13:59]:  info: bond1.2000.1110: recv [DHCPv4 relay Offer xid=1705fa0e yiaddr=194.12.69.148 giaddr=10.200.0.100 chaddr=00:24:8c:e4:05:17 <Message-Type Offer> <Server-ID 10.201.0.1> <Lease-Time
[2013-09-05 10:13:59]:  info: bond1.2000.1110: send [DHCPv4 Offer xid=1705fa0e yiaddr=194.12.69.148 siaddr=194.12.64.1 chaddr=00:24:8c:e4:05:17 <Message-Type Offer> <Server-ID 194.12.64.1> <Lease-Time 300> <
[2013-09-05 10:13:59]:  info: bond1.2000.1110: recv [DHCPv4 relay Offer xid=1705fa0e yiaddr=194.12.69.148 giaddr=10.200.0.100 chaddr=00:24:8c:e4:05:17 <Message-Type Offer> <Server-ID 10.201.0.1> <Lease-Time
[2013-09-05 10:13:59]:  info: bond1.2000.1110: send [DHCPv4 Offer xid=1705fa0e yiaddr=194.12.69.148 siaddr=194.12.64.1 chaddr=00:24:8c:e4:05:17 <Message-Type Offer> <Server-ID 194.12.64.1> <Lease-Time 300> <
[2013-09-05 10:13:59]:  info: bond1.2000.1110: recv [DHCPv4 relay Offer xid=1705fa0e yiaddr=194.12.69.148 giaddr=10.200.0.100 chaddr=00:24:8c:e4:05:17 <Message-Type Offer> <Server-ID 10.201.0.1> <Lease-Time
[2013-09-05 10:13:59]:  info: bond1.2000.1110: send [DHCPv4 Offer xid=1705fa0e yiaddr=194.12.69.148 siaddr=194.12.64.1 chaddr=00:24:8c:e4:05:17 <Message-Type Offer> <Server-ID 194.12.64.1> <Lease-Time 300> <
[2013-09-05 10:13:59]:  info: bond1.2000.1110: recv [DHCPv4 Request xid=1705fa0e chaddr=00:24:8c:e4:05:17 <Message-Type Request> <Request-IP 194.12.69.148> <Server-ID 194.12.64.1> <Client-ID 0100248ce40517>
[2013-09-05 10:13:59]:  info: bond1.2000.1110: send [DHCPv4 relay Request xid=1705fa0e giaddr=10.200.0.100 chaddr=00:24:8c:e4:05:17 <Message-Type Request> <Request-IP 194.12.69.148> <Server-ID 10.201.0.1> <C
[2013-09-05 10:13:59]:  info: bond1.2000.1110: recv [DHCPv4 relay Ack xid=1705fa0e yiaddr=194.12.69.148 giaddr=10.200.0.100 chaddr=00:24:8c:e4:05:17 <Message-Type Ack> <Server-ID 10.201.0.1> <Lease-Time 300>
[2013-09-05 10:13:59]:  info: bond1.2000.1110: send [DHCPv4 Ack xid=1705fa0e yiaddr=194.12.69.148 chaddr=00:24:8c:e4:05:17 <Message-Type Ack> <Server-ID 194.12.64.1> <Lease-Time 300> <Router 194.12.64.1> <Su
[2013-09-05 10:13:59]:  info: bond1.2000.1110: recv [DHCPv4 Discover xid=1705fb0e chaddr=00:24:8c:e4:05:17 <Message-Type Discover> <Request-IP 194.12.69.148> <Client-ID 0100248ce40517> <Host-Name RX3041> <Re
[2013-09-05 10:13:59]:  info: bond1.2000.1110: send [DHCPv4 relay Discover xid=1705fb0e giaddr=10.200.0.100 chaddr=00:24:8c:e4:05:17 <Message-Type Discover> <Request-IP 194.12.69.148> <Client-ID 0100248ce405
[2013-09-05 10:13:59]:  info: bond1.2000.1110: recv [DHCPv4 relay Offer xid=1705fb0e yiaddr=194.12.69.148 giaddr=10.200.0.100 chaddr=00:24:8c:e4:05:17 <Message-Type Offer> <Server-ID 10.201.0.1> <Lease-Time
[2013-09-05 10:13:59]:  info: bond1.2000.1110: send [DHCPv4 Offer xid=1705fb0e yiaddr=194.12.69.148 siaddr=194.12.64.1 chaddr=00:24:8c:e4:05:17 <Message-Type Offer> <Server-ID 194.12.64.1> <Lease-Time 300> <
[2013-09-05 10:13:59]:  info: bond1.2000.1110: recv [DHCPv4 relay Offer xid=1705fb0e yiaddr=194.12.69.148 giaddr=10.200.0.100 chaddr=00:24:8c:e4:05:17 <Message-Type Offer> <Server-ID 10.201.0.1> <Lease-Time
[2013-09-05 10:13:59]:  info: bond1.2000.1110: send [DHCPv4 Offer xid=1705fb0e yiaddr=194.12.69.148 siaddr=194.12.64.1 chaddr=00:24:8c:e4:05:17 <Message-Type Offer> <Server-ID 194.12.64.1> <Lease-Time 300> <
[2013-09-05 10:13:59]:  info: bond1.2000.1110: recv [DHCPv4 relay Offer xid=1705fb0e yiaddr=194.12.69.148 giaddr=10.200.0.100 chaddr=00:24:8c:e4:05:17 <Message-Type Offer> <Server-ID 10.201.0.1> <Lease-Time
[2013-09-05 10:13:59]:  info: bond1.2000.1110: send [DHCPv4 Offer xid=1705fb0e yiaddr=194.12.69.148 siaddr=194.12.64.1 chaddr=00:24:8c:e4:05:17 <Message-Type Offer> <Server-ID 194.12.64.1> <Lease-Time 300> <
[2013-09-05 10:13:59]:  info: bond1.2000.1110: recv [DHCPv4 relay Offer xid=1705fb0e yiaddr=194.12.69.148 giaddr=10.200.0.100 chaddr=00:24:8c:e4:05:17 <Message-Type Offer> <Server-ID 10.201.0.1> <Lease-Time
[2013-09-05 10:13:59]:  info: bond1.2000.1110: send [DHCPv4 Offer xid=1705fb0e yiaddr=194.12.69.148 siaddr=194.12.64.1 chaddr=00:24:8c:e4:05:17 <Message-Type Offer> <Server-ID 194.12.64.1> <Lease-Time 300> <
[2013-09-05 10:13:59]:  info: bond1.2000.1110: recv [DHCPv4 Request xid=1705fb0e chaddr=00:24:8c:e4:05:17 <Message-Type Request> <Request-IP 194.12.69.148> <Server-ID 194.12.64.1> <Client-ID 0100248ce40517>
[2013-09-05 10:13:59]:  info: bond1.2000.1110: send [DHCPv4 relay Request xid=1705fb0e giaddr=10.200.0.100 chaddr=00:24:8c:e4:05:17 <Message-Type Request> <Request-IP 194.12.69.148> <Server-ID 10.201.0.1> <C
[2013-09-05 10:13:59]:  info: bond1.2000.1110: recv [DHCPv4 relay Offer xid=1705fb0e yiaddr=194.12.69.148 giaddr=10.200.0.100 chaddr=00:24:8c:e4:05:17 <Message-Type Offer> <Server-ID 10.201.0.1> <Lease-Time
[2013-09-05 10:13:59]:  info: bond1.2000.1110: send [DHCPv4 Offer xid=1705fb0e yiaddr=194.12.69.148 siaddr=194.12.64.1 chaddr=00:24:8c:e4:05:17 <Message-Type Offer> <Server-ID 194.12.64.1> <Lease-Time 300> <
[2013-09-05 10:13:59]:  info: bond1.2000.1110: recv [DHCPv4 relay Offer xid=1705fb0e yiaddr=194.12.69.148 giaddr=10.200.0.100 chaddr=00:24:8c:e4:05:17 <Message-Type Offer> <Server-ID 10.201.0.1> <Lease-Time
[2013-09-05 10:13:59]:  info: bond1.2000.1110: send [DHCPv4 Offer xid=1705fb0e yiaddr=194.12.69.148 siaddr=194.12.64.1 chaddr=00:24:8c:e4:05:17 <Message-Type Offer> <Server-ID 194.12.64.1> <Lease-Time 300> <
[2013-09-05 10:13:59]:  info: bond1.2000.1110: recv [DHCPv4 relay Ack xid=1705fb0e yiaddr=194.12.69.148 giaddr=10.200.0.100 chaddr=00:24:8c:e4:05:17 <Message-Type Ack> <Server-ID 10.201.0.1> <Lease-Time 300>
[2013-09-05 10:13:59]:  info: bond1.2000.1110: send [DHCPv4 Ack xid=1705fb0e yiaddr=194.12.69.148 chaddr=00:24:8c:e4:05:17 <Message-Type Ack> <Server-ID 194.12.64.1> <Lease-Time 300> <Router 194.12.64.1> <Su

 

 

Дамп проблемного клиента, странные пачки ответов.

 

 

[root@ipoe1 accel-ppp]# tcpdump -nni bond1.2000.1110 -p port 67 or port 68
tcpdump: WARNING: bond1.2000.1110: no IPv4 address assigned
tcpdump: verbose output suppressed, use -v or -vv for full protocol decode
listening on bond1.2000.1110, link-type EN10MB (Ethernet), capture size 65535 bytes
10:17:02.738489 IP 0.0.0.0.68 > 255.255.255.255.67: BOOTP/DHCP, Request from 00:24:8c:e4:05:17, length 548
10:17:02.744225 IP 194.12.64.1.67 > 194.12.69.148.68: BOOTP/DHCP, Reply, length 330
10:17:02.746029 IP 194.12.64.1.67 > 194.12.69.148.68: BOOTP/DHCP, Reply, length 330
10:17:02.747614 IP 194.12.64.1.67 > 194.12.69.148.68: BOOTP/DHCP, Reply, length 330
10:17:02.749495 IP 194.12.64.1.67 > 194.12.69.148.68: BOOTP/DHCP, Reply, length 330
10:17:02.751373 IP 194.12.64.1.67 > 194.12.69.148.68: BOOTP/DHCP, Reply, length 330
10:17:02.751746 IP 0.0.0.0.68 > 255.255.255.255.67: BOOTP/DHCP, Request from 00:24:8c:e4:05:17, length 548
10:17:02.753175 IP 194.12.64.1.67 > 194.12.69.148.68: BOOTP/DHCP, Reply, length 330
10:17:02.756049 IP 194.12.64.1.67 > 194.12.69.148.68: BOOTP/DHCP, Reply, length 330
10:17:02.758562 IP 194.12.64.1.67 > 194.12.69.148.68: BOOTP/DHCP, Reply, length 330
10:17:02.759837 IP 0.0.0.0.68 > 255.255.255.255.67: BOOTP/DHCP, Request from 00:24:8c:e4:05:17, length 548
10:17:02.766792 IP 194.12.64.1.67 > 194.12.69.148.68: BOOTP/DHCP, Reply, length 330
10:17:02.769445 IP 194.12.64.1.67 > 194.12.69.148.68: BOOTP/DHCP, Reply, length 330
10:17:02.770860 IP 194.12.64.1.67 > 194.12.69.148.68: BOOTP/DHCP, Reply, length 330
10:17:02.772547 IP 194.12.64.1.67 > 194.12.69.148.68: BOOTP/DHCP, Reply, length 330
10:17:02.774404 IP 0.0.0.0.68 > 255.255.255.255.67: BOOTP/DHCP, Request from 00:24:8c:e4:05:17, length 548
10:17:02.774704 IP 194.12.64.1.67 > 194.12.69.148.68: BOOTP/DHCP, Reply, length 330
10:17:02.776499 IP 194.12.64.1.67 > 194.12.69.148.68: BOOTP/DHCP, Reply, length 330
10:17:02.778598 IP 194.12.64.1.67 > 194.12.69.148.68: BOOTP/DHCP, Reply, length 330
10:17:02.780526 IP 194.12.64.1.67 > 194.12.69.148.68: BOOTP/DHCP, Reply, length 330
10:17:02.782452 IP 0.0.0.0.68 > 255.255.255.255.67: BOOTP/DHCP, Request from 00:24:8c:e4:05:17, length 548
10:17:02.788617 IP 194.12.64.1.67 > 194.12.69.148.68: BOOTP/DHCP, Reply, length 330
10:17:02.790972 IP 194.12.64.1.67 > 194.12.69.148.68: BOOTP/DHCP, Reply, length 330
10:17:02.792943 IP 194.12.64.1.67 > 194.12.69.148.68: BOOTP/DHCP, Reply, length 330
10:17:02.794400 IP 194.12.64.1.67 > 194.12.69.148.68: BOOTP/DHCP, Reply, length 330
10:17:02.796004 IP 194.12.64.1.67 > 194.12.69.148.68: BOOTP/DHCP, Reply, length 330
10:17:02.796461 IP 0.0.0.0.68 > 255.255.255.255.67: BOOTP/DHCP, Request from 00:24:8c:e4:05:17, length 548
10:17:02.798371 IP 194.12.64.1.67 > 194.12.69.148.68: BOOTP/DHCP, Reply, length 330
10:17:02.800656 IP 194.12.64.1.67 > 194.12.69.148.68: BOOTP/DHCP, Reply, length 330
10:17:02.803033 IP 194.12.64.1.67 > 194.12.69.148.68: BOOTP/DHCP, Reply, length 330
10:17:02.804481 IP 0.0.0.0.68 > 255.255.255.255.67: BOOTP/DHCP, Request from 00:24:8c:e4:05:17, length 548
10:17:02.804716 IP 194.12.64.1.67 > 194.12.69.148.68: BOOTP/DHCP, Reply, length 330
10:17:02.811599 IP 194.12.64.1.67 > 194.12.69.148.68: BOOTP/DHCP, Reply, length 330
10:17:02.812976 IP 194.12.64.1.67 > 194.12.69.148.68: BOOTP/DHCP, Reply, length 330
10:17:02.815120 IP 194.12.64.1.67 > 194.12.69.148.68: BOOTP/DHCP, Reply, length 330
10:17:02.816604 IP 194.12.64.1.67 > 194.12.69.148.68: BOOTP/DHCP, Reply, length 330
10:17:02.818155 IP 194.12.64.1.67 > 194.12.69.148.68: BOOTP/DHCP, Reply, length 330

 

 

Этот же клиент мгновенно авторизировался после рестарта сервиса.

Изменено пользователем kayot

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

глянь tcpdump'ом интерфейс к вышестроящему дхцп, либо он шлёт пакеты без запросов, либо accel-ppp где-то циклится

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

В обычном режиме никаких лишних запросов и пакетов нет. Такая ситуация возникла именно после нескольких тестовых reload'ов и последующих проблем у релея.

Да и dhcp там самописный на perl, он вылизан и разве что помереть может и совсем не отвечать.

Изменено пользователем kayot

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

На тестовом сервер собрал, запустил. Раз 50 делал reload - все ок.

Но тут ведь какое дело, то что легко вылазит на боевом сервере с 200 реальными юзерами и трафиком, фиг когда повторишь на тесте с 1-2 сессиями..

 

UPD:

Дернул еще несколько десятков раз (accel-cmd reload) и получил краш с автоперезапуском. При 1 клиентской сессии активной.

Сессия так и висит, но сервер глючит

[root@ipoetest tmp]# accel-cmd show sessions
   ifname     | username |    calling-sid    |     ip      | type | comp | state  |  uptime
---------------+----------+-------------------+-------------+------+------+--------+----------
eth0.999.2003 | 999.2003 | 50:46:5d:4e:b5:72 | 194.12.94.3 | ipoe |      | active | 00:10:46

 

Корка

(gdb) backtrace
#0  0x00007f0ca35eb8e5 in raise () from /lib64/libc.so.6
#1  0x00007f0ca35ed0c5 in abort () from /lib64/libc.so.6
#2  0x0000000000422adf in sigsegv (num=11) at /usr/src/accel-ppp/accel-pppd/main.c:236
#3  <signal handler called>
#4  0x00007f0ca437c220 in pthread_mutex_lock () from /lib64/libpthread.so.0
#5  0x00007f0ca479cc19 in triton_context_call (ud=0x7f0c9c001940, func=0x7f0ca1dedecc <ipoe_recv_dhcpv4_relay>, arg=0x7f0c9c007228)
   at /usr/src/accel-ppp/accel-pppd/triton/triton.c:477
#6  0x00007f0ca1df33c9 in dhcpv4_relay_read (h=0xb0dba0) at /usr/src/accel-ppp/accel-pppd/ctrl/ipoe/dhcpv4.c:540
#7  0x00007f0ca479c0ef in ctx_thread (ctx=0xb0dbf8) at /usr/src/accel-ppp/accel-pppd/triton/triton.c:210
#8  0x00007f0ca479bebe in triton_thread (thread=0x7f0c9c012080) at /usr/src/accel-ppp/accel-pppd/triton/triton.c:159
#9  0x00007f0ca437a851 in start_thread () from /lib64/libpthread.so.0
#10 0x00007f0ca36a194d in clone () from /lib64/libc.so.6

Полный лог событий, видны множественные ответы.

Дамп этого клиента после краша

[root@ipoetest accel-ppp]# tcpdump -nni eth0.999.2003 -p port 67 or port 68
tcpdump: WARNING: eth0.999.2003: no IPv4 address assigned
tcpdump: verbose output suppressed, use -v or -vv for full protocol decode
listening on eth0.999.2003, link-type EN10MB (Ethernet), capture size 65535 bytes

22:29:30.246308 IP 194.12.94.3.68 > 194.12.64.1.67: BOOTP/DHCP, Request from 50:46:5d:4e:b5:72, length 300
22:29:30.249672 IP 194.12.64.1.67 > 194.12.94.3.68: BOOTP/DHCP, Reply, length 334
22:29:30.249785 IP 194.12.64.1.67 > 194.12.94.3.68: BOOTP/DHCP, Reply, length 334
...штук 100 повторов..
22:29:30.250054 IP 194.12.64.1.67 > 194.12.94.3.68: BOOTP/DHCP, Reply, length 334
22:29:30.266276 IP 194.12.64.1.67 > 194.12.94.3.68: BOOTP/DHCP, Reply, length 334

После терминейта клиент переполучил ip нормально, но продление лизы все так же множится(в конце лога).

И похоже величина размножения(где-то в 100 раз нынче) равна чиcлу вызовов reload.

 

Да, по команде accel-cmd shutdown сдох разве что модуль управления.

В процессах сервис так и остался висеть

[root@ipoetest accel-ppp]# accel-cmd shutdown

[root@ipoetest accel-ppp]# ps ax | grep accel
2669 ?        Ssl    0:01 /usr/local/sbin/accel-pppd -c /etc/accel-ppp.conf -d --dump /tmp -p /var/run/accel-pppd.pid --internal
3502 pts/1    S+     0:00 grep accel

[root@ipoetest accel-ppp]# accel-cmd show stat
Connection to "localhost:2001" failed

Изменено пользователем kayot

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.

Гость
Ответить в тему...

×   Вставлено в виде отформатированного текста.   Вставить в виде обычного текста

  Разрешено не более 75 смайлов.

×   Ваша ссылка была автоматически встроена.   Отобразить как ссылку

×   Ваш предыдущий контент был восстановлен.   Очистить редактор

×   Вы не можете вставить изображения напрямую. Загрузите или вставьте изображения по ссылке.