kayot Опубликовано 2 сентября, 2013 · Жалоба Каждое завершение работы демона завершается крашем. Accel корку не создает, системный abrtd пытается, но что-то у него не сростается. cat /var/log/messages Sep 2 06:53:41 ipoe1 abrt[6935]: File '/usr/local/sbin/accel-pppd' seems to be deleted Sep 2 06:53:41 ipoe1 abrt[6935]: Saved core dump of pid 18168 (/usr/local/sbin/accel-pppd) to /var/spool/abrt/ccpp-2013-09-02-06:53:41-18168 (76460032 bytes) Sep 2 06:53:41 ipoe1 abrtd: Directory 'ccpp-2013-09-02-06:53:41-18168' creation detected Sep 2 06:53:41 ipoe1 abrtd: Executable '/usr/local/sbin/accel-pppd' doesn't belong to any package Sep 2 06:53:41 ipoe1 abrtd: 'post-create' on '/var/spool/abrt/ccpp-2013-09-02-06:53:41-18168' exited with 1 Sep 2 06:53:41 ipoe1 abrtd: Corrupted or bad directory /var/spool/abrt/ccpp-2013-09-02-06:53:41-18168, deleting Sep 2 06:56:54 ipoe1 abrt[7080]: Saved core dump of pid 6968 (/usr/local/sbin/accel-pppd) to /var/spool/abrt/ccpp-2013-09-02-06:56:53-6968 (30277632 bytes) Sep 2 06:56:54 ipoe1 abrtd: Directory 'ccpp-2013-09-02-06:56:53-6968' creation detected Sep 2 06:56:54 ipoe1 abrtd: Executable '/usr/local/sbin/accel-pppd' doesn't belong to any package Sep 2 06:56:54 ipoe1 abrtd: 'post-create' on '/var/spool/abrt/ccpp-2013-09-02-06:56:53-6968' exited with 1 Sep 2 06:56:54 ipoe1 abrtd: Corrupted or bad directory /var/spool/abrt/ccpp-2013-09-02-06:56:53-6968, deleting Sep 2 07:02:03 ipoe1 abrtd: Directory 'ccpp-2013-09-02-07:02:03-7083' creation detected Sep 2 07:02:03 ipoe1 abrt[7405]: Saved core dump of pid 7083 (/usr/local/sbin/accel-pppd) to /var/spool/abrt/ccpp-2013-09-02-07:02:03-7083 (75157504 bytes) Sep 2 07:02:03 ipoe1 abrtd: Executable '/usr/local/sbin/accel-pppd' doesn't belong to any package Sep 2 07:02:03 ipoe1 abrtd: 'post-create' on '/var/spool/abrt/ccpp-2013-09-02-07:02:03-7083' exited with 1 Sep 2 07:02:03 ipoe1 abrtd: Corrupted or bad directory /var/spool/abrt/ccpp-2013-09-02-07:02:03-7083, deleting Sep 2 07:10:07 ipoe1 abrtd: Directory 'ccpp-2013-09-02-07:10:07-7429' creation detected Sep 2 07:10:07 ipoe1 abrt[7797]: Saved core dump of pid 7429 (/usr/local/sbin/accel-pppd) to /var/spool/abrt/ccpp-2013-09-02-07:10:07-7429 (30433280 bytes) Sep 2 07:10:07 ipoe1 abrtd: Executable '/usr/local/sbin/accel-pppd' doesn't belong to any package Sep 2 07:10:07 ipoe1 abrtd: 'post-create' on '/var/spool/abrt/ccpp-2013-09-02-07:10:07-7429' exited with 1 Sep 2 07:10:07 ipoe1 abrtd: Corrupted or bad directory /var/spool/abrt/ccpp-2013-09-02-07:10:07-7429, deleting Sep 2 07:13:13 ipoe1 abrtd: Directory 'ccpp-2013-09-02-07:13:13-7800' creation detected Sep 2 07:13:13 ipoe1 abrt[7900]: Saved core dump of pid 7800 (/usr/local/sbin/accel-pppd) to /var/spool/abrt/ccpp-2013-09-02-07:13:13-7800 (38969344 bytes) Sep 2 07:13:13 ipoe1 abrtd: Executable '/usr/local/sbin/accel-pppd' doesn't belong to any package Sep 2 07:13:13 ipoe1 abrtd: 'post-create' on '/var/spool/abrt/ccpp-2013-09-02-07:13:13-7800' exited with 1 Sep 2 07:13:13 ipoe1 abrtd: Corrupted or bad directory /var/spool/abrt/ccpp-2013-09-02-07:13:13-7800, deleting cat /var/log/accel-ppp/core.log [2013-07-27 21:23:39.29]BUG:ctx:triton_unregister_ctx: handlers is not empty [2013-07-27 21:42:27.258]BUG:ctx:triton_unregister_ctx: handlers is not empty [2013-07-27 21:45:51.559]BUG:ctx:triton_unregister_ctx: handlers is not empty [2013-07-27 21:52:14.70]BUG:ctx:triton_unregister_ctx: handlers is not empty [2013-07-29 23:10:27.963]BUG:ctx:triton_unregister_ctx: handlers is not empty [2013-07-31 13:45:29.416]BUG:ctx:triton_unregister_ctx: handlers is not empty [2013-08-29 08:00:27.482]BUG:ctx:triton_unregister_ctx: handlers is not empty [2013-08-31 01:37:03.273]BUG:ctx:triton_unregister_ctx: handlers is not empty [2013-08-31 01:41:21.558]BUG:ctx:triton_unregister_ctx: handlers is not empty [2013-08-31 02:08:41.705]BUG:ctx:triton_unregister_ctx: handlers is not empty [2013-08-31 02:12:19.870]BUG:ctx:triton_unregister_ctx: handlers is not empty [2013-09-02 06:53:41.89]BUG:ctx:triton_unregister_ctx: handlers is not empty [2013-09-02 07:02:03.404]BUG:ctx:triton_unregister_ctx: handlers is not empty [2013-09-02 07:13:13.148]BUG:ctx:triton_unregister_ctx: handlers is not empty Как раз сегодня утром 3 раза перезапускал(accel-cmd shutdown) и 2 раза сервис падал сам. Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
srg555 Опубликовано 2 сентября, 2013 · Жалоба ProcessUnpackaged = yes в /etc/abrt/abrt-action-save-package-data.conf Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
srg555 Опубликовано 3 сентября, 2013 (изменено) · Жалоба kayot разобрались с rhel-овской приблудой по сбору корок? Изменено 3 сентября, 2013 пользователем srg555 Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
kayot Опубликовано 3 сентября, 2013 (изменено) · Жалоба srg555 Да, спасибо за пинок. Сейчас собираю отдельный стенд для тестирования, в подакшине софт с такими глобальными изменениями тестить уже страшно. Да, некорректное завершение работы с ipoe-модулем было всегда. Без активного abrtd его просто не заметно, в core.log строчка про bug писалась давно. На работу оно никак не влияет, потому внимание и не обращали. Изменено 3 сентября, 2013 пользователем kayot Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
nuclearcat Опубликовано 3 сентября, 2013 · Жалоба xeb, сорри что не патч: <------>opt = conf_get_opt("shaper", "rate-multiplier"); <------>if (opt && atoi(opt) >= 0) <------><------>conf_multiplier = atof(opt); <------>else <------><------>conf_multiplier = 1; Надо бы думаю <------>if (opt && atof(opt) >= 0.0) Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
xeb Опубликовано 3 сентября, 2013 · Жалоба в подакшине софт с такими глобальными изменениями тестить уже страшно. я думаю, если нет возражений, что пока достаточно функционала запилино, надо отладить то что есть и выпустить какой-то релиза новые идеи уже будут в следующей версии nuclearcat, я смотрю уже исправлено Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
nuclearcat Опубликовано 3 сентября, 2013 · Жалоба А, ок, спасибо. А то с микротиком столкнулся :) Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
Cramac Опубликовано 3 сентября, 2013 · Жалоба не уверен что на этом ядре исправлено это ядро вообще помоему никем не поддерживается, я бы порекомендовал хотя бы 3.2 Подскажите, отключение модуля устранит проблему? До обновления, работало пол года стабильно. Обновил, сегодня 3 раза уже падало. Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
kayot Опубликовано 4 сентября, 2013 · Жалоба Не работает монитор вланов, или я не понял как им пользоваться. [ipoe] interface=re:eth0\.[1-9][0-9][0-9]\.(\d+)$,relay=10.200.0.2,giaddr=10.200.0.110 interface=re:eth0\.2[0-9][0-9][0-9]\.(\d+)$,relay=10.200.0.2,giaddr=10.200.0.110 interface=re:eth0.999,shared=0 interface=re:eth0,shared=0 vlan-mon=eth0.999,2000-2999 vlan-mon=eth0,300-312 [root@ipoetest etc]# tcpdump -e -nni eth0 port 67 or port 67 tcpdump: WARNING: eth0: no IPv4 address assigned tcpdump: verbose output suppressed, use -v or -vv for full protocol decode listening on eth0, link-type EN10MB (Ethernet), capture size 65535 bytes 13:28:48.888101 dc:0e:a1:f9:46:7d > ff:ff:ff:ff:ff:ff, ethertype 802.1Q (0x8100), length 350: vlan 310, p 0, ethertype IPv4, 0.0.0.0.68 > 255.255.255.255.67: BOOTP/DHCP, Request from dc:0e:a1:f9:46:7d, length 304 13:28:48.890880 00:15:17:9d:cd:d2 > ff:ff:ff:ff:ff:ff, ethertype 802.1Q (0x8100), length 352: vlan 310, p 0, ethertype IPv4, 10.16.40.1.67 > 255.255.255.255.68: BOOTP/DHCP, Reply, length 306 13:28:50.657665 00:1d:60:24:a1:24 > ff:ff:ff:ff:ff:ff, ethertype 802.1Q (0x8100), length 594: vlan 311, p 0, ethertype IPv4, 0.0.0.0.68 > 255.255.255.255.67: BOOTP/DHCP, Request from 00:1d:60:24:a1:24, length 548 13:28:52.519007 dc:0e:a1:f9:46:7d > ff:ff:ff:ff:ff:ff, ethertype 802.1Q (0x8100), length 346: vlan 310, p 0, ethertype IPv4, 10.16.42.88.68 > 255.255.255.255.67: BOOTP/DHCP, Request from dc:0e:a1:f9:46:7d, length 300 13:28:52.661174 00:1d:60:24:a1:24 > ff:ff:ff:ff:ff:ff, ethertype 802.1Q (0x8100), length 594: vlan 311, p 0, ethertype IPv4, 0.0.0.0.68 > 255.255.255.255.67: BOOTP/DHCP, Request from 00:1d:60:24:a1:24, length 548 [root@ipoetest etc]# tcpdump -e -nni eth0.999 port 67 or port 67 tcpdump: WARNING: eth0.999: no IPv4 address assigned tcpdump: verbose output suppressed, use -v or -vv for full protocol decode listening on eth0.999, link-type EN10MB (Ethernet), capture size 65535 bytes 13:07:33.210331 00:17:a4:14:d9:dd > ff:ff:ff:ff:ff:ff, ethertype 802.1Q (0x8100), length 353: vlan 2002, p 0, ethertype IPv4, 0.0.0.0.68 > 255.255.255.255.67: BOOTP/DHCP, Request from 00:17:a4:14:d9:dd, length 307 13:07:36.207790 00:17:a4:14:d9:dd > ff:ff:ff:ff:ff:ff, ethertype 802.1Q (0x8100), length 353: vlan 2002, p 0, ethertype IPv4, 0.0.0.0.68 > 255.255.255.255.67: BOOTP/DHCP, Request from 00:17:a4:14:d9:dd, length 307 13:07:40.465849 3c:97:0e:26:c5:ce > ff:ff:ff:ff:ff:ff, ethertype 802.1Q (0x8100), length 346: vlan 305, p 0, ethertype IPv4, 10.16.23.74.68 > 255.255.255.255.67: BOOTP/DHCP, Request from 3c:97:0e:26:c5:ce, length 300 13:07:44.207931 00:17:a4:14:d9:dd > ff:ff:ff:ff:ff:ff, ethertype 802.1Q (0x8100), length 353: vlan 2002, p 0, ethertype IPv4, 0.0.0.0.68 > 255.255.255.255.67: BOOTP/DHCP, Request from 00:17:a4:14:d9:dd, length 307 Вланы не создаются ни на qinq интерфейсе(eth0.999.xxxx), ни на базовом eth0 куда прилетает разный мусор с vid 300-312. Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
nik247 Опубликовано 4 сентября, 2013 · Жалоба to kayot Что-то мне подсказывает, что у Вас не загружен ядерный модуль ipoe. Насколько помню, у Вас shared=0, и модуль Вы не использовали раннее. А для vlan monitor он нужен. Вчера проверял - все отработало. Сегодня xeb пофиксил еще удаление vlan. Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
xeb Опубликовано 4 сентября, 2013 · Жалоба и в логах ничего ? Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
kayot Опубликовано 4 сентября, 2013 (изменено) · Жалоба И еще в новой версии я вижу некое чудо в старте сессии. 3 попытки получить IP от клиента, заканчиваются странным тайм-аутом. [2013-09-04 13:46:00]: info: eth0.999.2002: recv [DHCPv4 Discover xid=b1fdac29 chaddr=00:17:a4:14:d9:dd <Message-Type Discover> <Option-116 01> <Client-ID 010017a414d9dd> <Ho [2013-09-04 13:46:00]: info: eth0.999.2002: 999.2002: authentication succeeded [2013-09-04 13:46:00]: info: eth0.999.2002: send [DHCPv4 relay Discover xid=b1fdac29 giaddr=10.200.0.110 chaddr=00:17:a4:14:d9:dd <Message-Type Discover> <Option-116 01> <Cli [2013-09-04 13:46:00]: info: eth0.999.2002: recv [DHCPv4 relay Offer xid=b1fdac29 yiaddr=194.12.94.2 giaddr=10.200.0.110 chaddr=00:17:a4:14:d9:dd <Message-Type Offer> <Server [2013-09-04 13:46:00]: info: eth0.999.2002: send [DHCPv4 Offer xid=b1fdac29 yiaddr=194.12.94.2 siaddr=194.12.64.1 chaddr=00:17:a4:14:d9:dd <Message-Type Offer> <Server-ID 194 [2013-09-04 13:46:03]: info: eth0.999.2002: recv [DHCPv4 Discover xid=b1fdac29 chaddr=00:17:a4:14:d9:dd <Message-Type Discover> <Option-116 01> <Client-ID 010017a414d9dd> <Ho [2013-09-04 13:46:03]: info: eth0.999.2002: send [DHCPv4 relay Discover xid=b1fdac29 giaddr=10.200.0.110 chaddr=00:17:a4:14:d9:dd <Message-Type Discover> <Option-116 01> <Cli [2013-09-04 13:46:03]: info: eth0.999.2002: recv [DHCPv4 relay Offer xid=b1fdac29 yiaddr=194.12.94.2 giaddr=10.200.0.110 chaddr=00:17:a4:14:d9:dd <Message-Type Offer> <Server [2013-09-04 13:46:03]: info: eth0.999.2002: send [DHCPv4 Offer xid=b1fdac29 yiaddr=194.12.94.2 siaddr=194.12.64.1 chaddr=00:17:a4:14:d9:dd <Message-Type Offer> <Server-ID 194 [2013-09-04 13:46:06]: info: eth0.999.2002: ipoe: session timed out [2013-09-04 13:46:06]: debug: eth0.999.2002: terminate [2013-09-04 13:46:06]: info: eth0.999.2002: ipoe: session finished [2013-09-04 13:46:06]: info: eth0.999.2002: send [DHCPv4 relay Release xid=b1fdac29 ciaddr=194.12.94.2 giaddr=10.200.0.110 chaddr=00:17:a4:14:d9:dd <Message-Type Release> <Re [2013-09-04 13:46:10]: info: eth0.999.2002: recv [DHCPv4 Discover xid=b1fdac29 chaddr=00:17:a4:14:d9:dd <Message-Type Discover> <Option-116 01> <Client-ID 010017a414d9dd> <Ho [2013-09-04 13:46:10]: info: eth0.999.2002: 999.2002: authentication succeeded [2013-09-04 13:46:10]: info: eth0.999.2002: send [DHCPv4 relay Discover xid=b1fdac29 giaddr=10.200.0.110 chaddr=00:17:a4:14:d9:dd <Message-Type Discover> <Option-116 01> <Cli [2013-09-04 13:46:10]: info: eth0.999.2002: recv [DHCPv4 relay Offer xid=b1fdac29 yiaddr=194.12.94.2 giaddr=10.200.0.110 chaddr=00:17:a4:14:d9:dd <Message-Type Offer> <Server [2013-09-04 13:46:10]: info: eth0.999.2002: send [DHCPv4 Offer xid=b1fdac29 yiaddr=194.12.94.2 siaddr=194.12.64.1 chaddr=00:17:a4:14:d9:dd <Message-Type Offer> <Server-ID 194 [2013-09-04 13:46:13]: info: eth0.999.2002: ipoe: session timed out [2013-09-04 13:46:13]: debug: eth0.999.2002: terminate [2013-09-04 13:46:13]: info: eth0.999.2002: ipoe: session finished [2013-09-04 13:46:13]: info: eth0.999.2002: send [DHCPv4 relay Release xid=b1fdac29 ciaddr=194.12.94.2 giaddr=10.200.0.110 chaddr=00:17:a4:14:d9:dd <Message-Type Release> <Re [2013-09-04 13:46:26]: info: eth0.999.2002: recv [DHCPv4 Discover xid=b1fdac29 chaddr=00:17:a4:14:d9:dd <Message-Type Discover> <Option-116 01> <Client-ID 010017a414d9dd> <Ho [2013-09-04 13:46:26]: info: eth0.999.2002: 999.2002: authentication succeeded [2013-09-04 13:46:26]: info: eth0.999.2002: send [DHCPv4 relay Discover xid=b1fdac29 giaddr=10.200.0.110 chaddr=00:17:a4:14:d9:dd <Message-Type Discover> <Option-116 01> <Cli [2013-09-04 13:46:26]: info: eth0.999.2002: recv [DHCPv4 relay Offer xid=b1fdac29 yiaddr=194.12.94.2 giaddr=10.200.0.110 chaddr=00:17:a4:14:d9:dd <Message-Type Offer> <Server [2013-09-04 13:46:26]: info: eth0.999.2002: send [DHCPv4 Offer xid=b1fdac29 yiaddr=194.12.94.2 siaddr=194.12.64.1 chaddr=00:17:a4:14:d9:dd <Message-Type Offer> <Server-ID 194 [2013-09-04 13:46:29]: info: eth0.999.2002: ipoe: session timed out [2013-09-04 13:46:29]: debug: eth0.999.2002: terminate [2013-09-04 13:46:29]: info: eth0.999.2002: ipoe: session finished [2013-09-04 13:46:29]: info: eth0.999.2002: send [DHCPv4 relay Release xid=b1fdac29 ciaddr=194.12.94.2 giaddr=10.200.0.110 chaddr=00:17:a4:14:d9:dd <Message-Type Release> Ничего не меняя, дернул еще пару раз подключение и клиент взлетел. [2013-09-04 13:49:26]: info: : recv [DHCPv4 Discover xid=ac239d16 chaddr=00:17:a4:14:d9:dd <Message-Type Discover> <Option-116 01> <Client-ID 010017a414d9dd> <Request-IP 169. [2013-09-04 13:49:26]: info: eth0.999.2002: 999.2002: authentication succeeded [2013-09-04 13:49:26]: info: eth0.999.2002: send [DHCPv4 relay Discover xid=ac239d16 giaddr=10.200.0.110 chaddr=00:17:a4:14:d9:dd <Message-Type Discover> <Option-116 01> <Cli [2013-09-04 13:49:26]: info: eth0.999.2002: recv [DHCPv4 relay Offer xid=ac239d16 yiaddr=194.12.94.2 giaddr=10.200.0.110 chaddr=00:17:a4:14:d9:dd <Message-Type Offer> <Server [2013-09-04 13:49:26]: info: eth0.999.2002: send [DHCPv4 Offer xid=ac239d16 yiaddr=194.12.94.2 siaddr=194.12.64.1 chaddr=00:17:a4:14:d9:dd <Message-Type Offer> <Server-ID 194 [2013-09-04 13:49:26]: info: eth0.999.2002: recv [DHCPv4 Request xid=ac239d16 chaddr=00:17:a4:14:d9:dd <Message-Type Request> <Client-ID 010017a414d9dd> <Request-IP 194.12.94 [2013-09-04 13:49:26]: info: eth0.999.2002: send [DHCPv4 relay Request xid=ac239d16 giaddr=10.200.0.110 chaddr=00:17:a4:14:d9:dd <Message-Type Request> <Client-ID 010017a414d [2013-09-04 13:49:26]: info: eth0.999.2002: recv [DHCPv4 relay Ack xid=ac239d16 yiaddr=194.12.94.2 giaddr=10.200.0.110 chaddr=00:17:a4:14:d9:dd <Message-Type Ack> <Server-ID [2013-09-04 13:49:26]: info: eth0.999.2002: ipoe: session started [2013-09-04 13:49:26]: info: eth0.999.2002: send [DHCPv4 Ack xid=ac239d16 yiaddr=194.12.94.2 chaddr=00:17:a4:14:d9:dd <Message-Type Ack> <Server-ID 194.12.64.1> <Lease-Tim xeb В логах пусто. Для работы нужен собранный драйвер? С ядром 3.10.10 ipoe_driver не собирается. [ 98%] Generating driver/ipoe.ko /usr/src/accel-ppp/build/drivers/ipoe/driver/ipoe.c: In function ‘ipoe_nl_cmd_add_vlan_mon’: /usr/src/accel-ppp/build/drivers/ipoe/driver/ipoe.c:1634: error: ‘NETIF_F_HW_VLAN_FILTER’ undeclared (first use in this function) /usr/src/accel-ppp/build/drivers/ipoe/driver/ipoe.c:1634: error: (Each undeclared identifier is reported only once /usr/src/accel-ppp/build/drivers/ipoe/driver/ipoe.c:1634: error: for each function it appears in.) /usr/src/accel-ppp/build/drivers/ipoe/driver/ipoe.c:1637: error: too few arguments to function ‘dev->netdev_ops->ndo_vlan_rx_add_vid’ /usr/src/accel-ppp/build/drivers/ipoe/driver/ipoe.c: In function ‘ipoe_nl_cmd_add_vlan_mon_vid’: /usr/src/accel-ppp/build/drivers/ipoe/driver/ipoe.c:1678: error: ‘NETIF_F_HW_VLAN_FILTER’ undeclared (first use in this function) /usr/src/accel-ppp/build/drivers/ipoe/driver/ipoe.c:1679: error: too few arguments to function ‘dev->netdev_ops->ndo_vlan_rx_add_vid’ make[4]: *** [/usr/src/accel-ppp/build/drivers/ipoe/driver/ipoe.o] Error 1 make[3]: *** [_module_/usr/src/accel-ppp/build/drivers/ipoe/driver] Error 2 make[2]: *** [drivers/ipoe/driver/ipoe.ko] Error 2 make[1]: *** [drivers/ipoe/CMakeFiles/ipoe_drv.dir/all] Error 2 make: *** [all] Error 2 Изменено 6 сентября, 2013 пользователем kayot Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
xeb Опубликовано 4 сентября, 2013 · Жалоба И еще в новой версии я вижу некое чудо в старте сессии. 3 попытки получить IP от клиента, заканчиваются странным тайм-аутом. этот таймаут был всегда, может быть не проявлялся, это таймаут между отправкой OFFER клиенту и получением REQUEST, по умолчанию 3 сек С ядром 3.10.10 ipoe_driver не собирается. ясно, щас гляну Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
xeb Опубликовано 4 сентября, 2013 · Жалоба починил Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
kayot Опубликовано 4 сентября, 2013 (изменено) · Жалоба Собирается на свежем ядре, автосоздание и удаление вланов работает. И еще в новой версии я вижу некое чудо в старте сессии. 3 попытки получить IP от клиента, заканчиваются странным тайм-аутом. этот таймаут был всегда, может быть не проявлялся, это таймаут между отправкой OFFER клиенту и получением REQUEST, по умолчанию 3 сек Тут все ок, тестовая машина с Windows XP имеет какое-то извращенное понятие о dhcp и стандартах. Нормально получает IP только после полного отключения/включения сетевки или ребута :) Изменено 4 сентября, 2013 пользователем kayot Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
kayot Опубликовано 4 сентября, 2013 (изменено) · Жалоба Все-таки кое-что в инициализации сессии изменилось в новых версиях. Вопрос в том, какой способ старта правильный? Раньше старт сессии происходил при выдаче IP абоненту любым образом, включая обычный request/ack при обновлении выданной лизы. Т.е. я мог сделать terminate сессии и через какое-то время(максимум - половина лизы) клиент обновляя себе лизу стартовал сессию. Или старт сессии мог инициализировать я, дернув абонентский порт. Сейчас на риквесты без установленной сессии relay не отвечает, единственный способ запустить сессию - сделать полный цикл с discover/offer/request/ack. Убив сессию(или просто перезапустив accel) я не могу заставить клиента стартовать сессию - даже после опускания/поднятия порта windows продолжает слать request на последний выданный IP, причем даже после окончания лизы какое-то время идут броадкастовые запросы от 0.0.0.0 все с тем же реквестом. Иногда на этом все и заканчивается, винда говорит 'нельзя получить IP' и прекращает попытки. Отключая/включая порт опять получаем реквесты от 0.0.0.0 и все, нужно передергивание интерфейса или ребут клиента. Вот лог подобной ситуации(terminate сессии), IP в итоге был выдан, но сам vlan был создан и удален 12 раз :) Вероятно стоит увеличить таймаут создания влана с 10 секунд до ~10 минут для избегания подобных флапов. Или вот лог старта win7 после смены клиенту влана(перевод на ipoe) и дерганья интерфейса. Интерфейс пересоздан 8 раз. Изменено 4 сентября, 2013 пользователем kayot Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
xeb Опубликовано 5 сентября, 2013 · Жалоба да, действительно изменилось, с вводом offer-delay accel-ppp перестал чувствовать себя единственным сервером и отвечать на любые запросы kayot, там в логах обрезалось, реквесты идут без явного Server-ID ? Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
kayot Опубликовано 5 сентября, 2013 (изменено) · Жалоба xeb Да, запросы на продление идут без Server-ID, но обращение идет к конкретному серверу [2013-09-05 07:08:19]: info: bond1.2008.1101: recv [DHCPv4 Request xid=bcbb9d7f ciaddr=194.12.68.57 chaddr=f8:1a:67:4b:38:d5 <Message-Type Request> <Max-Message-Size 1024> <Client-ID 01f81a674b38d5> <Ho st-Name TL-WR740N> <Vendor-Class 4d53465420352e30> <Request-List Subnet,Router,DNS,Domain-Name,Route,Vendor-Specific,44,46,47,Classless-Route,249>] [2013-09-05 07:08:19]: info: bond1.2008.1101: send [DHCPv4 relay Request xid=bcbb9d7f ciaddr=194.12.68.57 giaddr=10.200.0.100 chaddr=f8:1a:67:4b:38:d5 <Message-Type Request> <Max-Message-Size 1024> <Cli ent-ID 01f81a674b38d5> <Host-Name TL-WR740N> <Vendor-Class 4d53465420352e30> <Request-List Subnet,Router,DNS,Domain-Name,Route,Vendor-Specific,44,46,47,Classless-Route,249> <Relay-Agent {Agent-Circuit-ID bond1.2008.1101} {Agent-Remote-ID accel-pppd}>] [2013-09-05 07:08:19]: info: bond1.2008.1101: recv [DHCPv4 relay Ack xid=bcbb9d7f ciaddr=194.12.68.57 yiaddr=194.12.68.57 giaddr=10.200.0.100 chaddr=f8:1a:67:4b:38:d5 <Message-Type Ack> <Server-ID 10.20 1.0.1> <Lease-Time 300> <Subnet 255.255.224.0> <Router 194.12.64.1> <DNS 91.203.164.27> <Vendor-Specific 020400000001010400000002ff> <Vendor-Class 4d53465420352e30> <Option-46 08> <Relay-Agent {Agent-Cir cuit-ID bond1.2008.1101} {Agent-Remote-ID accel-pppd}>] [2013-09-05 07:08:19]: info: bond1.2008.1101: send [DHCPv4 Ack xid=bcbb9d7f ciaddr=194.12.68.57 yiaddr=194.12.68.57 chaddr=f8:1a:67:4b:38:d5 <Message-Type Ack> <Server-ID 194.12.64.1> <Lease-Time 300> < Router 194.12.64.1> <Subnet 255.255.224.0> <DNS 91.203.164.27> <Vendor-Specific 020400000001010400000002ff> <Vendor-Class 4d53465420352e30> <Option-46 08> <Relay-Agent {Agent-Circuit-ID bond1.2008.1101} {Agent-Remote-ID accel-pppd}>] Как раз поймал, один запрос бродкастом, второй нет. [root@ipoe1 /]# tcpdump -nni bond1.2000 -p -vv port 67 tcpdump: WARNING: bond1.2000: no IPv4 address assigned tcpdump: listening on bond1.2000, link-type EN10MB (Ethernet), capture size 65535 bytes 07:24:43.427987 IP (tos 0x0, ttl 64, id 38733, offset 0, flags [DF], proto UDP (17), length 576) 194.12.74.148.68 > 194.12.64.1.67: [udp sum ok] BOOTP/DHCP, Request from c8:60:00:98:f8:91, length 548, xid 0x2a336c18, Flags [broadcast] (0x8000) Client-IP 194.12.74.148 Client-Ethernet-Address c8:60:00:98:f8:91 Vendor-rfc1048 Extensions Magic Cookie 0x63825363 DHCP-Message Option 53, length 1: Request MSZ Option 57, length 2: 1024 Client-ID Option 61, length 7: ether c8:60:00:98:f8:91 Hostname Option 12, length 9: "TL-WR740N" Vendor-Class Option 60, length 8: "MSFT 5.0" Parameter-Request Option 55, length 11: Subnet-Mask, Default-Gateway, Domain-Name-Server, Domain-Name Static-Route, Vendor-Option, Netbios-Name-Server, Netbios-Node Netbios-Scope, Classless-Static-Route, Classless-Static-Route-Microsoft 07:24:50.963159 IP (tos 0x0, ttl 64, id 33365, offset 0, flags [DF], proto UDP (17), length 306) 91.203.165.2.68 > 91.203.164.27.67: [udp sum ok] BOOTP/DHCP, Request from 00:1a:4d:50:fb:35, length 278, xid 0x7b1a9776, Flags [none] (0x0000) Client-IP 91.203.165.2 Client-Ethernet-Address 00:1a:4d:50:fb:35 Vendor-rfc1048 Extensions Magic Cookie 0x63825363 DHCP-Message Option 53, length 1: Request Client-ID Option 61, length 7: ether 00:1a:4d:50:fb:35 Parameter-Request Option 55, length 9: Subnet-Mask, Default-Gateway, Domain-Name-Server, Hostname Domain-Name, BR, Static-Route, NTP Classless-Static-Route-Microsoft Vendor-Class Option 60, length 12: "udhcp 1.17.4" 2. При завершении работы accel с ipoe-модулем падает в 100% случаев, поймал корку с abrtd. Похоже заметить это можно только в свежих версиях centos. [root@ipoe1 etc]# ps ax | grep accel 9014 ? Ssl 0:05 /usr/local/sbin/accel-pppd -c /etc/accel-ppp_pppoe.conf -d --dump /tmp 24837 ? Ssl 18:01 /usr/local/sbin/accel-pppd -c /etc/accel-ppp.conf -d --dump /tmp --internal [root@ipoe1 etc]# accel-cmd shutdown [root@ipoe1 etc]# ps ax | grep accel 9014 ? Ssl 0:05 /usr/local/sbin/accel-pppd -c /etc/accel-ppp_pppoe.conf -d --dump /tmp 24837 ? Zsl 18:01 [accel-pppd] <defunct> 26880 pts/3 S+ 0:00 grep accel [root@ipoe1 etc]# ps ax | grep accel 9014 ? Ssl 0:06 /usr/local/sbin/accel-pppd -c /etc/accel-ppp_pppoe.conf -d --dump /tmp 27032 pts/3 S+ 0:00 grep accel [root@ipoe1 ccpp-2013-09-05-07:12:12-27087]# gdb /usr/local/sbin/accel-pppd coredump (gdb) backtrace #0 0x0000003fe1c328a5 in raise () from /lib64/libc.so.6 #1 0x0000003fe1c34085 in abort () from /lib64/libc.so.6 #2 0x00007f3ea086c768 in triton_context_unregister (ud=0x770c10) at /usr/src/accel-ppp/accel-pppd/triton/triton.c:353 #3 0x00007f3ea0421ad1 in ipoe_serv_close (ctx=0x770c10) at /usr/src/accel-ppp/accel-pppd/ctrl/ipoe/ipoe.c:1696 #4 0x00007f3ea086c24f in ctx_thread (ctx=0x770d68) at /usr/src/accel-ppp/accel-pppd/triton/triton.c:236 #5 0x00007f3ea086bebe in triton_thread (thread=0x7f3e2c000ad0) at /usr/src/accel-ppp/accel-pppd/triton/triton.c:159 #6 0x0000003f8ae07851 in start_thread () from /lib64/libpthread.so.0 #7 0x0000003fe1ce811d in clone () from /lib64/libc.so.6 (gdb) 3. Reload полностью починен, дергал раз 10 с сотней активных сессий - все ок. Изменено 5 сентября, 2013 пользователем kayot Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
xeb Опубликовано 5 сентября, 2013 · Жалоба пробуй последний комит Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
kayot Опубликовано 5 сентября, 2013 (изменено) · Жалоба xeb Похоже то что нужно, после получения nak клиент сразу шлет discover без длительных отмираний лиз и других чудес разных реализаций dhcp-клиентов. [2013-09-05 10:04:15]: info: ipoe: create vlan eth0.999.2006 [2013-09-05 10:04:15]: info: ipoe: start interface eth0.999.2006 (relay=10.200.0.2,giaddr=10.200.0.110) [2013-09-05 10:04:19]: debug: recv [DHCPv4 Request xid=8daae9b1 chaddr=00:16:35:0c:02:97 <Message-Type Request> <Client-ID 010016350c0297> <Request-IP 10.110.1.3> <Host-Name zeus-24> <Vendor-Class 4d53 [2013-09-05 10:04:19]: info: send [DHCPv4 Nak xid=8daae9b1 chaddr=00:16:35:0c:02:97 <Message-Type Nak>] [2013-09-05 10:04:20]: info: eth0.999.2006: recv [DHCPv4 Discover xid=4cd85783 chaddr=00:16:35:0c:02:97 <Message-Type Discover> <Option-116 01> <Client-ID 010016350c0297> <Host-Name zeus-24> <Vendor-C [2013-09-05 10:04:20]: info: eth0.999.2006: 999.2006: authentication succeeded [2013-09-05 10:04:20]: info: eth0.999.2006: send [DHCPv4 relay Discover xid=4cd85783 giaddr=10.200.0.110 chaddr=00:16:35:0c:02:97 <Message-Type Discover> <Option-116 01> <Client-ID 010016350c0297> <Ho [2013-09-05 10:04:20]: info: eth0.999.2006: recv [DHCPv4 relay Offer xid=4cd85783 yiaddr=194.12.94.6 giaddr=10.200.0.110 chaddr=00:16:35:0c:02:97 <Message-Type Offer> <Server-ID 10.201.0.1> <Lease-Tim [2013-09-05 10:04:20]: info: eth0.999.2006: send [DHCPv4 Offer xid=4cd85783 yiaddr=194.12.94.6 siaddr=194.12.64.1 chaddr=00:16:35:0c:02:97 <Message-Type Offer> <Server-ID 194.12.64.1> <Lease-Time 300> [2013-09-05 10:04:20]: info: eth0.999.2006: recv [DHCPv4 Request xid=4cd85783 chaddr=00:16:35:0c:02:97 <Message-Type Request> <Client-ID 010016350c0297> <Request-IP 194.12.94.6> <Server-ID 194.12.64.1 [2013-09-05 10:04:20]: info: eth0.999.2006: send [DHCPv4 relay Request xid=4cd85783 giaddr=10.200.0.110 chaddr=00:16:35:0c:02:97 <Message-Type Request> <Client-ID 010016350c0297> <Request-IP 194.12.94 [2013-09-05 10:04:20]: info: eth0.999.2006: recv [DHCPv4 relay Ack xid=4cd85783 yiaddr=194.12.94.6 giaddr=10.200.0.110 chaddr=00:16:35:0c:02:97 <Message-Type Ack> <Server-ID 10.201.0.1> <Lease-Time 30 [2013-09-05 10:04:20]: info: eth0.999.2006: ipoe: session started Тут как раз клиенту был выдан левый IP(10.110.1.3), и вероятно с бесконечной лизой. Все срослось. Изменено 6 сентября, 2013 пользователем kayot Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
kayot Опубликовано 5 сентября, 2013 (изменено) · Жалоба UPDATE: после нескольких релоадов все-таки что-то с релеем случилось. Сервер не упал, но перестал принимать новые подключения. Полный лог в момент начала чудес был выключен(слишком много идет мусора, 100м за сутки набирается легко) [2013-09-05 07:16:58]: info: bond1.2001.1128: 2001.1128: authentication succeeded [2013-09-05 07:16:58]: info: bond1.2001.1128: ipoe: session started [2013-09-05 07:16:59]: info: bond1.2009.1121: 2009.1121: authentication succeeded [2013-09-05 07:16:59]: info: bond1.2009.1121: ipoe: session started [2013-09-05 07:17:00]: info: bond1.2009.1146: 2009.1146: authentication succeeded [2013-09-05 07:17:00]: info: bond1.2009.1146: ipoe: session started [2013-09-05 07:17:02]: info: bond1.2000.1245: 2000.1245: authentication succeeded [2013-09-05 07:17:02]: info: bond1.2000.1245: ipoe: session started [2013-09-05 07:17:05]: info: bond1.2009.1136: 2009.1136: authentication succeeded [2013-09-05 07:17:06]: info: bond1.2000.1230: 2000.1230: authentication succeeded [2013-09-05 07:17:08]: info: bond1.2009.1136: ipoe: session finished [2013-09-05 07:17:08]: info: bond1.2000.1230: ipoe: session started [2013-09-05 07:17:15]: info: bond1.2009.1136: 2009.1136: authentication succeeded [2013-09-05 07:17:15]: info: bond1.2009.1136: ipoe: session started [2013-09-05 07:17:31]: info: bond1.2000.1110: 2000.1110: authentication succeeded [2013-09-05 07:17:31]: info: bond1.2000.1110: ipoe: session started [2013-09-05 07:17:40]: info: bond1.2001.1136: 2001.1136: authentication succeeded [2013-09-05 07:17:40]: info: bond1.2001.1136: ipoe: session started [2013-09-05 07:17:45]: info: bond1.2000.1233: 2000.1233: authentication succeeded [2013-09-05 07:17:45]: info: bond1.2000.1233: ipoe: session started [2013-09-05 07:22:49]: info: bond1.2008.1103: 2008.1103: authentication succeeded [2013-09-05 07:22:49]: info: bond1.2008.1103: ipoe: session started ------ [2013-09-05 07:23:52]: info: bond1.2009.1138: 2009.1138: authentication succeeded [2013-09-05 07:23:55]: info: bond1.2009.1138: ipoe: session finished [2013-09-05 07:24:13]: info: bond1.2009.1122: ipoe: session finished [2013-09-05 07:24:16]: info: bond1.2009.1122: 2009.1122: authentication succeeded [2013-09-05 07:24:18]: info: bond1.2009.1122: ipoe: session started [2013-09-05 07:27:00]: info: bond1.2008.1219: 2008.1219: authentication succeeded [2013-09-05 07:27:03]: info: bond1.2008.1219: ipoe: session finished [2013-09-05 07:28:02]: info: bond1.2008.1219: 2008.1219: authentication succeeded [2013-09-05 07:28:05]: info: bond1.2008.1219: ipoe: session finished Включил полный перед рестартом, километровый лог безуспешных попыток получить IP, так для нескольких клиентов [2013-09-05 10:13:59]: info: bond1.2000.1110: recv [DHCPv4 Discover xid=1705fa0e chaddr=00:24:8c:e4:05:17 <Message-Type Discover> <Request-IP 194.12.69.148> <Client-ID 0100248ce40517> <Host-Name RX3041> <Re [2013-09-05 10:13:59]: info: bond1.2000.1110: send [DHCPv4 relay Discover xid=1705fa0e giaddr=10.200.0.100 chaddr=00:24:8c:e4:05:17 <Message-Type Discover> <Request-IP 194.12.69.148> <Client-ID 0100248ce405 [2013-09-05 10:13:59]: info: bond1.2000.1110: recv [DHCPv4 relay Offer xid=1705fa0e yiaddr=194.12.69.148 giaddr=10.200.0.100 chaddr=00:24:8c:e4:05:17 <Message-Type Offer> <Server-ID 10.201.0.1> <Lease-Time [2013-09-05 10:13:59]: info: bond1.2000.1110: send [DHCPv4 Offer xid=1705fa0e yiaddr=194.12.69.148 siaddr=194.12.64.1 chaddr=00:24:8c:e4:05:17 <Message-Type Offer> <Server-ID 194.12.64.1> <Lease-Time 300> < [2013-09-05 10:13:59]: info: bond1.2000.1110: recv [DHCPv4 relay Offer xid=1705fa0e yiaddr=194.12.69.148 giaddr=10.200.0.100 chaddr=00:24:8c:e4:05:17 <Message-Type Offer> <Server-ID 10.201.0.1> <Lease-Time [2013-09-05 10:13:59]: info: bond1.2000.1110: send [DHCPv4 Offer xid=1705fa0e yiaddr=194.12.69.148 siaddr=194.12.64.1 chaddr=00:24:8c:e4:05:17 <Message-Type Offer> <Server-ID 194.12.64.1> <Lease-Time 300> < [2013-09-05 10:13:59]: info: bond1.2000.1110: recv [DHCPv4 relay Offer xid=1705fa0e yiaddr=194.12.69.148 giaddr=10.200.0.100 chaddr=00:24:8c:e4:05:17 <Message-Type Offer> <Server-ID 10.201.0.1> <Lease-Time [2013-09-05 10:13:59]: info: bond1.2000.1110: send [DHCPv4 Offer xid=1705fa0e yiaddr=194.12.69.148 siaddr=194.12.64.1 chaddr=00:24:8c:e4:05:17 <Message-Type Offer> <Server-ID 194.12.64.1> <Lease-Time 300> < [2013-09-05 10:13:59]: info: bond1.2000.1110: recv [DHCPv4 relay Offer xid=1705fa0e yiaddr=194.12.69.148 giaddr=10.200.0.100 chaddr=00:24:8c:e4:05:17 <Message-Type Offer> <Server-ID 10.201.0.1> <Lease-Time [2013-09-05 10:13:59]: info: bond1.2000.1110: send [DHCPv4 Offer xid=1705fa0e yiaddr=194.12.69.148 siaddr=194.12.64.1 chaddr=00:24:8c:e4:05:17 <Message-Type Offer> <Server-ID 194.12.64.1> <Lease-Time 300> < [2013-09-05 10:13:59]: info: bond1.2000.1110: recv [DHCPv4 relay Offer xid=1705fa0e yiaddr=194.12.69.148 giaddr=10.200.0.100 chaddr=00:24:8c:e4:05:17 <Message-Type Offer> <Server-ID 10.201.0.1> <Lease-Time [2013-09-05 10:13:59]: info: bond1.2000.1110: send [DHCPv4 Offer xid=1705fa0e yiaddr=194.12.69.148 siaddr=194.12.64.1 chaddr=00:24:8c:e4:05:17 <Message-Type Offer> <Server-ID 194.12.64.1> <Lease-Time 300> < [2013-09-05 10:13:59]: info: bond1.2000.1110: recv [DHCPv4 relay Offer xid=1705fa0e yiaddr=194.12.69.148 giaddr=10.200.0.100 chaddr=00:24:8c:e4:05:17 <Message-Type Offer> <Server-ID 10.201.0.1> <Lease-Time [2013-09-05 10:13:59]: info: bond1.2000.1110: send [DHCPv4 Offer xid=1705fa0e yiaddr=194.12.69.148 siaddr=194.12.64.1 chaddr=00:24:8c:e4:05:17 <Message-Type Offer> <Server-ID 194.12.64.1> <Lease-Time 300> < [2013-09-05 10:13:59]: info: bond1.2000.1110: recv [DHCPv4 Request xid=1705fa0e chaddr=00:24:8c:e4:05:17 <Message-Type Request> <Request-IP 194.12.69.148> <Server-ID 194.12.64.1> <Client-ID 0100248ce40517> [2013-09-05 10:13:59]: info: bond1.2000.1110: send [DHCPv4 relay Request xid=1705fa0e giaddr=10.200.0.100 chaddr=00:24:8c:e4:05:17 <Message-Type Request> <Request-IP 194.12.69.148> <Server-ID 10.201.0.1> <C [2013-09-05 10:13:59]: info: bond1.2000.1110: recv [DHCPv4 relay Ack xid=1705fa0e yiaddr=194.12.69.148 giaddr=10.200.0.100 chaddr=00:24:8c:e4:05:17 <Message-Type Ack> <Server-ID 10.201.0.1> <Lease-Time 300> [2013-09-05 10:13:59]: info: bond1.2000.1110: send [DHCPv4 Ack xid=1705fa0e yiaddr=194.12.69.148 chaddr=00:24:8c:e4:05:17 <Message-Type Ack> <Server-ID 194.12.64.1> <Lease-Time 300> <Router 194.12.64.1> <Su [2013-09-05 10:13:59]: info: bond1.2000.1110: recv [DHCPv4 Discover xid=1705fb0e chaddr=00:24:8c:e4:05:17 <Message-Type Discover> <Request-IP 194.12.69.148> <Client-ID 0100248ce40517> <Host-Name RX3041> <Re [2013-09-05 10:13:59]: info: bond1.2000.1110: send [DHCPv4 relay Discover xid=1705fb0e giaddr=10.200.0.100 chaddr=00:24:8c:e4:05:17 <Message-Type Discover> <Request-IP 194.12.69.148> <Client-ID 0100248ce405 [2013-09-05 10:13:59]: info: bond1.2000.1110: recv [DHCPv4 relay Offer xid=1705fb0e yiaddr=194.12.69.148 giaddr=10.200.0.100 chaddr=00:24:8c:e4:05:17 <Message-Type Offer> <Server-ID 10.201.0.1> <Lease-Time [2013-09-05 10:13:59]: info: bond1.2000.1110: send [DHCPv4 Offer xid=1705fb0e yiaddr=194.12.69.148 siaddr=194.12.64.1 chaddr=00:24:8c:e4:05:17 <Message-Type Offer> <Server-ID 194.12.64.1> <Lease-Time 300> < [2013-09-05 10:13:59]: info: bond1.2000.1110: recv [DHCPv4 relay Offer xid=1705fb0e yiaddr=194.12.69.148 giaddr=10.200.0.100 chaddr=00:24:8c:e4:05:17 <Message-Type Offer> <Server-ID 10.201.0.1> <Lease-Time [2013-09-05 10:13:59]: info: bond1.2000.1110: send [DHCPv4 Offer xid=1705fb0e yiaddr=194.12.69.148 siaddr=194.12.64.1 chaddr=00:24:8c:e4:05:17 <Message-Type Offer> <Server-ID 194.12.64.1> <Lease-Time 300> < [2013-09-05 10:13:59]: info: bond1.2000.1110: recv [DHCPv4 relay Offer xid=1705fb0e yiaddr=194.12.69.148 giaddr=10.200.0.100 chaddr=00:24:8c:e4:05:17 <Message-Type Offer> <Server-ID 10.201.0.1> <Lease-Time [2013-09-05 10:13:59]: info: bond1.2000.1110: send [DHCPv4 Offer xid=1705fb0e yiaddr=194.12.69.148 siaddr=194.12.64.1 chaddr=00:24:8c:e4:05:17 <Message-Type Offer> <Server-ID 194.12.64.1> <Lease-Time 300> < [2013-09-05 10:13:59]: info: bond1.2000.1110: recv [DHCPv4 relay Offer xid=1705fb0e yiaddr=194.12.69.148 giaddr=10.200.0.100 chaddr=00:24:8c:e4:05:17 <Message-Type Offer> <Server-ID 10.201.0.1> <Lease-Time [2013-09-05 10:13:59]: info: bond1.2000.1110: send [DHCPv4 Offer xid=1705fb0e yiaddr=194.12.69.148 siaddr=194.12.64.1 chaddr=00:24:8c:e4:05:17 <Message-Type Offer> <Server-ID 194.12.64.1> <Lease-Time 300> < [2013-09-05 10:13:59]: info: bond1.2000.1110: recv [DHCPv4 Request xid=1705fb0e chaddr=00:24:8c:e4:05:17 <Message-Type Request> <Request-IP 194.12.69.148> <Server-ID 194.12.64.1> <Client-ID 0100248ce40517> [2013-09-05 10:13:59]: info: bond1.2000.1110: send [DHCPv4 relay Request xid=1705fb0e giaddr=10.200.0.100 chaddr=00:24:8c:e4:05:17 <Message-Type Request> <Request-IP 194.12.69.148> <Server-ID 10.201.0.1> <C [2013-09-05 10:13:59]: info: bond1.2000.1110: recv [DHCPv4 relay Offer xid=1705fb0e yiaddr=194.12.69.148 giaddr=10.200.0.100 chaddr=00:24:8c:e4:05:17 <Message-Type Offer> <Server-ID 10.201.0.1> <Lease-Time [2013-09-05 10:13:59]: info: bond1.2000.1110: send [DHCPv4 Offer xid=1705fb0e yiaddr=194.12.69.148 siaddr=194.12.64.1 chaddr=00:24:8c:e4:05:17 <Message-Type Offer> <Server-ID 194.12.64.1> <Lease-Time 300> < [2013-09-05 10:13:59]: info: bond1.2000.1110: recv [DHCPv4 relay Offer xid=1705fb0e yiaddr=194.12.69.148 giaddr=10.200.0.100 chaddr=00:24:8c:e4:05:17 <Message-Type Offer> <Server-ID 10.201.0.1> <Lease-Time [2013-09-05 10:13:59]: info: bond1.2000.1110: send [DHCPv4 Offer xid=1705fb0e yiaddr=194.12.69.148 siaddr=194.12.64.1 chaddr=00:24:8c:e4:05:17 <Message-Type Offer> <Server-ID 194.12.64.1> <Lease-Time 300> < [2013-09-05 10:13:59]: info: bond1.2000.1110: recv [DHCPv4 relay Ack xid=1705fb0e yiaddr=194.12.69.148 giaddr=10.200.0.100 chaddr=00:24:8c:e4:05:17 <Message-Type Ack> <Server-ID 10.201.0.1> <Lease-Time 300> [2013-09-05 10:13:59]: info: bond1.2000.1110: send [DHCPv4 Ack xid=1705fb0e yiaddr=194.12.69.148 chaddr=00:24:8c:e4:05:17 <Message-Type Ack> <Server-ID 194.12.64.1> <Lease-Time 300> <Router 194.12.64.1> <Su Дамп проблемного клиента, странные пачки ответов. [root@ipoe1 accel-ppp]# tcpdump -nni bond1.2000.1110 -p port 67 or port 68 tcpdump: WARNING: bond1.2000.1110: no IPv4 address assigned tcpdump: verbose output suppressed, use -v or -vv for full protocol decode listening on bond1.2000.1110, link-type EN10MB (Ethernet), capture size 65535 bytes 10:17:02.738489 IP 0.0.0.0.68 > 255.255.255.255.67: BOOTP/DHCP, Request from 00:24:8c:e4:05:17, length 548 10:17:02.744225 IP 194.12.64.1.67 > 194.12.69.148.68: BOOTP/DHCP, Reply, length 330 10:17:02.746029 IP 194.12.64.1.67 > 194.12.69.148.68: BOOTP/DHCP, Reply, length 330 10:17:02.747614 IP 194.12.64.1.67 > 194.12.69.148.68: BOOTP/DHCP, Reply, length 330 10:17:02.749495 IP 194.12.64.1.67 > 194.12.69.148.68: BOOTP/DHCP, Reply, length 330 10:17:02.751373 IP 194.12.64.1.67 > 194.12.69.148.68: BOOTP/DHCP, Reply, length 330 10:17:02.751746 IP 0.0.0.0.68 > 255.255.255.255.67: BOOTP/DHCP, Request from 00:24:8c:e4:05:17, length 548 10:17:02.753175 IP 194.12.64.1.67 > 194.12.69.148.68: BOOTP/DHCP, Reply, length 330 10:17:02.756049 IP 194.12.64.1.67 > 194.12.69.148.68: BOOTP/DHCP, Reply, length 330 10:17:02.758562 IP 194.12.64.1.67 > 194.12.69.148.68: BOOTP/DHCP, Reply, length 330 10:17:02.759837 IP 0.0.0.0.68 > 255.255.255.255.67: BOOTP/DHCP, Request from 00:24:8c:e4:05:17, length 548 10:17:02.766792 IP 194.12.64.1.67 > 194.12.69.148.68: BOOTP/DHCP, Reply, length 330 10:17:02.769445 IP 194.12.64.1.67 > 194.12.69.148.68: BOOTP/DHCP, Reply, length 330 10:17:02.770860 IP 194.12.64.1.67 > 194.12.69.148.68: BOOTP/DHCP, Reply, length 330 10:17:02.772547 IP 194.12.64.1.67 > 194.12.69.148.68: BOOTP/DHCP, Reply, length 330 10:17:02.774404 IP 0.0.0.0.68 > 255.255.255.255.67: BOOTP/DHCP, Request from 00:24:8c:e4:05:17, length 548 10:17:02.774704 IP 194.12.64.1.67 > 194.12.69.148.68: BOOTP/DHCP, Reply, length 330 10:17:02.776499 IP 194.12.64.1.67 > 194.12.69.148.68: BOOTP/DHCP, Reply, length 330 10:17:02.778598 IP 194.12.64.1.67 > 194.12.69.148.68: BOOTP/DHCP, Reply, length 330 10:17:02.780526 IP 194.12.64.1.67 > 194.12.69.148.68: BOOTP/DHCP, Reply, length 330 10:17:02.782452 IP 0.0.0.0.68 > 255.255.255.255.67: BOOTP/DHCP, Request from 00:24:8c:e4:05:17, length 548 10:17:02.788617 IP 194.12.64.1.67 > 194.12.69.148.68: BOOTP/DHCP, Reply, length 330 10:17:02.790972 IP 194.12.64.1.67 > 194.12.69.148.68: BOOTP/DHCP, Reply, length 330 10:17:02.792943 IP 194.12.64.1.67 > 194.12.69.148.68: BOOTP/DHCP, Reply, length 330 10:17:02.794400 IP 194.12.64.1.67 > 194.12.69.148.68: BOOTP/DHCP, Reply, length 330 10:17:02.796004 IP 194.12.64.1.67 > 194.12.69.148.68: BOOTP/DHCP, Reply, length 330 10:17:02.796461 IP 0.0.0.0.68 > 255.255.255.255.67: BOOTP/DHCP, Request from 00:24:8c:e4:05:17, length 548 10:17:02.798371 IP 194.12.64.1.67 > 194.12.69.148.68: BOOTP/DHCP, Reply, length 330 10:17:02.800656 IP 194.12.64.1.67 > 194.12.69.148.68: BOOTP/DHCP, Reply, length 330 10:17:02.803033 IP 194.12.64.1.67 > 194.12.69.148.68: BOOTP/DHCP, Reply, length 330 10:17:02.804481 IP 0.0.0.0.68 > 255.255.255.255.67: BOOTP/DHCP, Request from 00:24:8c:e4:05:17, length 548 10:17:02.804716 IP 194.12.64.1.67 > 194.12.69.148.68: BOOTP/DHCP, Reply, length 330 10:17:02.811599 IP 194.12.64.1.67 > 194.12.69.148.68: BOOTP/DHCP, Reply, length 330 10:17:02.812976 IP 194.12.64.1.67 > 194.12.69.148.68: BOOTP/DHCP, Reply, length 330 10:17:02.815120 IP 194.12.64.1.67 > 194.12.69.148.68: BOOTP/DHCP, Reply, length 330 10:17:02.816604 IP 194.12.64.1.67 > 194.12.69.148.68: BOOTP/DHCP, Reply, length 330 10:17:02.818155 IP 194.12.64.1.67 > 194.12.69.148.68: BOOTP/DHCP, Reply, length 330 Этот же клиент мгновенно авторизировался после рестарта сервиса. Изменено 6 сентября, 2013 пользователем kayot Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
xeb Опубликовано 5 сентября, 2013 · Жалоба глянь tcpdump'ом интерфейс к вышестроящему дхцп, либо он шлёт пакеты без запросов, либо accel-ppp где-то циклится Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
kayot Опубликовано 5 сентября, 2013 (изменено) · Жалоба В обычном режиме никаких лишних запросов и пакетов нет. Такая ситуация возникла именно после нескольких тестовых reload'ов и последующих проблем у релея. Да и dhcp там самописный на perl, он вылизан и разве что помереть может и совсем не отвечать. Изменено 5 сентября, 2013 пользователем kayot Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
xeb Опубликовано 5 сентября, 2013 · Жалоба пробуй последний комит Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
kayot Опубликовано 5 сентября, 2013 (изменено) · Жалоба На тестовом сервер собрал, запустил. Раз 50 делал reload - все ок. Но тут ведь какое дело, то что легко вылазит на боевом сервере с 200 реальными юзерами и трафиком, фиг когда повторишь на тесте с 1-2 сессиями.. UPD: Дернул еще несколько десятков раз (accel-cmd reload) и получил краш с автоперезапуском. При 1 клиентской сессии активной. Сессия так и висит, но сервер глючит [root@ipoetest tmp]# accel-cmd show sessions ifname | username | calling-sid | ip | type | comp | state | uptime ---------------+----------+-------------------+-------------+------+------+--------+---------- eth0.999.2003 | 999.2003 | 50:46:5d:4e:b5:72 | 194.12.94.3 | ipoe | | active | 00:10:46 Корка (gdb) backtrace #0 0x00007f0ca35eb8e5 in raise () from /lib64/libc.so.6 #1 0x00007f0ca35ed0c5 in abort () from /lib64/libc.so.6 #2 0x0000000000422adf in sigsegv (num=11) at /usr/src/accel-ppp/accel-pppd/main.c:236 #3 <signal handler called> #4 0x00007f0ca437c220 in pthread_mutex_lock () from /lib64/libpthread.so.0 #5 0x00007f0ca479cc19 in triton_context_call (ud=0x7f0c9c001940, func=0x7f0ca1dedecc <ipoe_recv_dhcpv4_relay>, arg=0x7f0c9c007228) at /usr/src/accel-ppp/accel-pppd/triton/triton.c:477 #6 0x00007f0ca1df33c9 in dhcpv4_relay_read (h=0xb0dba0) at /usr/src/accel-ppp/accel-pppd/ctrl/ipoe/dhcpv4.c:540 #7 0x00007f0ca479c0ef in ctx_thread (ctx=0xb0dbf8) at /usr/src/accel-ppp/accel-pppd/triton/triton.c:210 #8 0x00007f0ca479bebe in triton_thread (thread=0x7f0c9c012080) at /usr/src/accel-ppp/accel-pppd/triton/triton.c:159 #9 0x00007f0ca437a851 in start_thread () from /lib64/libpthread.so.0 #10 0x00007f0ca36a194d in clone () from /lib64/libc.so.6 Полный лог событий, видны множественные ответы. Дамп этого клиента после краша [root@ipoetest accel-ppp]# tcpdump -nni eth0.999.2003 -p port 67 or port 68 tcpdump: WARNING: eth0.999.2003: no IPv4 address assigned tcpdump: verbose output suppressed, use -v or -vv for full protocol decode listening on eth0.999.2003, link-type EN10MB (Ethernet), capture size 65535 bytes 22:29:30.246308 IP 194.12.94.3.68 > 194.12.64.1.67: BOOTP/DHCP, Request from 50:46:5d:4e:b5:72, length 300 22:29:30.249672 IP 194.12.64.1.67 > 194.12.94.3.68: BOOTP/DHCP, Reply, length 334 22:29:30.249785 IP 194.12.64.1.67 > 194.12.94.3.68: BOOTP/DHCP, Reply, length 334 ...штук 100 повторов.. 22:29:30.250054 IP 194.12.64.1.67 > 194.12.94.3.68: BOOTP/DHCP, Reply, length 334 22:29:30.266276 IP 194.12.64.1.67 > 194.12.94.3.68: BOOTP/DHCP, Reply, length 334 После терминейта клиент переполучил ip нормально, но продление лизы все так же множится(в конце лога). И похоже величина размножения(где-то в 100 раз нынче) равна чиcлу вызовов reload. Да, по команде accel-cmd shutdown сдох разве что модуль управления. В процессах сервис так и остался висеть [root@ipoetest accel-ppp]# accel-cmd shutdown [root@ipoetest accel-ppp]# ps ax | grep accel 2669 ? Ssl 0:01 /usr/local/sbin/accel-pppd -c /etc/accel-ppp.conf -d --dump /tmp -p /var/run/accel-pppd.pid --internal 3502 pts/1 S+ 0:00 grep accel [root@ipoetest accel-ppp]# accel-cmd show stat Connection to "localhost:2001" failed Изменено 5 сентября, 2013 пользователем kayot Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...