heap Опубликовано 16 ноября, 2009 · Жалоба Если делаю echo "test" > /dev/console - тож проходит. А вот сообщения ядра не видать. Пробовал и модули грузить пустышки с месседжами, и с бондингами крутил операции. В dmesg есть, а в том файлике не видать. Возможно неверно прооперировал вывод на ttyS0?# dmesg -n7 ? Если я все верно понял - суть проблемы заключается в том, что современные быстрые процессоры лопатят трафик быстрее, чем адаптеры и при определенном стечении обстоятельств возникает подобный коллапс под нагрузкой.И всеравно это вызвано или глючным адаптером (когда там последний раз в открытом доступе были errata по сетевым на чипах Broadcom? сдается мне, никогда), или драйвером (что тоже не мудрено, учитывая что спецификаций нормальных нет), или более фундаментальной проблемой вроде "We might have a race in napi_schedule()". С последним вообще что-либо сделать нормальному человеку нереально кроме как заменить ядро. Надо искать рабочую комбинацию драйвера/ядра или вообще поменять адаптер. # dmesg -n7 глухо и тихо По поводу сетевых - попробовал отрубить tso и gso. Будем посмотреть. Может чего поинтереснее удастся поймать на нуль-модеме. Да и Бродком в конце-концов не реалтек. И дрова вроде пишут сами (по крайней мере на сайте их выложены дрова, которые еще не компилятся на 2.6.31, а в modinfo bnx2 - указан девелопер с бродкома). # modinfo bnx2 filename: /lib/modules/2.6.31-14-server/kernel/drivers/net/bnx2.ko firmware: bnx2/bnx2-rv2p-09-4.6.15.fw firmware: bnx2/bnx2-mips-09-4.6.17.fw firmware: bnx2/bnx2-rv2p-06-4.6.16.fw firmware: bnx2/bnx2-mips-06-4.6.16.fw version: 2.0.1 license: GPL description: Broadcom NetXtreme II BCM5706/5708/5709/5716 Driver author: Michael Chan <mchan@broadcom.com> srcversion: 918569794082672E30BDDC3 alias: pci:v000014E4d0000163Csv*sd*bc*sc*i* alias: pci:v000014E4d0000163Bsv*sd*bc*sc*i* alias: pci:v000014E4d0000163Asv*sd*bc*sc*i* alias: pci:v000014E4d00001639sv*sd*bc*sc*i* alias: pci:v000014E4d000016ACsv*sd*bc*sc*i* alias: pci:v000014E4d000016AAsv*sd*bc*sc*i* alias: pci:v000014E4d000016AAsv0000103Csd00003102bc*sc*i* alias: pci:v000014E4d0000164Csv*sd*bc*sc*i* alias: pci:v000014E4d0000164Asv*sd*bc*sc*i* alias: pci:v000014E4d0000164Asv0000103Csd00003106bc*sc*i* alias: pci:v000014E4d0000164Asv0000103Csd00003101bc*sc*i* depends: vermagic: 2.6.31-14-server SMP mod_unload modversions parm: disable_msi:Disable Message Signaled Interrupt (MSI) (int) Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
vitalyb Опубликовано 16 ноября, 2009 · Жалоба dmesg -n7 глухо и тихопосле этого в сериальную консоль должны падать все сообщения, если ядро было загружено с сериальной консолью, конечно. По поводу сетевых - попробовал отрубить tso и gsoкстати попробуйте еще отключить pause/flowcontrol если включено дрова вроде пишут сами... что ограничивает доступ к разработке другим программистам, без NDA :) Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
heap Опубликовано 16 ноября, 2009 · Жалоба dmesg -n7 глухо и тихопосле этого в сериальную консоль должны падать все сообщения, если ядро было загружено с сериальной консолью, конечно. По поводу сетевых - попробовал отрубить tso и gsoкстати попробуйте еще отключить pause/flowcontrol если включено дрова вроде пишут сами... что ограничивает доступ к разработке другим программистам, без NDA :) Pause отключен, и насколько помнится по дефолту тут отключен. На 2.6.24 отключал руками. Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
EvilShadow Опубликовано 20 ноября, 2009 · Жалоба Итак, после двух недель нормальной работы - два кернель паника за два дня. Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
heap Опубликовано 20 ноября, 2009 · Жалоба Итак, после двух недель нормальной работы - два кернель паника за два дня. А паники в студию? Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
EvilShadow Опубликовано 20 ноября, 2009 · Жалоба Не будет в студию, virt-manager не захотел показывать консоль полностью, а логи ядра, скидываемые с серваков на отдельную машину, пусты. Очевидно, сеть отваливается полностью. Собрал последнюю ревизию из git'а, ждем... Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
EvilShadow Опубликовано 20 ноября, 2009 · Жалоба Вот и дождались. На последней гитовской ревизии: Nov 20 11:12:47 ac1 kernel [570954.700234] INFO: task pppd:15562 blocked for more than 120 seconds. Nov 20 11:12:47 ac1 kernel [570954.701936] "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message. Nov 20 11:12:47 ac1 kernel [570954.704366] pppd D cba9c6ac 0 15562 15561 Nov 20 11:12:47 ac1 kernel [570954.705472] df9129a0 00000046 bb6fce72 cba9c6ac 6c0f54aa 00020729 df912b2c 0a22ab57 Nov 20 11:12:47 ac1 kernel [570954.707552] 00000000 7fffffff de535ea8 de535e84 00000002 c02a64ab cba9c6ac c9681cac Nov 20 11:12:47 ac1 kernel [570954.710805] 6c2d2800 00020729 c0343e74 00000292 00000292 00000000 c9681c00 ca5b0b4a Nov 20 11:12:47 ac1 kernel [570954.713843] Call Trace: Nov 20 11:12:47 ac1 kernel [570954.715487] [<c02a64ab>] schedule_timeout+0x13/0x86 Nov 20 11:12:47 ac1 kernel [570954.715939] [<c02a5f2f>] wait_for_common+0xa3/0xfd Nov 20 11:12:47 ac1 kernel [570954.717177] [<c01171c7>] default_wake_function+0x0/0x5 Nov 20 11:12:50 ac1 kernel [570954.723086] [<c01273af>] flush_cpu_workqueue+0x5f/0x67 Nov 20 11:12:50 ac1 kernel [570954.723593] [<c01274c8>] wq_barrier_func+0x0/0x8 Nov 20 11:12:50 ac1 kernel [570954.725703] [<c0210a38>] release_dev+0x39f/0x4bc Nov 20 11:12:50 ac1 kernel [570954.726134] [<c012bb0f>] enqueue_hrtimer+0xc9/0xd4 Nov 20 11:12:50 ac1 kernel [570954.726564] [<c0118ca8>] hrtick_set+0x69/0xb9 Nov 20 11:12:50 ac1 kernel [570954.729121] [<c0210b5c>] tty_release+0x7/0xa Nov 20 11:12:50 ac1 kernel [570954.730073] [<c016673b>] __fput+0x88/0x12f Nov 20 11:12:50 ac1 kernel [570954.731759] [<c016417b>] filp_close+0x4d/0x53 Nov 20 11:12:50 ac1 kernel [570954.733617] [<c011d144>] put_files_struct+0x5f/0xa7 Nov 20 11:12:50 ac1 kernel [570954.736016] [<c011e0ff>] do_exit+0x1e0/0x586 Nov 20 11:12:59 ac1 kernel [570954.737912] [<c011e4f7>] do_group_exit+0x52/0x78 Nov 20 11:12:59 ac1 kernel [570954.741648] [<c011e52a>] sys_exit_group+0xd/0x10 Nov 20 11:12:59 ac1 kernel [570954.742969] [<c010372f>] sysenter_past_esp+0x78/0xb9 Nov 20 11:12:59 ac1 kernel [570954.743778] ======================= Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
heap Опубликовано 20 ноября, 2009 · Жалоба Вот и дождались. На последней гитовской ревизии: Nov 20 11:12:47 ac1 kernel [570954.700234] INFO: task pppd:15562 blocked for more than 120 seconds. Nov 20 11:12:47 ac1 kernel [570954.701936] "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message. Nov 20 11:12:47 ac1 kernel [570954.704366] pppd D cba9c6ac 0 15562 15561 Nov 20 11:12:47 ac1 kernel [570954.705472] df9129a0 00000046 bb6fce72 cba9c6ac 6c0f54aa 00020729 df912b2c 0a22ab57 Nov 20 11:12:47 ac1 kernel [570954.707552] 00000000 7fffffff de535ea8 de535e84 00000002 c02a64ab cba9c6ac c9681cac Nov 20 11:12:47 ac1 kernel [570954.710805] 6c2d2800 00020729 c0343e74 00000292 00000292 00000000 c9681c00 ca5b0b4a Nov 20 11:12:47 ac1 kernel [570954.713843] Call Trace: Nov 20 11:12:47 ac1 kernel [570954.715487] [<c02a64ab>] schedule_timeout+0x13/0x86 Nov 20 11:12:47 ac1 kernel [570954.715939] [<c02a5f2f>] wait_for_common+0xa3/0xfd Nov 20 11:12:47 ac1 kernel [570954.717177] [<c01171c7>] default_wake_function+0x0/0x5 Nov 20 11:12:50 ac1 kernel [570954.723086] [<c01273af>] flush_cpu_workqueue+0x5f/0x67 Nov 20 11:12:50 ac1 kernel [570954.723593] [<c01274c8>] wq_barrier_func+0x0/0x8 Nov 20 11:12:50 ac1 kernel [570954.725703] [<c0210a38>] release_dev+0x39f/0x4bc Nov 20 11:12:50 ac1 kernel [570954.726134] [<c012bb0f>] enqueue_hrtimer+0xc9/0xd4 Nov 20 11:12:50 ac1 kernel [570954.726564] [<c0118ca8>] hrtick_set+0x69/0xb9 Nov 20 11:12:50 ac1 kernel [570954.729121] [<c0210b5c>] tty_release+0x7/0xa Nov 20 11:12:50 ac1 kernel [570954.730073] [<c016673b>] __fput+0x88/0x12f Nov 20 11:12:50 ac1 kernel [570954.731759] [<c016417b>] filp_close+0x4d/0x53 Nov 20 11:12:50 ac1 kernel [570954.733617] [<c011d144>] put_files_struct+0x5f/0xa7 Nov 20 11:12:50 ac1 kernel [570954.736016] [<c011e0ff>] do_exit+0x1e0/0x586 Nov 20 11:12:59 ac1 kernel [570954.737912] [<c011e4f7>] do_group_exit+0x52/0x78 Nov 20 11:12:59 ac1 kernel [570954.741648] [<c011e52a>] sys_exit_group+0xd/0x10 Nov 20 11:12:59 ac1 kernel [570954.742969] [<c010372f>] sysenter_past_esp+0x78/0xb9 Nov 20 11:12:59 ac1 kernel [570954.743778] ======================= Как знакомо. У меня по-моему про 120 секунд и pppd писалось в Bug: Soft lockup. Как видим трабл есть. Интересно, что скажет xeb. Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
gendolf_gray Опубликовано 22 ноября, 2009 · Жалоба Подскажите пожалуйста возможно ли на CentOS 5.4 i386 держать VPN сервер используя accel-pptp, здесь все запускают его уже на новых ядрах и складывается впечатление, что на 2.6.18 accel-pptp работать не будет. ядро: Linux vpn.example.com 2.6.18-164.6.1.el5 #1 SMP Tue Nov 3 16:18:27 EST 2009 i686 i686 i386 GNU/Linux Я делаю следующее: #yum install kernel-headers kernel-devel gcc #git clone git://accel-pptp.git.sourceforge.net/gitroot/accel-pptp/accel-pptp #cd accel-pptp; make server && make server_install все успешно собирается и устанавливается далее я вижу что pptp модуль лежит в /lib/modules/2.6.18-164.6.1.el5/extra/ но ни modprobe ни modinfo про него ничего не говорят # modprobe pptp FATAL: Module pptp not found. # modinfo pptp modinfo: could not find module pptp # insmod на файл выдает следующее # insmod pptp.ko insmod: error inserting 'pptp.ko': -1 Unknown symbol in module # Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
NiTr0 Опубликовано 22 ноября, 2009 (изменено) · Жалоба depmod сделайте для начала. Кстати, кваггу (если используется) тоже прийдется обновить до 0.99.х. И SNMP пропатчить (если используется), чтобы дропал из статистики отключившиеся интерфейсы. По части стабильности - ничего сказать не могу, на 2.6.18 не запускал. Но ведь никто не мешает собрать свежее ядро ;) Изменено 22 ноября, 2009 пользователем NiTr0 Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
Victor Safronov Опубликовано 23 ноября, 2009 · Жалоба Centos 5.4, 2.6.18, accel-pptp трудится чуть меньше недели, в пике до 400 человек. Пока, тьфу-тьфу, полёт нормальный. Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
gendolf_gray Опубликовано 23 ноября, 2009 (изменено) · Жалоба depmod сделайте для начала.Кстати, кваггу (если используется) тоже прийдется обновить до 0.99.х. И SNMP пропатчить (если используется), чтобы дропал из статистики отключившиеся интерфейсы. По части стабильности - ничего сказать не могу, на 2.6.18 не запускал. Но ведь никто не мешает собрать свежее ядро ;) depmod отработал, далее могу делать modinfo modinfo # modinfo pptp filename: /lib/modules/2.6.18-164.6.1.el5/extra/pptp.ko license: GPL author: Kozlov D. (xeb@mail.ru) description: Point-to-Point Tunneling Protocol for Linux srcversion: 5D2F5FCC34E482AE7F5DF9A depends: pppox,ppp_generic vermagic: 2.6.18-164.6.1.el5 SMP mod_unload 686 REGPARM 4KSTACKS gcc-4.1 parm: log_packets:int parm: log_level:Logging level (default=0) (int) # modprobe # modprobe pptp FATAL: Error inserting pptp (/lib/modules/2.6.18-164.6.1.el5/extra/pptp.ko): Unknown symbol in module, or unknown parameter (see dmesg) # tail /var/log/messages Nov 23 08:05:43 vpn.example.com kernel: pptp: Unknown symbol __you_cannot_kzalloc_that_much Centos 5.4, 2.6.18, accel-pptp трудится чуть меньше недели, в пике до 400 человек. Пока, тьфу-тьфу, полёт нормальный. подскажите какую версию accel-pptp ставили, ядро ведь на CentOS родное? Изменено 23 ноября, 2009 пользователем gendolf_gray Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
gendolf_gray Опубликовано 23 ноября, 2009 · Жалоба я не буду говорить про звезды, видимо это что-то другое с моими руками. Сегодня поднял тестовую виртуалку с CentOS 5.4 64 бита, далее yum update имеющихся пакетов. #yum install kernel-headers kernel-devel gcc #git clone git://accel-pptp.git.sourceforge.net/gitroot/accel-pptp/accel-pptp #cd accel-pptp; make server && make server_install #depmod ; modprobe pptp и модуль удачно загрузился в ядро Nov 23 09:38:45 vpn-test.example.com kernel: PPTP driver version 0.8.4 После чего уже на железном сервер с CentOS 5.4 , но 32бита сделал yum update, обновился ppp до ppp-2.4.4-14.1.rhel5.i386.rpm и далее #yum install kernel-headers kernel-devel gcc #git clone git://accel-pptp.git.sourceforge.net/gitroot/accel-pptp/accel-pptp #cd accel-pptp; make server && make server_install #depmod ; modprobe pptp модуль удачно подгрузился в ядро Nov 23 09:43:12 vpn.example.com kernel: PPTP driver version 0.8.4 Главное в Git ничего не менялось за ночь http://accel-pptp.git.sourceforge.net/git/...-pptp;a=summary Всем спасибо за помощь. Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
injektor Опубликовано 23 ноября, 2009 · Жалоба в секции файла /lib/modules/2.6.30/build/include/linux/swab.h #ifndef _LINUX_SWAB_H #define _LINUX_SWAB_H #include <linux/types.h> #include <linux/compiler.h> #include <asm/swab.h> нужно исправить на #ifndef _LINUX_SWAB_H #define _LINUX_SWAB_H #include <linux/types.h> #include <linux/compiler.h> #include <asm-generic/swab.h> мне не помогло, при изменении он сразу пишет error: asm-generic/swab.h: No such file or directory помогло копирование файла swab.h в asm. Вопрос: при попытки скомпилить SMP версию accel-pptp тут же выдаёт: Building kernel module (cd kernel/driver; make ) make[1]: Entering directory `/home/injektor/accel-pptp/kernel/driver' using "/usr/src/linux" kernel headers make -C /usr/src/linux SUBDIRS=/home/injektor/accel-pptp/kernel/driver modules make[2]: Entering directory `/usr/src/linux-2.6.29' CC [M] /home/injektor/accel-pptp/kernel/driver/pptp.o CC [M] /home/injektor/accel-pptp/kernel/driver/ppp_generic_smp.o /home/injektor/accel-pptp/kernel/driver/ppp_generic_smp.c: In function 'ppp_start_xmit': /home/injektor/accel-pptp/kernel/driver/ppp_generic_smp.c:946: error: 'struct net_device' has no member named 'priv' /home/injektor/accel-pptp/kernel/driver/ppp_generic_smp.c: In function 'ppp_net_ioctl': /home/injektor/accel-pptp/kernel/driver/ppp_generic_smp.c:997: error: 'struct net_device' has no member named 'priv' /home/injektor/accel-pptp/kernel/driver/ppp_generic_smp.c: In function 'ppp_create_interface': /home/injektor/accel-pptp/kernel/driver/ppp_generic_smp.c:2505: error: 'struct net_device' has no member named 'priv' make[3]: *** [/home/injektor/accel-pptp/kernel/driver/ppp_generic_smp.o] Error 1 make[2]: *** [_module_/home/injektor/accel-pptp/kernel/driver] Error 2 make[2]: Leaving directory `/usr/src/linux-2.6.29' make[1]: *** [all] Error 2 make[1]: Leaving directory Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
NiTr0 Опубликовано 23 ноября, 2009 · Жалоба Вопрос: при попытки скомпилить SMP версию accel-pptp Это не SMP версия accel-pptp, это SMP версия ppp.ko - толку от которой фактически нет. Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
Cayz Опубликовано 25 ноября, 2009 · Жалоба Вот и дождались. На последней гитовской ревизии....у меня тоже ( Nov 25 15:39:33 internet kernel: [2388037.252491] BUG: soft lockup - CPU#2 stuck for 61s! [pppd:31206] Nov 25 15:39:33 internet kernel: [2388037.252501] Modules linked in: sch_sfq sch_htb pptp pppox ipt_MASQUERADE ppp_deflate zlib_deflate bsd_comp act_police cls_u32 sch_ingress sch_tbf sha1_generic arc4 ecb ppp_mppe xt_recent ipt_ULOG xt_tcpudp iptable_nat iptable_filter ip_tables x_tables 8021q garp stp nf_nat_pptp nf_conntrack_pptp nf_conntrack_proto_gre nf_nat_proto_gre nf_nat nf_conntrack_ipv4 nf_conntrack nf_defrag_ipv4 snd_pcm snd_timer serio_raw snd soundcore snd_page_alloc psmouse pcspkr i2c_i801 i5100_edac edac_core raid1 pata_it8213 igb dca mptsas floppy mptscsih mptbase scsi_transport_sas [last unloaded: e1000e] Nov 25 15:39:33 internet kernel: [2388037.252501] CPU 2: Nov 25 15:39:33 internet kernel: [2388037.252501] Modules linked in: sch_sfq sch_htb pptp pppox ipt_MASQUERADE ppp_deflate zlib_deflate bsd_comp act_police cls_u32 sch_ingress sch_tbf sha1_generic arc4 ecb ppp_mppe xt_recent ipt_ULOG xt_tcpudp iptable_nat iptable_filter ip_tables x_tables 8021q garp stp nf_nat_pptp nf_conntrack_pptp nf_conntrack_proto_gre nf_nat_proto_gre nf_nat nf_conntrack_ipv4 nf_conntrack nf_defrag_ipv4 snd_pcm snd_timer serio_raw snd soundcore snd_page_alloc psmouse pcspkr i2c_i801 i5100_edac edac_core raid1 pata_it8213 igb dca mptsas floppy mptscsih mptbase scsi_transport_sas [last unloaded: e1000e] Nov 25 15:39:33 internet kernel: [2388037.252501] Pid: 31206, comm: pppd Not tainted 2.6.31-02063103-generic #02063103 X7DCL Nov 25 15:39:33 internet kernel: [2388037.252501] RIP: 0010:[<ffffffff81032514>] [<ffffffff81032514>] __ticket_spin_lock+0x14/0x20 Nov 25 15:39:33 internet kernel: [2388037.252501] RSP: 0018:ffff88019687bbb8 EFLAGS: 00000297 Nov 25 15:39:33 internet kernel: [2388037.252501] RAX: 0000000000001211 RBX: ffff88019687bbb8 RCX: 0200000000000081 Nov 25 15:39:33 internet kernel: [2388037.252501] RDX: 00000000000005dc RSI: 0000000000000002 RDI: ffff8802090a6e90 Nov 25 15:39:33 internet kernel: [2388037.252501] RBP: ffffffff81012b2e R08: 0000000000000000 R09: ffffffff8177f490 Nov 25 15:39:33 internet kernel: [2388037.252501] R10: 0000000000000000 R11: 0000000000000049 R12: ffff88019687bb78 Nov 25 15:39:33 internet kernel: [2388037.252501] R13: ffff880100000000 R14: 0000000000000df4 R15: ffff88019687bb98 Nov 25 15:39:33 internet kernel: [2388037.252501] FS: 00007ff7363186e0(0000) GS:ffff88002806e000(0000) knlGS:0000000000000000 Nov 25 15:39:33 internet kernel: [2388037.252501] CS: 0010 DS: 0000 ES: 0000 CR0: 000000008005003b Nov 25 15:39:33 internet kernel: [2388037.252501] CR2: 000000000064b828 CR3: 0000000115ce5000 CR4: 00000000000006a0 Nov 25 15:39:33 internet kernel: [2388037.252501] DR0: 0000000000000000 DR1: 0000000000000000 DR2: 0000000000000000 Nov 25 15:39:33 internet kernel: [2388037.252501] DR3: 0000000000000000 DR6: 00000000ffff0ff0 DR7: 0000000000000400 Nov 25 15:39:33 internet kernel: [2388037.252501] Call Trace: Nov 25 15:39:33 internet kernel: [2388037.252501] [<ffffffff8140d050>] ? kfree_skbmem+0x30/0x80 Nov 25 15:39:33 internet kernel: [2388037.252501] [<ffffffff81506239>] ? _spin_lock_bh+0x19/0x30 Nov 25 15:39:33 internet kernel: [2388037.252501] [<ffffffff8137ce6c>] ? ppp_push+0x4c/0xd0 Nov 25 15:39:33 internet kernel: [2388037.252501] [<ffffffff8137f495>] ? ppp_send_frame+0x3e5/0x4c0 Nov 25 15:39:33 internet kernel: [2388037.252501] [<ffffffff8137f5cf>] ? ppp_xmit_process+0x5f/0xc0 Nov 25 15:39:33 internet kernel: [2388037.252501] [<ffffffff8137f849>] ? ppp_start_xmit+0x149/0x1b0 Nov 25 15:39:33 internet kernel: [2388037.252501] [<ffffffff81416ba8>] ? dev_hard_start_xmit+0x158/0x1c0 Nov 25 15:39:33 internet kernel: [2388037.252501] [<ffffffff8142ece1>] ? __qdisc_run+0x1a1/0x230 Nov 25 15:39:33 internet kernel: [2388037.252501] [<ffffffff814186e8>] ? dev_queue_xmit+0x238/0x310 Nov 25 15:39:33 internet kernel: [2388037.252501] [<ffffffff81448384>] ? ip_finish_output+0x1e4/0x2f0 Nov 25 15:39:33 internet kernel: [2388037.252501] [<ffffffff81448519>] ? ip_output+0x89/0xd0 Nov 25 15:39:33 internet kernel: [2388037.252501] [<ffffffff81447530>] ? ip_local_out+0x20/0x30 Nov 25 15:39:33 internet kernel: [2388037.252501] [<ffffffffa015937b>] ? pptp_xmit+0x40b/0x55c [pptp] Nov 25 15:39:33 internet kernel: [2388037.252501] [<ffffffff8137f676>] ? ppp_channel_push+0x46/0xb0 Nov 25 15:39:33 internet kernel: [2388037.252501] [<ffffffff8137f988>] ? ppp_write+0xd8/0xf0 Nov 25 15:39:33 internet kernel: [2388037.252501] [<ffffffff81117d07>] ? vfs_write+0xc7/0x1a0 Nov 25 15:39:33 internet kernel: [2388037.252501] [<ffffffff81117ed0>] ? sys_write+0x50/0x90 Nov 25 15:39:33 internet kernel: [2388037.252501] [<ffffffff81011f82>] ? system_call_fastpath+0x16/0x1b Nov 25 15:39:55 internet kernel: [2388059.821289] INFO: task pppd:26189 blocked for more than 120 seconds. Nov 25 15:39:55 internet kernel: [2388059.821327] "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message. Nov 25 15:39:55 internet kernel: [2388059.821379] pppd D 0000000000000003 0 26189 26188 0x00000004 Nov 25 15:39:55 internet kernel: [2388059.821418] ffff88001fc8fd78 0000000000000082 ffff88001fc8fd58 0000000000015580 Nov 25 15:39:55 internet kernel: [2388059.821476] 0000000000015580 0000000000015580 0000000000015580 ffff88007d603110 Nov 25 15:39:55 internet kernel: [2388059.821534] ffff88007d602d60 ffff8802170b96b0 ffff88007d603110 ffffffff817de024 Nov 25 15:39:55 internet kernel: [2388059.821592] Call Trace: Nov 25 15:39:55 internet kernel: [2388059.821624] [<ffffffff81504e36>] __mutex_lock_slowpath+0xd6/0x160 Nov 25 15:39:55 internet kernel: [2388059.821658] [<ffffffff81504cb6>] mutex_lock+0x26/0x50 Nov 25 15:39:55 internet kernel: [2388059.821692] [<ffffffff81423610>] rtnl_lock+0x10/0x20 Nov 25 15:39:55 internet kernel: [2388059.821723] [<ffffffff8141b5b5>] dev_ioctl+0x245/0x2c0 Nov 25 15:39:55 internet kernel: [2388059.821756] [<ffffffff814068bd>] sock_ioctl+0xed/0x270 Nov 25 15:39:55 internet kernel: [2388059.821789] [<ffffffff81126281>] vfs_ioctl+0x31/0x90 Nov 25 15:39:55 internet kernel: [2388059.821821] [<ffffffff8112647d>] do_vfs_ioctl+0x6d/0x1f0 Nov 25 15:39:55 internet kernel: [2388059.821852] [<ffffffff81126682>] sys_ioctl+0x82/0xa0 Nov 25 15:39:55 internet kernel: [2388059.821886] [<ffffffff81011f82>] system_call_fastpath+0x16/0x1b Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
heap Опубликовано 26 ноября, 2009 · Жалоба у меня тоже ( Надо с этим что-то делать. Ибо не феншуй. Как-то xeb не вовремя запропостился. :( Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
xeb Опубликовано 26 ноября, 2009 · Жалоба похоже получилась петля, каким образом и как избавиться я пока думаю ... Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
heap Опубликовано 26 ноября, 2009 · Жалоба похоже получилась петля, каким образом и как избавиться я пока думаю ... А можно поподробнее - что имелось ввиду под петлей? Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
xeb Опубликовано 26 ноября, 2009 · Жалоба pppd отправляет какой-то пакет через интерфейс pppX, пакет проходит ppp_generic обработку, здесь skbuf блокируется(spin_lock_bh), дальше pptp инкапсуляция, ipfilter и опять попадает на интерфейс pppX, где заблокированный skbuf пытаются еще раз заблокировать и естественно здесь проц зависает в бесконечном цикле, вот как-то так Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
sfstudio Опубликовано 26 ноября, 2009 · Жалоба pppd отправляет какой-то пакет через интерфейс pppX, пакет проходит ppp_generic обработку, здесь skbuf блокируется(spin_lock_bh), дальше pptp инкапсуляция, ipfilter и опять попадает на интерфейс pppX, где заблокированный skbuf пытаются еще раз заблокировать и естественно здесь проц зависает в бесконечном цикле, вот как-то так Я когда-то уже описывал такую ситуацию, повторяемость 100% на корбине. Дык вот разбор полётов показал что проблема в том что на адреса eth0 интерфейса их сервера и localip в pptpd.conf у них совпадает и равен например 88.88.88.88 (на самом деле там не линукс но смысл думаю ясен). В итоге при коннекте добавляется маршрут до подсети с этим самым 88.88.88.88 который внутри туннеля и ессно, что весь трафик который должен был идти через eth0 клиента до eth0 сервера идёт с eth0 клиента на pppX сервера отчего у клиента сносит крышу, буквально за несколько минут заполняется вся память сжирает проц и либо наглухо виснет либо... Дык вот со стороны клиента проблема решается добавлением маршрута до сервера ip route add 88.88.88.88 dev eth0 и всё. Тут похоже тоже самое только кто-то из клиентов что-то такое делает что на сервере образуется петля. Для повторения можете приконнектиться на vpn.corbina.ru логин и пароль corbina и всё сами увидите. Причём без разницы будет это acell или юзерспэйсный pptp, точнее разница только в том как бустро он хлопнется =) Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
vitalyb Опубликовано 26 ноября, 2009 · Жалоба Как вариант, клиент попытался устроить "туннель в туннеле". Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
heap Опубликовано 26 ноября, 2009 · Жалоба Как вариант, клиент попытался устроить "туннель в туннеле". Эм. Поподробнее - каким образом устроить туннель в туннеле? Какой из наиболее накуренных клиентов будет это проворачивать? Второй вопрос по посту с корбиной. То что сервер выдает какие-то косяки - это одна тема. Но как клиент может внести такую нестыковку, если pppd сам навешивает настройки (по радиусу или по файлам конфигурации). Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
martin74 Опубликовано 26 ноября, 2009 · Жалоба Ну почему сразу накуренный? vpn до провайдера - получил инет, впн на работу - попал в локалку своей конторы.... Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
vitalyb Опубликовано 26 ноября, 2009 · Жалоба Какой из наиболее накуренных клиентов будет это проворачивать?Да мало ли сколько не менее накуреных SOHO роутеров существует... Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...