Перейти к содержимому
Калькуляторы
Если делаю echo "test" > /dev/console - тож проходит. А вот сообщения ядра не видать. Пробовал и модули грузить пустышки с месседжами, и с бондингами крутил операции. В dmesg есть, а в том файлике не видать. Возможно неверно прооперировал вывод на ttyS0?
# dmesg -n7 ?

 

Если я все верно понял - суть проблемы заключается в том, что современные быстрые процессоры лопатят трафик быстрее, чем адаптеры и при определенном стечении обстоятельств возникает подобный коллапс под нагрузкой.
И всеравно это вызвано или глючным адаптером (когда там последний раз в открытом доступе были errata по сетевым на чипах Broadcom? сдается мне, никогда), или драйвером (что тоже не мудрено, учитывая что спецификаций нормальных нет), или более фундаментальной проблемой вроде "We might have a race in napi_schedule()". С последним вообще что-либо сделать нормальному человеку нереально кроме как заменить ядро.

 

Надо искать рабочую комбинацию драйвера/ядра или вообще поменять адаптер.

# dmesg -n7 глухо и тихо

 

По поводу сетевых - попробовал отрубить tso и gso. Будем посмотреть. Может чего поинтереснее удастся поймать на нуль-модеме. Да и Бродком в конце-концов не реалтек. И дрова вроде пишут сами (по крайней мере на сайте их выложены дрова, которые еще не компилятся на 2.6.31, а в modinfo bnx2 - указан девелопер с бродкома).

# modinfo bnx2
filename:       /lib/modules/2.6.31-14-server/kernel/drivers/net/bnx2.ko
firmware:       bnx2/bnx2-rv2p-09-4.6.15.fw
firmware:       bnx2/bnx2-mips-09-4.6.17.fw
firmware:       bnx2/bnx2-rv2p-06-4.6.16.fw
firmware:       bnx2/bnx2-mips-06-4.6.16.fw
version:        2.0.1
license:        GPL
description:    Broadcom NetXtreme II BCM5706/5708/5709/5716 Driver
author:         Michael Chan <mchan@broadcom.com>
srcversion:     918569794082672E30BDDC3
alias:          pci:v000014E4d0000163Csv*sd*bc*sc*i*
alias:          pci:v000014E4d0000163Bsv*sd*bc*sc*i*
alias:          pci:v000014E4d0000163Asv*sd*bc*sc*i*
alias:          pci:v000014E4d00001639sv*sd*bc*sc*i*
alias:          pci:v000014E4d000016ACsv*sd*bc*sc*i*
alias:          pci:v000014E4d000016AAsv*sd*bc*sc*i*
alias:          pci:v000014E4d000016AAsv0000103Csd00003102bc*sc*i*
alias:          pci:v000014E4d0000164Csv*sd*bc*sc*i*
alias:          pci:v000014E4d0000164Asv*sd*bc*sc*i*
alias:          pci:v000014E4d0000164Asv0000103Csd00003106bc*sc*i*
alias:          pci:v000014E4d0000164Asv0000103Csd00003101bc*sc*i*
depends:        
vermagic:       2.6.31-14-server SMP mod_unload modversions 
parm:           disable_msi:Disable Message Signaled Interrupt (MSI) (int)

 

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

dmesg -n7 глухо и тихо
после этого в сериальную консоль должны падать все сообщения, если ядро было загружено с сериальной консолью, конечно.

 

По поводу сетевых - попробовал отрубить tso и gso
кстати попробуйте еще отключить pause/flowcontrol если включено

 

дрова вроде пишут сами
... что ограничивает доступ к разработке другим программистам, без NDA :)

 

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

dmesg -n7 глухо и тихо
после этого в сериальную консоль должны падать все сообщения, если ядро было загружено с сериальной консолью, конечно.

 

По поводу сетевых - попробовал отрубить tso и gso
кстати попробуйте еще отключить pause/flowcontrol если включено

 

дрова вроде пишут сами
... что ограничивает доступ к разработке другим программистам, без NDA :)

Pause отключен, и насколько помнится по дефолту тут отключен. На 2.6.24 отключал руками.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Итак, после двух недель нормальной работы - два кернель паника за два дня.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Итак, после двух недель нормальной работы - два кернель паника за два дня.

А паники в студию?

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Не будет в студию, virt-manager не захотел показывать консоль полностью, а логи ядра, скидываемые с серваков на отдельную машину, пусты. Очевидно, сеть отваливается полностью.

Собрал последнюю ревизию из git'а, ждем...

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Вот и дождались. На последней гитовской ревизии:

Nov 20 11:12:47 ac1 kernel [570954.700234] INFO: task pppd:15562 blocked for more than 120 seconds.
Nov 20 11:12:47 ac1 kernel [570954.701936] "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message.
Nov 20 11:12:47 ac1 kernel [570954.704366] pppd          D cba9c6ac     0 15562  15561
Nov 20 11:12:47 ac1 kernel [570954.705472]        df9129a0 00000046 bb6fce72 cba9c6ac 6c0f54aa 00020729 df912b2c 0a22ab57
Nov 20 11:12:47 ac1 kernel [570954.707552]        00000000 7fffffff de535ea8 de535e84 00000002 c02a64ab cba9c6ac c9681cac
Nov 20 11:12:47 ac1 kernel [570954.710805]        6c2d2800 00020729 c0343e74 00000292 00000292 00000000 c9681c00 ca5b0b4a
Nov 20 11:12:47 ac1 kernel [570954.713843] Call Trace:
Nov 20 11:12:47 ac1 kernel [570954.715487]  [<c02a64ab>] schedule_timeout+0x13/0x86
Nov 20 11:12:47 ac1 kernel [570954.715939]  [<c02a5f2f>] wait_for_common+0xa3/0xfd
Nov 20 11:12:47 ac1 kernel [570954.717177]  [<c01171c7>] default_wake_function+0x0/0x5
Nov 20 11:12:50 ac1 kernel [570954.723086]  [<c01273af>] flush_cpu_workqueue+0x5f/0x67
Nov 20 11:12:50 ac1 kernel [570954.723593]  [<c01274c8>] wq_barrier_func+0x0/0x8
Nov 20 11:12:50 ac1 kernel [570954.725703]  [<c0210a38>] release_dev+0x39f/0x4bc
Nov 20 11:12:50 ac1 kernel [570954.726134]  [<c012bb0f>] enqueue_hrtimer+0xc9/0xd4
Nov 20 11:12:50 ac1 kernel [570954.726564]  [<c0118ca8>] hrtick_set+0x69/0xb9
Nov 20 11:12:50 ac1 kernel [570954.729121]  [<c0210b5c>] tty_release+0x7/0xa
Nov 20 11:12:50 ac1 kernel [570954.730073]  [<c016673b>] __fput+0x88/0x12f
Nov 20 11:12:50 ac1 kernel [570954.731759]  [<c016417b>] filp_close+0x4d/0x53
Nov 20 11:12:50 ac1 kernel [570954.733617]  [<c011d144>] put_files_struct+0x5f/0xa7
Nov 20 11:12:50 ac1 kernel [570954.736016]  [<c011e0ff>] do_exit+0x1e0/0x586
Nov 20 11:12:59 ac1 kernel [570954.737912]  [<c011e4f7>] do_group_exit+0x52/0x78
Nov 20 11:12:59 ac1 kernel [570954.741648]  [<c011e52a>] sys_exit_group+0xd/0x10
Nov 20 11:12:59 ac1 kernel [570954.742969]  [<c010372f>] sysenter_past_esp+0x78/0xb9
Nov 20 11:12:59 ac1 kernel [570954.743778]  =======================

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Вот и дождались. На последней гитовской ревизии:

Nov 20 11:12:47 ac1 kernel [570954.700234] INFO: task pppd:15562 blocked for more than 120 seconds.
Nov 20 11:12:47 ac1 kernel [570954.701936] "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message.
Nov 20 11:12:47 ac1 kernel [570954.704366] pppd          D cba9c6ac     0 15562  15561
Nov 20 11:12:47 ac1 kernel [570954.705472]        df9129a0 00000046 bb6fce72 cba9c6ac 6c0f54aa 00020729 df912b2c 0a22ab57
Nov 20 11:12:47 ac1 kernel [570954.707552]        00000000 7fffffff de535ea8 de535e84 00000002 c02a64ab cba9c6ac c9681cac
Nov 20 11:12:47 ac1 kernel [570954.710805]        6c2d2800 00020729 c0343e74 00000292 00000292 00000000 c9681c00 ca5b0b4a
Nov 20 11:12:47 ac1 kernel [570954.713843] Call Trace:
Nov 20 11:12:47 ac1 kernel [570954.715487]  [<c02a64ab>] schedule_timeout+0x13/0x86
Nov 20 11:12:47 ac1 kernel [570954.715939]  [<c02a5f2f>] wait_for_common+0xa3/0xfd
Nov 20 11:12:47 ac1 kernel [570954.717177]  [<c01171c7>] default_wake_function+0x0/0x5
Nov 20 11:12:50 ac1 kernel [570954.723086]  [<c01273af>] flush_cpu_workqueue+0x5f/0x67
Nov 20 11:12:50 ac1 kernel [570954.723593]  [<c01274c8>] wq_barrier_func+0x0/0x8
Nov 20 11:12:50 ac1 kernel [570954.725703]  [<c0210a38>] release_dev+0x39f/0x4bc
Nov 20 11:12:50 ac1 kernel [570954.726134]  [<c012bb0f>] enqueue_hrtimer+0xc9/0xd4
Nov 20 11:12:50 ac1 kernel [570954.726564]  [<c0118ca8>] hrtick_set+0x69/0xb9
Nov 20 11:12:50 ac1 kernel [570954.729121]  [<c0210b5c>] tty_release+0x7/0xa
Nov 20 11:12:50 ac1 kernel [570954.730073]  [<c016673b>] __fput+0x88/0x12f
Nov 20 11:12:50 ac1 kernel [570954.731759]  [<c016417b>] filp_close+0x4d/0x53
Nov 20 11:12:50 ac1 kernel [570954.733617]  [<c011d144>] put_files_struct+0x5f/0xa7
Nov 20 11:12:50 ac1 kernel [570954.736016]  [<c011e0ff>] do_exit+0x1e0/0x586
Nov 20 11:12:59 ac1 kernel [570954.737912]  [<c011e4f7>] do_group_exit+0x52/0x78
Nov 20 11:12:59 ac1 kernel [570954.741648]  [<c011e52a>] sys_exit_group+0xd/0x10
Nov 20 11:12:59 ac1 kernel [570954.742969]  [<c010372f>] sysenter_past_esp+0x78/0xb9
Nov 20 11:12:59 ac1 kernel [570954.743778]  =======================

Как знакомо. У меня по-моему про 120 секунд и pppd писалось в Bug: Soft lockup.

Как видим трабл есть. Интересно, что скажет xeb.

 

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Подскажите пожалуйста возможно ли на CentOS 5.4 i386 держать VPN сервер используя accel-pptp,

здесь все запускают его уже на новых ядрах и складывается впечатление, что на

2.6.18 accel-pptp работать не будет.

 

ядро:

Linux vpn.example.com 2.6.18-164.6.1.el5 #1 SMP Tue Nov 3 16:18:27 EST 2009 i686 i686 i386 GNU/Linux

 

Я делаю следующее:

#yum install kernel-headers kernel-devel gcc

#git clone git://accel-pptp.git.sourceforge.net/gitroot/accel-pptp/accel-pptp

#cd accel-pptp; make server && make server_install

 

все успешно собирается и устанавливается

 

далее я вижу что pptp модуль лежит в /lib/modules/2.6.18-164.6.1.el5/extra/

 

но ни modprobe ни modinfo про него ничего не говорят

# modprobe pptp

FATAL: Module pptp not found.

# modinfo pptp

modinfo: could not find module pptp

#

 

insmod на файл выдает следующее

# insmod pptp.ko

insmod: error inserting 'pptp.ko': -1 Unknown symbol in module

#

 

 

 

 

 

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

depmod сделайте для начала.

Кстати, кваггу (если используется) тоже прийдется обновить до 0.99.х. И SNMP пропатчить (если используется), чтобы дропал из статистики отключившиеся интерфейсы.

По части стабильности - ничего сказать не могу, на 2.6.18 не запускал. Но ведь никто не мешает собрать свежее ядро ;)

Изменено пользователем NiTr0

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Centos 5.4, 2.6.18, accel-pptp трудится чуть меньше недели, в пике до 400 человек. Пока, тьфу-тьфу, полёт нормальный.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

depmod сделайте для начала.

Кстати, кваггу (если используется) тоже прийдется обновить до 0.99.х. И SNMP пропатчить (если используется), чтобы дропал из статистики отключившиеся интерфейсы.

По части стабильности - ничего сказать не могу, на 2.6.18 не запускал. Но ведь никто не мешает собрать свежее ядро ;)

depmod отработал, далее могу делать modinfo

 

modinfo

# modinfo pptp
filename:       /lib/modules/2.6.18-164.6.1.el5/extra/pptp.ko
license:        GPL
author:         Kozlov D. (xeb@mail.ru)
description:    Point-to-Point Tunneling Protocol for Linux
srcversion:     5D2F5FCC34E482AE7F5DF9A
depends:        pppox,ppp_generic
vermagic:       2.6.18-164.6.1.el5 SMP mod_unload 686 REGPARM 4KSTACKS gcc-4.1
parm:           log_packets:int
parm:           log_level:Logging level (default=0) (int)
#

 

modprobe

# modprobe pptp
FATAL: Error inserting pptp (/lib/modules/2.6.18-164.6.1.el5/extra/pptp.ko): Unknown symbol in module, or unknown parameter (see dmesg)
#

 

tail /var/log/messages

Nov 23 08:05:43 vpn.example.com kernel: pptp: Unknown symbol __you_cannot_kzalloc_that_much

 

Centos 5.4, 2.6.18, accel-pptp трудится чуть меньше недели, в пике до 400 человек. Пока, тьфу-тьфу, полёт нормальный.

подскажите какую версию accel-pptp ставили, ядро ведь на CentOS родное?

Изменено пользователем gendolf_gray

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

я не буду говорить про звезды, видимо это что-то другое с моими руками.

 

Сегодня поднял тестовую виртуалку с CentOS 5.4 64 бита, далее yum update имеющихся пакетов.

 

#yum install kernel-headers kernel-devel gcc

#git clone git://accel-pptp.git.sourceforge.net/gitroot/accel-pptp/accel-pptp

#cd accel-pptp; make server && make server_install

#depmod ; modprobe pptp

 

и модуль удачно загрузился в ядро

Nov 23 09:38:45 vpn-test.example.com kernel: PPTP driver version 0.8.4

 

После чего уже на железном сервер с CentOS 5.4 , но 32бита сделал yum update, обновился ppp до ppp-2.4.4-14.1.rhel5.i386.rpm

и далее

 

#yum install kernel-headers kernel-devel gcc

#git clone git://accel-pptp.git.sourceforge.net/gitroot/accel-pptp/accel-pptp

#cd accel-pptp; make server && make server_install

#depmod ; modprobe pptp

 

модуль удачно подгрузился в ядро

Nov 23 09:43:12 vpn.example.com kernel: PPTP driver version 0.8.4

 

Главное в Git ничего не менялось за ночь http://accel-pptp.git.sourceforge.net/git/...-pptp;a=summary

Всем спасибо за помощь.

 

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

в секции файла /lib/modules/2.6.30/build/include/linux/swab.h

#ifndef _LINUX_SWAB_H
#define _LINUX_SWAB_H

#include <linux/types.h>
#include <linux/compiler.h>
#include <asm/swab.h>

 

нужно исправить на

#ifndef _LINUX_SWAB_H
#define _LINUX_SWAB_H

#include <linux/types.h>
#include <linux/compiler.h>
#include <asm-generic/swab.h>

мне не помогло, при изменении он сразу пишет error: asm-generic/swab.h: No such file or directory

помогло копирование файла swab.h в asm.

 

Вопрос: при попытки скомпилить SMP версию accel-pptp тут же выдаёт:

 

Building kernel module
(cd kernel/driver; make )
make[1]: Entering directory `/home/injektor/accel-pptp/kernel/driver'
using "/usr/src/linux" kernel headers
make -C /usr/src/linux SUBDIRS=/home/injektor/accel-pptp/kernel/driver modules
make[2]: Entering directory `/usr/src/linux-2.6.29'
  CC [M]  /home/injektor/accel-pptp/kernel/driver/pptp.o
  CC [M]  /home/injektor/accel-pptp/kernel/driver/ppp_generic_smp.o
/home/injektor/accel-pptp/kernel/driver/ppp_generic_smp.c: In function 'ppp_start_xmit':
/home/injektor/accel-pptp/kernel/driver/ppp_generic_smp.c:946: error: 'struct net_device' has no member named 'priv'
/home/injektor/accel-pptp/kernel/driver/ppp_generic_smp.c: In function 'ppp_net_ioctl':
/home/injektor/accel-pptp/kernel/driver/ppp_generic_smp.c:997: error: 'struct net_device' has no member named 'priv'
/home/injektor/accel-pptp/kernel/driver/ppp_generic_smp.c: In function 'ppp_create_interface':
/home/injektor/accel-pptp/kernel/driver/ppp_generic_smp.c:2505: error: 'struct net_device' has no member named 'priv'
make[3]: *** [/home/injektor/accel-pptp/kernel/driver/ppp_generic_smp.o] Error 1
make[2]: *** [_module_/home/injektor/accel-pptp/kernel/driver] Error 2
make[2]: Leaving directory `/usr/src/linux-2.6.29'
make[1]: *** [all] Error 2
make[1]: Leaving directory

 

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Вопрос: при попытки скомпилить SMP версию accel-pptp

Это не SMP версия accel-pptp, это SMP версия ppp.ko - толку от которой фактически нет.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Вот и дождались. На последней гитовской ревизии....
у меня тоже (

Nov 25 15:39:33 internet kernel: [2388037.252491] BUG: soft lockup - CPU#2 stuck for 61s! [pppd:31206]
Nov 25 15:39:33 internet kernel: [2388037.252501] Modules linked in: sch_sfq sch_htb pptp pppox ipt_MASQUERADE ppp_deflate zlib_deflate bsd_comp act_police cls_u32 sch_ingress sch_tbf sha1_generic arc4 ecb ppp_mppe xt_recent ipt_ULOG xt_tcpudp iptable_nat iptable_filter ip_tables x_tables 8021q garp stp nf_nat_pptp nf_conntrack_pptp nf_conntrack_proto_gre nf_nat_proto_gre nf_nat nf_conntrack_ipv4 nf_conntrack nf_defrag_ipv4 snd_pcm snd_timer serio_raw snd soundcore snd_page_alloc psmouse pcspkr i2c_i801 i5100_edac edac_core raid1 pata_it8213 igb dca mptsas floppy mptscsih mptbase scsi_transport_sas [last unloaded: e1000e]
Nov 25 15:39:33 internet kernel: [2388037.252501] CPU 2:
Nov 25 15:39:33 internet kernel: [2388037.252501] Modules linked in: sch_sfq sch_htb pptp pppox ipt_MASQUERADE ppp_deflate zlib_deflate bsd_comp act_police cls_u32 sch_ingress sch_tbf sha1_generic arc4 ecb ppp_mppe xt_recent ipt_ULOG xt_tcpudp iptable_nat iptable_filter ip_tables x_tables 8021q garp stp nf_nat_pptp nf_conntrack_pptp nf_conntrack_proto_gre nf_nat_proto_gre nf_nat nf_conntrack_ipv4 nf_conntrack nf_defrag_ipv4 snd_pcm snd_timer serio_raw snd soundcore snd_page_alloc psmouse pcspkr i2c_i801 i5100_edac edac_core raid1 pata_it8213 igb dca mptsas floppy mptscsih mptbase scsi_transport_sas [last unloaded: e1000e]
Nov 25 15:39:33 internet kernel: [2388037.252501] Pid: 31206, comm: pppd Not tainted 2.6.31-02063103-generic #02063103 X7DCL
Nov 25 15:39:33 internet kernel: [2388037.252501] RIP: 0010:[<ffffffff81032514>]  [<ffffffff81032514>] __ticket_spin_lock+0x14/0x20
Nov 25 15:39:33 internet kernel: [2388037.252501] RSP: 0018:ffff88019687bbb8  EFLAGS: 00000297
Nov 25 15:39:33 internet kernel: [2388037.252501] RAX: 0000000000001211 RBX: ffff88019687bbb8 RCX: 0200000000000081
Nov 25 15:39:33 internet kernel: [2388037.252501] RDX: 00000000000005dc RSI: 0000000000000002 RDI: ffff8802090a6e90
Nov 25 15:39:33 internet kernel: [2388037.252501] RBP: ffffffff81012b2e R08: 0000000000000000 R09: ffffffff8177f490
Nov 25 15:39:33 internet kernel: [2388037.252501] R10: 0000000000000000 R11: 0000000000000049 R12: ffff88019687bb78
Nov 25 15:39:33 internet kernel: [2388037.252501] R13: ffff880100000000 R14: 0000000000000df4 R15: ffff88019687bb98
Nov 25 15:39:33 internet kernel: [2388037.252501] FS:  00007ff7363186e0(0000) GS:ffff88002806e000(0000) knlGS:0000000000000000
Nov 25 15:39:33 internet kernel: [2388037.252501] CS:  0010 DS: 0000 ES: 0000 CR0: 000000008005003b
Nov 25 15:39:33 internet kernel: [2388037.252501] CR2: 000000000064b828 CR3: 0000000115ce5000 CR4: 00000000000006a0
Nov 25 15:39:33 internet kernel: [2388037.252501] DR0: 0000000000000000 DR1: 0000000000000000 DR2: 0000000000000000
Nov 25 15:39:33 internet kernel: [2388037.252501] DR3: 0000000000000000 DR6: 00000000ffff0ff0 DR7: 0000000000000400
Nov 25 15:39:33 internet kernel: [2388037.252501] Call Trace:
Nov 25 15:39:33 internet kernel: [2388037.252501]  [<ffffffff8140d050>] ? kfree_skbmem+0x30/0x80
Nov 25 15:39:33 internet kernel: [2388037.252501]  [<ffffffff81506239>] ? _spin_lock_bh+0x19/0x30
Nov 25 15:39:33 internet kernel: [2388037.252501]  [<ffffffff8137ce6c>] ? ppp_push+0x4c/0xd0
Nov 25 15:39:33 internet kernel: [2388037.252501]  [<ffffffff8137f495>] ? ppp_send_frame+0x3e5/0x4c0
Nov 25 15:39:33 internet kernel: [2388037.252501]  [<ffffffff8137f5cf>] ? ppp_xmit_process+0x5f/0xc0
Nov 25 15:39:33 internet kernel: [2388037.252501]  [<ffffffff8137f849>] ? ppp_start_xmit+0x149/0x1b0
Nov 25 15:39:33 internet kernel: [2388037.252501]  [<ffffffff81416ba8>] ? dev_hard_start_xmit+0x158/0x1c0
Nov 25 15:39:33 internet kernel: [2388037.252501]  [<ffffffff8142ece1>] ? __qdisc_run+0x1a1/0x230
Nov 25 15:39:33 internet kernel: [2388037.252501]  [<ffffffff814186e8>] ? dev_queue_xmit+0x238/0x310
Nov 25 15:39:33 internet kernel: [2388037.252501]  [<ffffffff81448384>] ? ip_finish_output+0x1e4/0x2f0
Nov 25 15:39:33 internet kernel: [2388037.252501]  [<ffffffff81448519>] ? ip_output+0x89/0xd0
Nov 25 15:39:33 internet kernel: [2388037.252501]  [<ffffffff81447530>] ? ip_local_out+0x20/0x30
Nov 25 15:39:33 internet kernel: [2388037.252501]  [<ffffffffa015937b>] ? pptp_xmit+0x40b/0x55c [pptp]
Nov 25 15:39:33 internet kernel: [2388037.252501]  [<ffffffff8137f676>] ? ppp_channel_push+0x46/0xb0
Nov 25 15:39:33 internet kernel: [2388037.252501]  [<ffffffff8137f988>] ? ppp_write+0xd8/0xf0
Nov 25 15:39:33 internet kernel: [2388037.252501]  [<ffffffff81117d07>] ? vfs_write+0xc7/0x1a0
Nov 25 15:39:33 internet kernel: [2388037.252501]  [<ffffffff81117ed0>] ? sys_write+0x50/0x90
Nov 25 15:39:33 internet kernel: [2388037.252501]  [<ffffffff81011f82>] ? system_call_fastpath+0x16/0x1b
Nov 25 15:39:55 internet kernel: [2388059.821289] INFO: task pppd:26189 blocked for more than 120 seconds.
Nov 25 15:39:55 internet kernel: [2388059.821327] "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message.
Nov 25 15:39:55 internet kernel: [2388059.821379] pppd          D 0000000000000003     0 26189  26188 0x00000004
Nov 25 15:39:55 internet kernel: [2388059.821418]  ffff88001fc8fd78 0000000000000082 ffff88001fc8fd58 0000000000015580
Nov 25 15:39:55 internet kernel: [2388059.821476]  0000000000015580 0000000000015580 0000000000015580 ffff88007d603110
Nov 25 15:39:55 internet kernel: [2388059.821534]  ffff88007d602d60 ffff8802170b96b0 ffff88007d603110 ffffffff817de024
Nov 25 15:39:55 internet kernel: [2388059.821592] Call Trace:
Nov 25 15:39:55 internet kernel: [2388059.821624]  [<ffffffff81504e36>] __mutex_lock_slowpath+0xd6/0x160
Nov 25 15:39:55 internet kernel: [2388059.821658]  [<ffffffff81504cb6>] mutex_lock+0x26/0x50
Nov 25 15:39:55 internet kernel: [2388059.821692]  [<ffffffff81423610>] rtnl_lock+0x10/0x20
Nov 25 15:39:55 internet kernel: [2388059.821723]  [<ffffffff8141b5b5>] dev_ioctl+0x245/0x2c0
Nov 25 15:39:55 internet kernel: [2388059.821756]  [<ffffffff814068bd>] sock_ioctl+0xed/0x270
Nov 25 15:39:55 internet kernel: [2388059.821789]  [<ffffffff81126281>] vfs_ioctl+0x31/0x90
Nov 25 15:39:55 internet kernel: [2388059.821821]  [<ffffffff8112647d>] do_vfs_ioctl+0x6d/0x1f0
Nov 25 15:39:55 internet kernel: [2388059.821852]  [<ffffffff81126682>] sys_ioctl+0x82/0xa0
Nov 25 15:39:55 internet kernel: [2388059.821886]  [<ffffffff81011f82>] system_call_fastpath+0x16/0x1b

 

 

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

у меня тоже (

Надо с этим что-то делать. Ибо не феншуй. Как-то xeb не вовремя запропостился. :(

 

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

похоже получилась петля, каким образом и как избавиться я пока думаю ...

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

похоже получилась петля, каким образом и как избавиться я пока думаю ...

А можно поподробнее - что имелось ввиду под петлей?

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

pppd отправляет какой-то пакет через интерфейс pppX, пакет проходит ppp_generic обработку, здесь skbuf блокируется(spin_lock_bh), дальше pptp инкапсуляция, ipfilter и опять попадает на интерфейс pppX, где заблокированный skbuf пытаются еще раз заблокировать и естественно здесь проц зависает в бесконечном цикле, вот как-то так

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

pppd отправляет какой-то пакет через интерфейс pppX, пакет проходит ppp_generic обработку, здесь skbuf блокируется(spin_lock_bh), дальше pptp инкапсуляция, ipfilter и опять попадает на интерфейс pppX, где заблокированный skbuf пытаются еще раз заблокировать и естественно здесь проц зависает в бесконечном цикле, вот как-то так

Я когда-то уже описывал такую ситуацию, повторяемость 100% на корбине. Дык вот разбор полётов показал что проблема в том что на адреса eth0 интерфейса их сервера и localip в pptpd.conf у них совпадает и равен например 88.88.88.88 (на самом деле там не линукс но смысл думаю ясен). В итоге при коннекте добавляется маршрут до подсети с этим самым 88.88.88.88 который внутри туннеля и ессно, что весь трафик который должен был идти через eth0 клиента до eth0 сервера идёт с eth0 клиента на pppX сервера отчего у клиента сносит крышу, буквально за несколько минут заполняется вся память сжирает проц и либо наглухо виснет либо...

 

Дык вот со стороны клиента проблема решается добавлением маршрута до сервера ip route add 88.88.88.88 dev eth0 и всё. Тут похоже тоже самое только кто-то из клиентов что-то такое делает что на сервере образуется петля.

 

Для повторения можете приконнектиться на vpn.corbina.ru логин и пароль corbina и всё сами увидите. Причём без разницы будет это acell или юзерспэйсный pptp, точнее разница только в том как бустро он хлопнется =)

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Как вариант, клиент попытался устроить "туннель в туннеле".

 

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Как вариант, клиент попытался устроить "туннель в туннеле".

Эм. Поподробнее - каким образом устроить туннель в туннеле? Какой из наиболее накуренных клиентов будет это проворачивать?

Второй вопрос по посту с корбиной. То что сервер выдает какие-то косяки - это одна тема. Но как клиент может внести такую нестыковку, если pppd сам навешивает настройки (по радиусу или по файлам конфигурации).

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Ну почему сразу накуренный? vpn до провайдера - получил инет, впн на работу - попал в локалку своей конторы....

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Какой из наиболее накуренных клиентов будет это проворачивать?
Да мало ли сколько не менее накуреных SOHO роутеров существует...

 

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.

Гость
Ответить в тему...

×   Вставлено в виде отформатированного текста.   Вставить в виде обычного текста

  Разрешено не более 75 смайлов.

×   Ваша ссылка была автоматически встроена.   Отобразить как ссылку

×   Ваш предыдущий контент был восстановлен.   Очистить редактор

×   Вы не можете вставить изображения напрямую. Загрузите или вставьте изображения по ссылке.