Перейти к содержимому
Калькуляторы

Можно сделать еще проще:

 

diff --git a/drivers/net/ppp/pppoe.c b/drivers/net/ppp/pppoe.c
index 2ed7506..5e0b432 100644
--- a/drivers/net/ppp/pppoe.c
+++ b/drivers/net/ppp/pppoe.c
@@ -589,7 +589,7 @@ static int pppoe_release(struct socket *sock)

	po = pppox_sk(sk);

-	if (sk->sk_state & (PPPOX_CONNECTED | PPPOX_BOUND | PPPOX_ZOMBIE)) {
+	if (po->pppoe_dev) {
		dev_put(po->pppoe_dev);
		po->pppoe_dev = NULL;
	}

 

 

Вроде как этими двумя патчами исправляются баги с NULL POINTER в pppoe_release, но вот этот баг судя по всему нет: http://accel-ppp.org/forum/viewtopic.php?f=18&t=538

 

Таким образом не ясно - то ли пробовать ставить последнюю версию, то ли откатиться на 3.2, но с ним не работает systemd.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

softlockup к слову у меня ни разу не было... были краши в непонятных (и понятных) местах, рост LA на ровном месте, иногда - даже висы...

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

У меня после последнего патча все ок вроде. Но на новых ядрах немного серверов.

Без патча новое ядро ссыпалось в течении дня на 9к юзеров онлайн на сервере.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Уважаемые гуру подскажите, почему на ifb0 столько много дропов и оверлимитов? пару суток все было ок с нарезкой скорости, сегодня пошли жалобы на низкие показания при замерах, порядка 1550 сессий pppoe онлайн, заметил также что txqueuelen для ifb0 равен 32, это не слишком малое значение?

 

[shaper]

r2q=12

quantum=1500

cburst=750000

ifb=ifb0

up-limiter=htb

down-limiter=htb

leaf-qdisc=sfq perturb 10

rate-multiplier=1

attr-down=PPPD-Downstream-Speed-Limit

attr-up=PPPD-Upstream-Speed-Limit

verbose=1

-------------

 

tc -s -d qdisc show dev ifb0

qdisc htb 1: root refcnt 2 r2q 10 default 0 direct_packets_stat 0 ver 3.17

Sent 11245526234 bytes 16882745 pkt (dropped 37, overlimits 1401412 requeues 0)

backlog 0b 0p requeues 0

 

Решили проблему с шейпером?

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

txqueuelen задрать до 1000-10000 бы для начала...

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Хм, с 4.1.12 словил такой вот трейс:

[41358.475254] BUG: unable to handle kernel NULL pointer dereference at   (null)
[41358.475333] IP: [<c131c7d0>] rtnetlink_put_metrics+0x50/0x180
[41358.475376] *pdpt = 0000000026d58001 *pde = 0000000000000000 
[41358.475413] Oops: 0000 [#1] SMP 
[41358.475453] Modules linked in: act_mirred pppoe pppox ppp_generic slhc iptable_filter xt_length xt_TCPMSS xt_tcpudp xt_mark xt_dscp iptable_mangle ip_tables x_tables ipv6 sch_sfq sch_htb cls_u32 sch_ingress sch_prio sch_tbf cls_flow cls_fw act_police ifb 8021q mrp garp stp llc softdog parport_pc parport acpi_cpufreq processor thermal_sys igb(O) k10temp hwmon dca ohci_pci ohci_hcd ptp pps_core i2c_piix4 i2c_core sp5100_tco sd_mod pata_acpi pata_atiixp pcspkr ata_generic ahci libahci libata ehci_pci ehci_hcd scsi_mod usbcore usb_common ext4 mbcache jbd2 crc16 vfat fat isofs
[41358.475807] CPU: 2 PID: 10877 Comm: bird Tainted: G           O    4.1.12-i686 #1
[41358.475880] Hardware name: MICRO-STAR INTERNATIONAL CO.,LTD MS-7596/760GM-E51(MS-7596), BIOS V3.3 01/12/2012
[41358.475955] task: f5302da0 ti: e1364000 task.ti: e1364000
[41358.475993] EIP: 0060:[<c131c7d0>] EFLAGS: 00010282 CPU: 2
[41358.476030] EIP is at rtnetlink_put_metrics+0x50/0x180
[41358.476066] EAX: 00000000 EBX: 00000001 ECX: 00000004 EDX: 00000000
[41358.476106] ESI: 00000000 EDI: e0b38000 EBP: e1365ca8 ESP: e1365c78
[41358.476143]  DS: 007b ES: 007b FS: 00d8 GS: 0033 SS: 0068
[41358.476179] CR0: 8005003b CR2: 00000000 CR3: 34966ac0 CR4: 000006f0
[41358.476216] Stack:
[41358.476249]  00000000 c1213873 d4316f64 00000000 e0b38000 e1365d00 c1213989 00000fe4
[41358.476330]  e0b38000 00000000 d4316f30 e0b38000 e1365d00 c138362e e1365cd8 0000000c
[41358.476405]  00000002 00000002 00000000 00000000 c13bba01 e0b38000 000000fe 007d8196
[41358.476482] Call Trace:
[41358.476522]  [<c1213873>] ? __nla_reserve+0x23/0xe0
[41358.476557]  [<c1213989>] ? __nla_put+0x9/0xb0
[41358.476595]  [<c138362e>] ? fib_dump_info+0x15e/0x3e0
[41358.476636]  [<c13bba01>] ? irq_entries_start+0x639/0x678
[41358.476671]  [<c1386823>] ? fib_table_dump+0xf3/0x180
[41358.476708]  [<c138053d>] ? inet_dump_fib+0x7d/0x100
[41358.476746]  [<c1337ef1>] ? netlink_dump+0x121/0x270
[41358.476781]  [<c1303572>] ? skb_free_datagram+0x12/0x40
[41358.476818]  [<c1338284>] ? netlink_recvmsg+0x244/0x360
[41358.476855]  [<c12f3f8d>] ? sock_recvmsg+0x1d/0x30
[41358.476890]  [<c12f3f70>] ? sock_recvmsg_nosec+0x30/0x30
[41358.476924]  [<c12f5cec>] ? ___sys_recvmsg+0x9c/0x120
[41358.476958]  [<c12f3f70>] ? sock_recvmsg_nosec+0x30/0x30
[41358.476994]  [<c10740e4>] ? update_cfs_rq_blocked_load+0xc4/0x130
[41358.477030]  [<c1094bb4>] ? hrtimer_forward+0xa4/0x1c0
[41358.477065]  [<c12f4cdd>] ? sockfd_lookup_light+0x1d/0x80
[41358.477099]  [<c12f6c5e>] ? __sys_recvmsg+0x3e/0x80
[41358.477134]  [<c12f6ff1>] ? SyS_socketcall+0xb1/0x2a0
[41358.477168]  [<c108657c>] ? handle_irq_event+0x3c/0x60
[41358.477203]  [<c1088efd>] ? handle_edge_irq+0x7d/0x100
[41358.477238]  [<c130a2e6>] ? rps_trigger_softirq+0x26/0x30
[41358.477273]  [<c10a88e3>] ? flush_smp_call_function_queue+0x83/0x120
[41358.477307]  [<c13bb2be>] ? syscall_call+0x7/0x7
[41358.477341] Code: 00 89 45 d8 89 c3 89 f8 e8 7e 72 ef ff 85 c0 0f 88 9e 00 00 00 85 db 0f 84 96 00 00 00 bb 01 00 00 00 c7 45 dc 00 00 00 00 66 90 <8b> 44 9e fc 85 c0 74 2b 83 fb 10 0f 84 84 00 00 00 89 45 e0 8d
[41358.477509] EIP: [<c131c7d0>] rtnetlink_put_metrics+0x50/0x180 SS:ESP 0068:e1365c78
[41358.477576] CR2: 0000000000000000
[41358.477880] ---[ end trace 6e3e7e6b81407c0a ]---
[41358.499813] ------------[ cut here ]------------
[41358.499879] WARNING: CPU: 2 PID: 0 at /var/testpoint/LEAF/source/i486-unknown-linux-uclibc/linux/linux-4.1/net/netlink/af_netlink.c:944 netlink_sock_destruct+0xa8/0xc0()
[41358.500003] Modules linked in: act_mirred pppoe pppox ppp_generic slhc iptable_filter xt_length xt_TCPMSS xt_tcpudp xt_mark xt_dscp iptable_mangle ip_tables x_tables ipv6 sch_sfq sch_htb cls_u32 sch_ingress sch_prio sch_tbf cls_flow cls_fw act_police ifb 8021q mrp garp stp llc softdog parport_pc parport acpi_cpufreq processor thermal_sys igb(O) k10temp hwmon dca ohci_pci ohci_hcd ptp pps_core i2c_piix4 i2c_core sp5100_tco sd_mod pata_acpi pata_atiixp pcspkr ata_generic ahci libahci libata ehci_pci ehci_hcd scsi_mod usbcore usb_common ext4 mbcache jbd2 crc16 vfat fat isofs
[41358.502110] CPU: 2 PID: 0 Comm: swapper/2 Tainted: G      D    O    4.1.12-i686 #1
[41358.502213] Hardware name: MICRO-STAR INTERNATIONAL CO.,LTD MS-7596/760GM-E51(MS-7596), BIOS V3.3 01/12/2012
[41358.502305]  c14b0540 f5259f40 c13b6ee2 00000000 c104b5a3 c1475fd4 00000002 00000000
[41358.502610]  c14b0540 000003b0 c13373e8 00000009 c13373e8 f2204c00 0000000a 0000000a
[41358.502920]  f5259f50 c104b680 00000009 00000000 f5259f64 c13373e8 c108f4d7 c108f4d7
[41358.503230] Call Trace:
[41358.503292]  [<c13b6ee2>] ? dump_stack+0x3e/0x4e
[41358.503357]  [<c104b5a3>] ? warn_slowpath_common+0x93/0xd0
[41358.503420]  [<c13373e8>] ? netlink_sock_destruct+0xa8/0xc0
[41358.503484]  [<c13373e8>] ? netlink_sock_destruct+0xa8/0xc0
[41358.503548]  [<c104b680>] ? warn_slowpath_null+0x20/0x30
[41358.503609]  [<c13373e8>] ? netlink_sock_destruct+0xa8/0xc0
[41358.503671]  [<c108f4d7>] ? rcu_process_callbacks+0x1b7/0x4e0
[41358.503732]  [<c108f4d7>] ? rcu_process_callbacks+0x1b7/0x4e0
[41358.503794]  [<c12f9b88>] ? __sk_free+0x18/0xf0
[41358.503862]  [<c108f513>] ? rcu_process_callbacks+0x1f3/0x4e0
[41358.503929]  [<c104e753>] ? __do_softirq+0xc3/0x240
[41358.503992]  [<c104e690>] ? __tasklet_hrtimer_trampoline+0x50/0x50
[41358.504056]  [<c1004729>] ? do_softirq_own_stack+0x29/0x40
[41358.504117]  <IRQ>  [<c104ea9e>] ? irq_exit+0x6e/0x90
[41358.504208]  [<c13bc3f8>] ? smp_apic_timer_interrupt+0x38/0x50
[41358.504270]  [<c13bbcd9>] ? apic_timer_interrupt+0x2d/0x34
[41358.504332]  [<c100bfc9>] ? default_idle+0x19/0xb0
[41358.504395]  [<c100cd2e>] ? arch_cpu_idle+0xe/0x10
[41358.504458]  [<c107ec55>] ? cpu_startup_entry+0x215/0x310
[41358.504519] ---[ end trace 6e3e7e6b81407c0b ]---

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Хм, с 4.1.12 словил такой вот трейс:

 

Печалька.... Есть мысли, как сделать, что бы надежго работало???

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Написать в netdev. Меня вот сегодня отругали за выключение gso/gro, что отключаю, а не пишу багрепорты.

P.S. судя по дампу - проблема в netlink который передает что-то в bird

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

txqueuelen задрать до 1000-10000 бы для начала...

 

 

На каком интерфейсе?

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

hsvt

Вы ж про ifb0 спрашивали. Логично что на нем?

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

м, с 4.1.12 словил такой вот трейс:

 

Похоже accel-ppp не дружит с новыми ядрами. Откатился на 3.2 все отлично. Похоже борьба с глобальными блокировками не прошла просто так.

И что-то мне подсказыват, что искать надо не в ядре.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Похоже accel-ppp не дружит с новыми ядрами.

ну тут bird виовником был похоже...

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Похоже accel-ppp не дружит с новыми ядрами.

ну тут bird виовником был похоже...

Не согласен. Bird сам по себе не дает такой картины.

У меня bird уже давно повсеместно ипользуется. На несколько БРАСов один пул ip-адресов, клиент конектится и bird сообщает на пограничники, где какой ip поднялся (динамическая марщрутизация внутри сети).

PS 3.18 везде ядра.

 

Единственное, на БРАСах везде классический PPPoE.

accel-ppp так и не внедрили. А теперь и боимся это делать, уже больно глучно он работает на новых ядрах.

А на старых смысла нет возвращаться!

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

txqueuelen задрать до 1000-10000 бы для начала...

Поднято pppoe

Заметил, что у pppX qlen=3

Это нормально?

Если нет, то как заставить автоматически ставить нужное значение?

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

bsi82

На клиентских ppp очередь не нужна, там невозможно упереться в ширину "интерфейса".

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

hsvt

Вы ж про ifb0 спрашивали. Логично что на нем?

 

Прописал пока что на ifb0 qlen 10000, понаблюдаем, спасибо. На ifb1 так же нужно увеличивать?

 

Еще вопрос, кстати есть опция

check-mac-change=1

 

If enabled accel-ppp will terminate session when detects change of mac address of client (by default it is enabled).

 

Как на практике работает кто нибудь видел? Пробовал менять, не замечал гашение сессии...

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Вчера у меня сервер с accel IPOE упал, второй раз за 2 последние 2 месяца. Похоже после 2500 онлайн началось что-то плохое.

Кернел паник без каких-либо адекватных сообщений, ядро 3.18.10, вчера обновил до 3.18.22, может поможет.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Вчера у меня сервер с accel IPOE упал, второй раз за 2 последние 2 месяца. Похоже после 2500 онлайн началось что-то плохое.

Кернел паник без каких-либо адекватных сообщений, ядро 3.18.10, вчера обновил до 3.18.22, может поможет.

3.18.16 падает так же.

3.10 падает так же.

3.16 падает так же.

Из опыта только 3.2 держалась достаточно долго при большой нагрузке.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Ну пока нагрузка была меньше(до 2к сессий) у меня этот же сервер работал порядка года без сбоев и проблем, с разными ядрами. С 3.10.10-3.10.33(время от времени обновлял порядка ради) точно работало без нареканий.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Ну пока нагрузка была меньше(до 2к сессий) у меня этот же сервер работал порядка года без сбоев и проблем, с разными ядрами. С 3.10.10-3.10.33(время от времени обновлял порядка ради) точно работало без нареканий.

падать начинает при сессиях гдето 1.5-1.6к+ до этого значения на любом ядре было отлично.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.

Гость
Ответить в тему...

×   Вставлено в виде отформатированного текста.   Вставить в виде обычного текста

  Разрешено не более 75 смайлов.

×   Ваша ссылка была автоматически встроена.   Отобразить как ссылку

×   Ваш предыдущий контент был восстановлен.   Очистить редактор

×   Вы не можете вставить изображения напрямую. Загрузите или вставьте изображения по ссылке.