Jump to content
Калькуляторы

А есть путь правильной балансировки серверов в случае ipoe, qinq, старт DHCP с vlan-mon? Сейчас если поднять второй сервер, то на нем начинают подниматься интерфейсы, уже поднятые на первом, затем падают и т.д.

Edited by SystemSyn

Share this post


Link to post
Share on other sites

Всем привет. Подскажите по COA

у меня биллинг шлет два COA на изменение скорости, accel обрабатывает только 1 и в итоге скорость меняется только в 1 направлении.

 

лог прибавление скорости, через 5 минут возврат

[2016-10-18 13:41:47]: debug: recv [RADIUS CoA-Request id=29 <User-Name "tester1"> <Acct-Session-Id "69688d7e7192a843"> <Framed-IP-Address 192.168.6.116> <Calling-Station-Id "10.10.10.33"> <Traffic-Shape-out "50"> <Traffic-Shape-in "1">]

[2016-10-18 13:41:47]: info: ppp823: recv [RADIUS CoA-Request id=29 <User-Name "tester1"> <Acct-Session-Id "69688d7e7192a843"> <Framed-IP-Address 192.168.6.116> <Calling-Station-Id "10.10.10.33"> <Traffic-Shape-out "50"> <Traffic-Shape-in "1">]

[2016-10-18 13:41:47]: debug: recv [RADIUS CoA-Request id=cd <User-Name "tester1"> <Acct-Session-Id "69688d7e7192a843"> <Framed-IP-Address 192.168.6.116> <Calling-Station-Id "10.10.10.33"> <Traffic-Shape-out "50"> <Traffic-Shape-in "50">]

[2016-10-18 13:49:15]: debug: recv [RADIUS CoA-Request id=ba <User-Name "tester1"> <Acct-Session-Id "69688d7e7192a843"> <Framed-IP-Address 192.168.6.116> <Calling-Station-Id "10.10.10.33"> <Traffic-Shape-out "1"> <Traffic-Shape-in "50">]

[2016-10-18 13:49:15]: info: ppp823: recv [RADIUS CoA-Request id=ba <User-Name "tester1"> <Acct-Session-Id "69688d7e7192a843"> <Framed-IP-Address 192.168.6.116> <Calling-Station-Id "10.10.10.33"> <Traffic-Shape-out "1"> <Traffic-Shape-in "50">]

[2016-10-18 13:49:15]: debug: recv [RADIUS CoA-Request id=ab <User-Name "tester1"> <Acct-Session-Id "69688d7e7192a843"> <Framed-IP-Address 192.168.6.116> <Calling-Station-Id "10.10.10.33"> <Traffic-Shape-out "1"> <Traffic-Shape-in "1">]

[2016-10-18 13:49:15]: info: ppp823: recv [RADIUS CoA-Request id=ab <User-Name "tester1"> <Acct-Session-Id "69688d7e7192a843"> <Framed-IP-Address 192.168.6.116> <Calling-Station-Id "10.10.10.33"> <Traffic-Shape-out "1"> <Traffic-Shape-in "1">]

 

П.С. accel старенький, собирался еще в 2012 году....

Share this post


Link to post
Share on other sites

А есть путь правильной балансировки серверов в случае ipoe, qinq, старт DHCP с vlan-mon? Сейчас если поднять второй сервер, то на нем начинают подниматься интерфейсы, уже поднятые на первом, затем падают и т.д.

Само должно балансироваться, интерфейсы на обоих серверах должны подняться все и не исчезать.

У меня так. Возможно версия кривая у Вас.

Share this post


Link to post
Share on other sites

Само должно балансироваться, интерфейсы на обоих серверах должны подняться все и не исчезать.

У меня так. Возможно версия кривая у Вас.

 

Хм. Интерфейсы же поднимаются по трафику в вилане, а сессия начинается после удачного диалога DHCP. Если же DHCP пакетов не было то получаем:

ipoe: create vlan eth1.3175.104 parent eth1.3175

ipoe: start interface eth1.3175.104 ()

ipoe: stop interface eth1.3175.104

ipoe: remove vlan eth1.3175.104

 

Конфиг:

 

shared=0

ifcfg=1

mode=L3

start=dhcpv4

ip-unnumbered=1

proxy-arp=1

nat=0

vlan-mon=re:eth1\.3[0-9][0-9][0-9],101-200

vlan-timeout=60

vlan-name=%I.%N

interface=re:eth1\.3[0-9][0-9][0-9]

 

Accel 1.10.3

Share this post


Link to post
Share on other sites

Может указать unit-cache? Или vlan-timeout=0

Edited by Dimka88

Share this post


Link to post
Share on other sites

SystemSyn

У меня логи минимальные, создание/удаление не пишется.

В среднем на 2 серверах +- одинаковое число интерфейсов, чуть больше общего числа активных сессий. Вероятно часть интерфейсов флапает, не вижу в этом никакой проблемы.

Можно(и нужно) vlan-timeout побольше задать, интерфейс будет поддерживаться случайными броадкастами от клиента.

Share this post


Link to post
Share on other sites

SystemSyn

У меня логи минимальные, создание/удаление не пишется.

В среднем на 2 серверах +- одинаковое число интерфейсов, чуть больше общего числа активных сессий. Вероятно часть интерфейсов флапает, не вижу в этом никакой проблемы.

Можно(и нужно) vlan-timeout побольше задать, интерфейс будет поддерживаться случайными броадкастами от клиента.

Ок, попробую.

Share this post


Link to post
Share on other sites

парни выручайте, вылетает в логи

 

[2016-10-24 19:07:10]:  info: ipoe0: create interface ipoe0 parent eth1
[2016-10-24 19:07:10]: debug: ipoe0: radius(1): req_enter 1
[2016-10-24 19:07:10]:  info: ipoe0: send [RADIUS(1) Access-Request id=1 <User-Name "10.0.100.2"> <NAS-Identifier "xxx-gw-01"> <NAS-IP-Address 10.255.0.161> <NAS-Port 13> <NAS-Port-Id "ipoe0"> <NAS-Port-Type Ethernet> <Calling-Station-Id "00:26:18:aa:5e:d9"> <Called-Station-Id "eth1"> <Framed-IP-Address 10.0.100.2> <User-Password >]
[2016-10-24 19:07:10]: debug: ipoe0: radius(1): req_exit 0
[2016-10-24 19:07:10]:  info: ipoe0: recv [RADIUS(1) Access-Accept id=1 <Filter-Id "1,10240"> <Filter-Id "2,10240">]
[2016-10-24 19:07:10]:  info: ipoe0: 10.0.100.2: authentication succeeded
[2016-10-24 19:07:10]:  info: ipoe: start interface eth1 (mode=L3,start=up)
[2016-10-24 19:07:10]: debug: libnetlink: RTNETLINK answers: No such file or directory
[2016-10-24 19:07:10]:   msg: accel-ppp version 810d23477a9ca33dfa2379c3fc742c3c56df3a9d
[2016-10-24 19:07:10]: debug: shaper: time_range_begin_timer: id=1
[2016-10-24 19:07:10]:  info: send [RADIUS(1) Accounting-Request id=1 <Acct-Status-Type Accounting-On> <NAS-Identifier "xxx-gw-01"> <NAS-IP-Address 10.255.0.161>]
[2016-10-24 19:07:10]:  info: recv [RADIUS(1) Accounting-Response id=1]

 

[ipoe]
verbose=100
shared=1
ifcfg=1
mode=L3
start=up
local-net=10.0.100.0/24

l4-redirect-on-reject=60
l4-redirect-ipset=l4-redirect

nat=1
interface=eth1,mode=L3,start=up

 

и так по циклу, сборка с git

Share this post


Link to post
Share on other sites

парни выручайте, вылетает в логи

Собирайте accel-ppp с debug, запускайте его из gdb, затем bt full. И далее смотреть, почему и где вылетает (думаю xeb поможет)

Share this post


Link to post
Share on other sites

вытянул с https://github.com/xebd/accel-ppp.git

[2016-10-25 09:58:04]: error: ipoe0: can't determine router address
[2016-10-25 09:58:04]: debug: ipoe0: terminate
[2016-10-25 09:58:04]:  info: ipoe0: ipoe: session finished

что-то xeb поспешил с кодом,

с форума accel от blind_oracle :Результат работы iproute_get() (ipoe.c:816) присваивается ses->siaddr, а не ses->router

Share this post


Link to post
Share on other sites

kamae1ka

А никто и не говорил что git-сборки хоть как-то проверены и стабильны. Или ставьте релизные, или помогайте дебажить эти.

Share this post


Link to post
Share on other sites

pppoe-mini.png

 

Хрень какая-то

 

 

accel-ppp# show stat

uptime: 0.00:15:03

cpu: 1%

mem(rss/virt): 19096/1352472 kB

core:

mempool_allocated: 2361139

mempool_available: 347855

thread_count: 8

thread_active: 1

context_count: 581

context_sleeping: 0

context_pending: 0

md_handler_count: 2234

md_handler_pending: 0

timer_count: 1113

timer_pending: 0

sessions:

starting: 14

active: 547

finishing: 0

pppoe:

starting: 0

active: 561

delayed PADO: 0

recv PADI: 1027

drop PADI: 0

sent PADO: 1023

recv PADR(dup): 706(0)

sent PADS: 706

filtered: 0

radius(1, С,С.С.С):

state: active

fail count: 0

request count: 0

queue length: 0

auth sent: 701

auth lost(total/5m/1m): 7/0/0

auth avg query time(5m/1m): 3/2 ms

acct sent: 665

acct lost(total/5m/1m): 8/0/0

acct avg query time(5m/1m): 8/0 ms

interim sent: 0

interim lost(total/5m/1m): 0/0/0

interim avg query time(5m/1m): 0/0 ms

 

подключает 547 абоно и выше не хочет....

accel-ppp version e09279c7491a8bd16a25b123e03ddd0cd77b566d

 

подскажите ...

Edited by pashaumka

Share this post


Link to post
Share on other sites

А логи уровня 5 что говорят?

Edited by Dimka88

Share this post


Link to post
Share on other sites

Возможно упираетесь в штатное ограничение линукса на 1024 процесса для одного юзера, встречалось подобное в некоторых листрибутивах.

Проверьте ulimits.

Share this post


Link to post
Share on other sites

Возможно упираетесь в штатное ограничение линукса на 1024 процесса для одного юзера, встречалось подобное в некоторых листрибутивах.

Проверьте ulimits.

 

что именно смотреть?

Share this post


Link to post
Share on other sites

Возможно упираетесь в штатное ограничение линукса на 1024 процесса для одного юзера, встречалось подобное в некоторых листрибутивах.

Копий accel-ppp в системе крутится по количеству процессорных ядер, потому это мимо.

 

что именно смотреть?

Вывод ulimit -a от пользователя, под которым запускается accel-ppp

Share this post


Link to post
Share on other sites

Возможно упираетесь в штатное ограничение линукса на 1024 процесса для одного юзера, встречалось подобное в некоторых листрибутивах.

Копий accel-ppp в системе крутится по количеству процессорных ядер, потому это мимо.

 

что именно смотреть?

Вывод ulimit -a от пользователя, под которым запускается accel-ppp

 

core file size (blocks, -c) 0

data seg size (kbytes, -d) unlimited

scheduling priority (-e) 0

file size (blocks, -f) unlimited

pending signals (-i) 15636

max locked memory (kbytes, -l) 64

max memory size (kbytes, -m) unlimited

open files (-n) 65536

pipe size (512 bytes, -p) 8

POSIX message queues (bytes, -q) 819200

real-time priority (-r) 0

stack size (kbytes, -s) 8192

cpu time (seconds, -t) unlimited

max user processes (-u) 15636

virtual memory (kbytes, -v) unlimited

file locks (-x) unlimited

Share this post


Link to post
Share on other sites

Хм... Какое значение прописано pado-delay в конфиге accel? Терзают смутные подозрения.

Share this post


Link to post
Share on other sites

Хм... Какое значение прописано pado-delay в конфиге accel? Терзают смутные подозрения.

pado-delay=0,50:128,110:256,120:384,130:512,140:768,150:1024,-1:2048

 

после подключения телнетом демоном и установки pppoe set PADO-delay=0 демон никак не отреагировал

Share this post


Link to post
Share on other sites

Для эксперимента, попробуйте прописать pado-delay без -1. И, скорее всего, там надо полностью перезапустить демон.

Share this post


Link to post
Share on other sites

фишка в другом..

на всех брасах такое поведение

 

а демон в работе 232 дня.

да и подмена PADO на лету теоретически должна работать, иначе зачем ее встравивать в CLI

Share this post


Link to post
Share on other sites

к слову, как там на свежих ядрах сейчас с pppoe? есть жизнь, или паники/краши продолжаются?

Share this post


Link to post
Share on other sites

root@bras35:/home/umka# uname -a

Linux bras35 3.2.0-4-amd64 #1 SMP Debian 3.2.73-2+deb7u3 x86_64 GNU/Linux

root@bras35:/home/umka# uptime

17:30:31 up 231 days, 7:23, 2 users, load average: 0,09, 0,14, 0,17

root@bras35:/home/umka#

Share this post


Link to post
Share on other sites

Create an account or sign in to comment

You need to be a member in order to leave a comment

Create an account

Sign up for a new account in our community. It's easy!

Register a new account

Sign in

Already have an account? Sign in here.

Sign In Now