Jump to content
Калькуляторы

Перестали работать подключения по pppoe

Пошла нехилая гроза, дважды било в трансформаторную подстанцию, обеспечивающую эл.питанием наш небольшой городок с бросками напряжения по всему городу. Сервера, свичи и циски с центре на ИБП, не перегружались, в домах - кому как повезло. На агрегации стоят dgs-3100/3120, в домах des-3026/gds-3000. После катаклизмов частично (хаотично без привязки к какому-то району города) перестали работать pppoe подключения, при том, что pptp с тех же домов работает как ни в чем ни бывало, несколько клиентов пришлось пересадить с pppoe на pptp иначе не работало :( Причем у этих клиентов, которых пересадил с pppoe на pptp, порты не менял, т.е. порты целые

На свичах было настроено только traffic_segmentation и отдельный управляющий vlan, конфиги на месте.

Терминируются pptp/pppoe на cisco 7204. Вся сеть на L2.

В центре тоже стоит DGS-3120-24SC, на нем замиррорил порт куда воткнута циска:

DGS-3120-24SC:admin#config mirror port 5 add source port 4 both
Command: config mirror port 5 add source ports 4 both
Success.

DGS-3120-24SC:admin#sh mirror
Command: show mirror
Mirror Global State:   Enabled
Group   State      Target Port   Source Ports
------- ---------- ------------- ----------------------------------------------
1       Enabled    5             RX: 4
                                 TX: 4

 

на 5м порту - сервер с линухом

слушаю там PADI/PADO: tshark -i eth1 proto 0x8863

тишина... :(

Если просто tshark -i eth1 , то виден трафик работающих pppoe-клиентов.

В какую сторону еще копать для диагностики?

Share this post


Link to post
Share on other sites

Andrei, а у вас pptp и pppoe в одном абонентском vlan?

Share this post


Link to post
Share on other sites

Andrei, а у вас pptp и pppoe в одном абонентском vlan?

Да, влан один и тот же, но гейтвеем для pptp является Линух-сервер, за которым стоит циска.

А pppoe коннктятся сразу к циске.

Физические порты на циске для pptp и pppoe разные.

Share this post


Link to post
Share on other sites

Проверьте storm control на свичах, после грозы могло побить порты и вызвать броадкаст шторм

Share this post


Link to post
Share on other sites

Пошла нехилая гроза, дважды било в трансформаторную подстанцию, обеспечивающую эл.питанием наш небольшой городок с бросками напряжения по всему городу. Сервера, свичи и циски с центре на ИБП, не перегружались, в домах - кому как повезло. На агрегации стоят dgs-3100/3120, в домах des-3026/gds-3000. После катаклизмов частично (хаотично без привязки к какому-то району города) перестали работать pppoe подключения, при том, что pptp с тех же домов работает как ни в чем ни бывало, несколько клиентов пришлось пересадить с pppoe на pptp иначе не работало :( Причем у этих клиентов, которых пересадил с pppoe на pptp, порты не менял, т.е. порты целые

На свичах было настроено только traffic_segmentation и отдельный управляющий vlan, конфиги на месте.

Терминируются pptp/pppoe на cisco 7204. Вся сеть на L2.

В центре тоже стоит DGS-3120-24SC, на нем замиррорил порт куда воткнута циска:

DGS-3120-24SC:admin#config mirror port 5 add source port 4 both
Command: config mirror port 5 add source ports 4 both
Success.

DGS-3120-24SC:admin#sh mirror
Command: show mirror
Mirror Global State:   Enabled
Group   State      Target Port   Source Ports
------- ---------- ------------- ----------------------------------------------
1       Enabled    5             RX: 4
                                 TX: 4

 

на 5м порту - сервер с линухом

слушаю там PADI/PADO: tshark -i eth1 proto 0x8863

тишина... :(

Если просто tshark -i eth1 , то виден трафик работающих pppoe-клиентов.

В какую сторону еще копать для диагностики?

 

Знакомая ситуация, в итоге нашли несколько срущих клиентов в некоторых вланах (влан на район).

Edited by SyJet

Share this post


Link to post
Share on other sites

А банально ребутнуть все свитчи в проблемной "цепочке" не пробовали?

Особенно это касается DGS-3100. Ужасно глючат, особенно если "нижнее" оборудование "петляет", что в грозу происходит очень часто.

Loopback detect на DGS-3100 можно сказать, отсутствует (настраивается через ж.. и походу не работает), и прилетевшая "петля" ставит его в ступор.

Проблема решается ребутом.

 

P.S. Кстати, проверьте всё железо на предмет петель.

Share this post


Link to post
Share on other sites

Петель точно нет - везде топология дерево.

Отключать посегментно пробовал - ситуацию не меняет.

Подгоревшие порты - сложно сказать как их искать.

storm control на свичах не настраивал.

местами в закоулках и мелких домах есть управляемые, но недостаточно умные Planet wgsd-1020, где даже управление не вынести в отдельный влан :(

 

А банально ребутнуть все свитчи в проблемной "цепочке" не пробовали?

 

А банально нет "проблемных цепочек" - прочитайте 1е сообщение.

 

Знакомая ситуация, в итоге нашли несколько срущих клиентов в некоторых вланах (влан на район).

 

Роутеры? Или подгоревшие сетевые карты?

Share this post


Link to post
Share on other sites

Петель точно нет - везде топология дерево.

 

 

И что? Это мешает подбитому порту сделать "петлю" на самом себе?

 

По сабжу - смотреть внимательно что творится в сегментах. А лучше - поделить сеть на вланы (влан на 30-50 клиентов максимум).

Share this post


Link to post
Share on other sites

Петель точно нет - везде топология дерево.

 

 

И что? Это мешает подбитому порту сделать "петлю" на самом себе?

 

По сабжу - смотреть внимательно что творится в сегментах. А лучше - поделить сеть на вланы (влан на 30-50 клиентов максимум).

 

Давно слышу такие советы, но не пойму до конца как это сделать.

Схема: циска - центральный dgs-3120 - районные dgs-3120/3100 - аксессные des-3026.

Share this post


Link to post
Share on other sites

На 3120 включите:

 

enable loopdetectconfig loopdetect recover_timer 600config loopdetect mode vlan-basedconfig loopdetect log state enableconfig loopdetect ports 1-23 state enable

Порты в сторону узлов, не в сторону аплинка. И посмотрите будет ли что-нибудь в логе

Share this post


Link to post
Share on other sites

Петель точно нет - везде топология дерево.

В данном случае (последствия грозы) топология на "скорость" (наличие "петель") не влияет.

"Петлю" создаёт "подгоревший" порт свитча, или сетевой карты клиента.

А дальше она летит со скоростью света по всей сети/влану.

Отключать посегментно пробовал - ситуацию не меняет.

Подгоревшие порты - сложно сказать как их искать.

storm control на свичах не настраивал.

Я так понимаю, Loopdetect у Вас нигде не настроен?

А надо! "Послегрозовые" проблемы (да и не только) очень помогает решать.

Последуйте совету Butch3r и настройте Loopdetect везде, где только это возможно.

Жить станет веселее. :-)

Ну и не забывайте про капризы DGS-3100. Это я Вам говорю из собственного опыта.

Недавно, как вчера, ребутал этого уродца, своеобразно зависшего во время грозы ("словил" петлю от дохлого порта акцессного свитча).

А банально ребутнуть все свитчи в проблемной "цепочке" не пробовали?

А банально нет "проблемных цепочек" - прочитайте 1е сообщение.

Похоже, всё-таки есть..

Share this post


Link to post
Share on other sites

Простите за странный вопрос, а вы перезагружали свою циску? Если ИБП устроен на базе инвертора и аккумуляторов, то при перепадах напряжения возникают достаточно сильный импульс. У нас так зависали серваки и точки.

Share this post


Link to post
Share on other sites

Давно слышу такие советы, но не пойму до конца как это сделать.

Создать вланы на циске/линукс роутере, протянуть их до коммутатора доступа, на них - все абон порты поставить в этот влан как access. Ессно, ip адреса для pptp надо будет поменять, и на линуксовом тазике на каждый влан завести свою подсеть.

Share this post


Link to post
Share on other sites

На 3120 включите:

enable loopdetect
config loopdetect recover_timer 600
config loopdetect mode vlan-based
config loopdetect log state enable
config loopdetect ports 1-23 state enable

Порты в сторону узлов, не в сторону аплинка. И посмотрите будет ли что-нибудь в логе

Там, где стоят 3120 включил. В логе почти сразу:

43    2015-05-31 21:19:02 CRIT(2) Port 1:15 VID 4 LBD loop occurred. Packet discard begun
42    2015-05-31 21:18:52 INFO(6) Port 1:15 VID 4 LBD recovered. Loop detection restarted

 

На 3100 (который на агрегации на 15м порту 3120) это так просто не включается.

Сделал

enable stp
DGS-3100# sh stp

STP Status                  : Enabled
STP Version                 : STP Compatible
Max Age                     : 20
Hello Time                  : 2
Forward Delay               : 15
Max Hops                    : 20
Forwarding BPDU             : Disabled
Loopback Detection          : Enabled
Loopback Detection Interval : 60

В логах пусто.

 

Давно слышу такие советы, но не пойму до конца как это сделать.

Создать вланы на циске/линукс роутере, протянуть их до коммутатора доступа, на них - все абон порты поставить в этот влан как access. Ессно, ip адреса для pptp надо будет поменять, и на линуксовом тазике на каждый влан завести свою подсеть.

Т.е. если делать vlan на свич, то пользователи каждого свича будут коннектиться каждый к своему интерфейсу (ip-адресу) vpn-сервера?

Share this post


Link to post
Share on other sites

Простите за странный вопрос, а вы перезагружали свою циску? Если ИБП устроен на базе инвертора и аккумуляторов, то при перепадах напряжения возникают достаточно сильный импульс. У нас так зависали серваки и точки.

Наверное стоит и ребутнуть ночером.

 

Я так понимаю, Loopdetect у Вас нигде не настроен?

А надо! "Послегрозовые" проблемы (да и не только) очень помогает решать.

Последуйте совету Butch3r и настройте Loopdetect везде, где только это возможно.

Жить станет веселее. :-)

Ну и не забывайте про капризы DGS-3100. Это я Вам говорю из собственного опыта.

на 3120 везде только что настроил. На 3100 это делается через enable stp ?

Есть у меня на сетке 3 таких уродца. :) Ребутил их уже, но пока безрезультатно :(

Share this post


Link to post
Share on other sites

enable stp на 3100, на котором агрегируется микрорайон, привел к развалу сетки в микрорайоне :(

свичи, которые в одном влане с юзерами (есть такое, где управление нельзя вынести в отдельный влан) не пингуются даже.

disable stp положение не спас. :(

Share this post


Link to post
Share on other sites

3100 почисти фбд.. Поможет временно.. Ему от петель бошку сносит и перестает форвардить трафик нормально..

 

В проблемных лучах с жалобами в первую очередь включайте лупбэк детект. Ибо на длинках с подгорелых портов маки летят.

Share this post


Link to post
Share on other sites

Кстати, достаточно удобно выводить абонентские VLAN или VLAN управления в антеге прямо со свитча агрегации, что бы ручками лишний раз ничего не настраивать)

Andrei, пожалуйста, напишите чем дело закончится

Share this post


Link to post
Share on other sites

Кстати, достаточно удобно выводить абонентские VLAN или VLAN управления в антеге прямо со свитча агрегации, что бы ручками лишний раз ничего не настраивать)

У меня на каждом свиче один порт выведен в антеге из влана управления как раз для этого

 

Andrei, пожалуйста, напишите чем дело закончится

На сегодня наверное ничем - решил на des-3026 удаленно залить софт (поменять 4.0 на 4.30) - свича потерял. :( Видимо на сегодня экспериментов хватит :(

Share this post


Link to post
Share on other sites

Andrei, на 3026 сначала надо prom обновить до версии 1.01.009, потом уже прошивку накатывать. Скорее всего у свитча крыша поехала и надо будет через консольку пром с прошивкой закачивать

Share this post


Link to post
Share on other sites

Т.е. если делать vlan на свич, то пользователи каждого свича будут коннектиться каждый к своему интерфейсу (ip-адресу) vpn-сервера?

Зачем? Маршрутизацию можно сделать же...

Share this post


Link to post
Share on other sites

Там, где стоят 3120 включил. В логе почти сразу:

 

43 2015-05-31 21:19:02 CRIT(2) Port 1:15 VID 4 LBD loop occurred. Packet discard begun

42 2015-05-31 21:18:52 INFO(6) Port 1:15 VID 4 LBD recovered. Loop detection restarted

Ну и славненько. Идём на 15 порт (на свич который в него включен) и ищем битый порт. Если там стоит свич который умеет loopdetect - настраиваем его там. Если не умеет - поочереди выключайте порты, на которых есть линки и рестартуйте loop на 3120. Как перестанет в лог писать - найден битый порт.

Share this post


Link to post
Share on other sites

Там, где стоят 3120 включил. В логе почти сразу:

 

43 2015-05-31 21:19:02 CRIT(2) Port 1:15 VID 4 LBD loop occurred. Packet discard begun

42 2015-05-31 21:18:52 INFO(6) Port 1:15 VID 4 LBD recovered. Loop detection restarted

Ну и славненько. Идём на 15 порт (на свич который в него включен) и ищем битый порт. Если там стоит свич который умеет loopdetect - настраиваем его там. Если не умеет - поочереди выключайте порты, на которых есть линки и рестартуйте loop на 3120. Как перестанет в лог писать - найден битый порт.

На 15м порту dgs-3100 :(

Там enable loopdetect нет. :(

Есть enable stp, но он разваливает всю сетку из свичей, которые подключены в этот dgs-3100

 

Т.е. если делать vlan на свич, то пользователи каждого свича будут коннектиться каждый к своему интерфейсу (ip-адресу) vpn-сервера?

Зачем? Маршрутизацию можно сделать же...

Яснее не стало. RTFM конечно, но можно было бы давно посоветовать что-то более менее конкретное :)

Share this post


Link to post
Share on other sites

Ну пробуйте на 3100 ложить порты в сторону узлов и найдите порт, при отключении которого перестанет лупить.

Дальше как я уже писал :)

Share this post


Link to post
Share on other sites

включать лбд на коммутаторах за 3100.. в первую очередь..

Share this post


Link to post
Share on other sites

Create an account or sign in to comment

You need to be a member in order to leave a comment

Create an account

Sign up for a new account in our community. It's easy!

Register a new account

Sign in

Already have an account? Sign in here.

Sign In Now
Sign in to follow this