Andrei Posted May 31, 2015 Posted May 31, 2015 Пошла нехилая гроза, дважды било в трансформаторную подстанцию, обеспечивающую эл.питанием наш небольшой городок с бросками напряжения по всему городу. Сервера, свичи и циски с центре на ИБП, не перегружались, в домах - кому как повезло. На агрегации стоят dgs-3100/3120, в домах des-3026/gds-3000. После катаклизмов частично (хаотично без привязки к какому-то району города) перестали работать pppoe подключения, при том, что pptp с тех же домов работает как ни в чем ни бывало, несколько клиентов пришлось пересадить с pppoe на pptp иначе не работало :( Причем у этих клиентов, которых пересадил с pppoe на pptp, порты не менял, т.е. порты целые На свичах было настроено только traffic_segmentation и отдельный управляющий vlan, конфиги на месте. Терминируются pptp/pppoe на cisco 7204. Вся сеть на L2. В центре тоже стоит DGS-3120-24SC, на нем замиррорил порт куда воткнута циска: DGS-3120-24SC:admin#config mirror port 5 add source port 4 both Command: config mirror port 5 add source ports 4 both Success. DGS-3120-24SC:admin#sh mirror Command: show mirror Mirror Global State: Enabled Group State Target Port Source Ports ------- ---------- ------------- ---------------------------------------------- 1 Enabled 5 RX: 4 TX: 4 на 5м порту - сервер с линухом слушаю там PADI/PADO: tshark -i eth1 proto 0x8863 тишина... :( Если просто tshark -i eth1 , то виден трафик работающих pppoe-клиентов. В какую сторону еще копать для диагностики? Вставить ник Quote
EShirokiy Posted May 31, 2015 Posted May 31, 2015 Andrei, а у вас pptp и pppoe в одном абонентском vlan? Вставить ник Quote
Andrei Posted May 31, 2015 Author Posted May 31, 2015 Andrei, а у вас pptp и pppoe в одном абонентском vlan? Да, влан один и тот же, но гейтвеем для pptp является Линух-сервер, за которым стоит циска. А pppoe коннктятся сразу к циске. Физические порты на циске для pptp и pppoe разные. Вставить ник Quote
Butch3r Posted May 31, 2015 Posted May 31, 2015 Проверьте storm control на свичах, после грозы могло побить порты и вызвать броадкаст шторм Вставить ник Quote
SyJet Posted May 31, 2015 Posted May 31, 2015 (edited) Пошла нехилая гроза, дважды било в трансформаторную подстанцию, обеспечивающую эл.питанием наш небольшой городок с бросками напряжения по всему городу. Сервера, свичи и циски с центре на ИБП, не перегружались, в домах - кому как повезло. На агрегации стоят dgs-3100/3120, в домах des-3026/gds-3000. После катаклизмов частично (хаотично без привязки к какому-то району города) перестали работать pppoe подключения, при том, что pptp с тех же домов работает как ни в чем ни бывало, несколько клиентов пришлось пересадить с pppoe на pptp иначе не работало :( Причем у этих клиентов, которых пересадил с pppoe на pptp, порты не менял, т.е. порты целые На свичах было настроено только traffic_segmentation и отдельный управляющий vlan, конфиги на месте. Терминируются pptp/pppoe на cisco 7204. Вся сеть на L2. В центре тоже стоит DGS-3120-24SC, на нем замиррорил порт куда воткнута циска: DGS-3120-24SC:admin#config mirror port 5 add source port 4 both Command: config mirror port 5 add source ports 4 both Success. DGS-3120-24SC:admin#sh mirror Command: show mirror Mirror Global State: Enabled Group State Target Port Source Ports ------- ---------- ------------- ---------------------------------------------- 1 Enabled 5 RX: 4 TX: 4 на 5м порту - сервер с линухом слушаю там PADI/PADO: tshark -i eth1 proto 0x8863 тишина... :( Если просто tshark -i eth1 , то виден трафик работающих pppoe-клиентов. В какую сторону еще копать для диагностики? Знакомая ситуация, в итоге нашли несколько срущих клиентов в некоторых вланах (влан на район). Edited May 31, 2015 by SyJet Вставить ник Quote
AlKov Posted May 31, 2015 Posted May 31, 2015 А банально ребутнуть все свитчи в проблемной "цепочке" не пробовали? Особенно это касается DGS-3100. Ужасно глючат, особенно если "нижнее" оборудование "петляет", что в грозу происходит очень часто. Loopback detect на DGS-3100 можно сказать, отсутствует (настраивается через ж.. и походу не работает), и прилетевшая "петля" ставит его в ступор. Проблема решается ребутом. P.S. Кстати, проверьте всё железо на предмет петель. Вставить ник Quote
Andrei Posted May 31, 2015 Author Posted May 31, 2015 Петель точно нет - везде топология дерево. Отключать посегментно пробовал - ситуацию не меняет. Подгоревшие порты - сложно сказать как их искать. storm control на свичах не настраивал. местами в закоулках и мелких домах есть управляемые, но недостаточно умные Planet wgsd-1020, где даже управление не вынести в отдельный влан :( А банально ребутнуть все свитчи в проблемной "цепочке" не пробовали? А банально нет "проблемных цепочек" - прочитайте 1е сообщение. Знакомая ситуация, в итоге нашли несколько срущих клиентов в некоторых вланах (влан на район). Роутеры? Или подгоревшие сетевые карты? Вставить ник Quote
NiTr0 Posted May 31, 2015 Posted May 31, 2015 Петель точно нет - везде топология дерево. И что? Это мешает подбитому порту сделать "петлю" на самом себе? По сабжу - смотреть внимательно что творится в сегментах. А лучше - поделить сеть на вланы (влан на 30-50 клиентов максимум). Вставить ник Quote
Andrei Posted May 31, 2015 Author Posted May 31, 2015 Петель точно нет - везде топология дерево. И что? Это мешает подбитому порту сделать "петлю" на самом себе? По сабжу - смотреть внимательно что творится в сегментах. А лучше - поделить сеть на вланы (влан на 30-50 клиентов максимум). Давно слышу такие советы, но не пойму до конца как это сделать. Схема: циска - центральный dgs-3120 - районные dgs-3120/3100 - аксессные des-3026. Вставить ник Quote
Butch3r Posted May 31, 2015 Posted May 31, 2015 На 3120 включите: enable loopdetectconfig loopdetect recover_timer 600config loopdetect mode vlan-basedconfig loopdetect log state enableconfig loopdetect ports 1-23 state enable Порты в сторону узлов, не в сторону аплинка. И посмотрите будет ли что-нибудь в логе Вставить ник Quote
AlKov Posted May 31, 2015 Posted May 31, 2015 Петель точно нет - везде топология дерево. В данном случае (последствия грозы) топология на "скорость" (наличие "петель") не влияет. "Петлю" создаёт "подгоревший" порт свитча, или сетевой карты клиента. А дальше она летит со скоростью света по всей сети/влану. Отключать посегментно пробовал - ситуацию не меняет. Подгоревшие порты - сложно сказать как их искать. storm control на свичах не настраивал. Я так понимаю, Loopdetect у Вас нигде не настроен? А надо! "Послегрозовые" проблемы (да и не только) очень помогает решать. Последуйте совету Butch3r и настройте Loopdetect везде, где только это возможно. Жить станет веселее. :-) Ну и не забывайте про капризы DGS-3100. Это я Вам говорю из собственного опыта. Недавно, как вчера, ребутал этого уродца, своеобразно зависшего во время грозы ("словил" петлю от дохлого порта акцессного свитча). А банально ребутнуть все свитчи в проблемной "цепочке" не пробовали? А банально нет "проблемных цепочек" - прочитайте 1е сообщение. Похоже, всё-таки есть.. Вставить ник Quote
EShirokiy Posted May 31, 2015 Posted May 31, 2015 Простите за странный вопрос, а вы перезагружали свою циску? Если ИБП устроен на базе инвертора и аккумуляторов, то при перепадах напряжения возникают достаточно сильный импульс. У нас так зависали серваки и точки. Вставить ник Quote
NiTr0 Posted May 31, 2015 Posted May 31, 2015 Давно слышу такие советы, но не пойму до конца как это сделать. Создать вланы на циске/линукс роутере, протянуть их до коммутатора доступа, на них - все абон порты поставить в этот влан как access. Ессно, ip адреса для pptp надо будет поменять, и на линуксовом тазике на каждый влан завести свою подсеть. Вставить ник Quote
Andrei Posted May 31, 2015 Author Posted May 31, 2015 На 3120 включите: enable loopdetect config loopdetect recover_timer 600 config loopdetect mode vlan-based config loopdetect log state enable config loopdetect ports 1-23 state enable Порты в сторону узлов, не в сторону аплинка. И посмотрите будет ли что-нибудь в логе Там, где стоят 3120 включил. В логе почти сразу: 43 2015-05-31 21:19:02 CRIT(2) Port 1:15 VID 4 LBD loop occurred. Packet discard begun 42 2015-05-31 21:18:52 INFO(6) Port 1:15 VID 4 LBD recovered. Loop detection restarted На 3100 (который на агрегации на 15м порту 3120) это так просто не включается. Сделал enable stp DGS-3100# sh stp STP Status : Enabled STP Version : STP Compatible Max Age : 20 Hello Time : 2 Forward Delay : 15 Max Hops : 20 Forwarding BPDU : Disabled Loopback Detection : Enabled Loopback Detection Interval : 60 В логах пусто. Давно слышу такие советы, но не пойму до конца как это сделать. Создать вланы на циске/линукс роутере, протянуть их до коммутатора доступа, на них - все абон порты поставить в этот влан как access. Ессно, ip адреса для pptp надо будет поменять, и на линуксовом тазике на каждый влан завести свою подсеть. Т.е. если делать vlan на свич, то пользователи каждого свича будут коннектиться каждый к своему интерфейсу (ip-адресу) vpn-сервера? Вставить ник Quote
Andrei Posted May 31, 2015 Author Posted May 31, 2015 Простите за странный вопрос, а вы перезагружали свою циску? Если ИБП устроен на базе инвертора и аккумуляторов, то при перепадах напряжения возникают достаточно сильный импульс. У нас так зависали серваки и точки. Наверное стоит и ребутнуть ночером. Я так понимаю, Loopdetect у Вас нигде не настроен? А надо! "Послегрозовые" проблемы (да и не только) очень помогает решать. Последуйте совету Butch3r и настройте Loopdetect везде, где только это возможно. Жить станет веселее. :-) Ну и не забывайте про капризы DGS-3100. Это я Вам говорю из собственного опыта. на 3120 везде только что настроил. На 3100 это делается через enable stp ? Есть у меня на сетке 3 таких уродца. :) Ребутил их уже, но пока безрезультатно :( Вставить ник Quote
Andrei Posted May 31, 2015 Author Posted May 31, 2015 enable stp на 3100, на котором агрегируется микрорайон, привел к развалу сетки в микрорайоне :( свичи, которые в одном влане с юзерами (есть такое, где управление нельзя вынести в отдельный влан) не пингуются даже. disable stp положение не спас. :( Вставить ник Quote
zhenya` Posted May 31, 2015 Posted May 31, 2015 3100 почисти фбд.. Поможет временно.. Ему от петель бошку сносит и перестает форвардить трафик нормально.. В проблемных лучах с жалобами в первую очередь включайте лупбэк детект. Ибо на длинках с подгорелых портов маки летят. Вставить ник Quote
EShirokiy Posted May 31, 2015 Posted May 31, 2015 Кстати, достаточно удобно выводить абонентские VLAN или VLAN управления в антеге прямо со свитча агрегации, что бы ручками лишний раз ничего не настраивать) Andrei, пожалуйста, напишите чем дело закончится Вставить ник Quote
Andrei Posted May 31, 2015 Author Posted May 31, 2015 Кстати, достаточно удобно выводить абонентские VLAN или VLAN управления в антеге прямо со свитча агрегации, что бы ручками лишний раз ничего не настраивать) У меня на каждом свиче один порт выведен в антеге из влана управления как раз для этого Andrei, пожалуйста, напишите чем дело закончится На сегодня наверное ничем - решил на des-3026 удаленно залить софт (поменять 4.0 на 4.30) - свича потерял. :( Видимо на сегодня экспериментов хватит :( Вставить ник Quote
EShirokiy Posted May 31, 2015 Posted May 31, 2015 Andrei, на 3026 сначала надо prom обновить до версии 1.01.009, потом уже прошивку накатывать. Скорее всего у свитча крыша поехала и надо будет через консольку пром с прошивкой закачивать Вставить ник Quote
NiTr0 Posted May 31, 2015 Posted May 31, 2015 Т.е. если делать vlan на свич, то пользователи каждого свича будут коннектиться каждый к своему интерфейсу (ip-адресу) vpn-сервера? Зачем? Маршрутизацию можно сделать же... Вставить ник Quote
Butch3r Posted June 1, 2015 Posted June 1, 2015 Там, где стоят 3120 включил. В логе почти сразу: 43 2015-05-31 21:19:02 CRIT(2) Port 1:15 VID 4 LBD loop occurred. Packet discard begun 42 2015-05-31 21:18:52 INFO(6) Port 1:15 VID 4 LBD recovered. Loop detection restarted Ну и славненько. Идём на 15 порт (на свич который в него включен) и ищем битый порт. Если там стоит свич который умеет loopdetect - настраиваем его там. Если не умеет - поочереди выключайте порты, на которых есть линки и рестартуйте loop на 3120. Как перестанет в лог писать - найден битый порт. Вставить ник Quote
Andrei Posted June 1, 2015 Author Posted June 1, 2015 Там, где стоят 3120 включил. В логе почти сразу: 43 2015-05-31 21:19:02 CRIT(2) Port 1:15 VID 4 LBD loop occurred. Packet discard begun 42 2015-05-31 21:18:52 INFO(6) Port 1:15 VID 4 LBD recovered. Loop detection restarted Ну и славненько. Идём на 15 порт (на свич который в него включен) и ищем битый порт. Если там стоит свич который умеет loopdetect - настраиваем его там. Если не умеет - поочереди выключайте порты, на которых есть линки и рестартуйте loop на 3120. Как перестанет в лог писать - найден битый порт. На 15м порту dgs-3100 :( Там enable loopdetect нет. :( Есть enable stp, но он разваливает всю сетку из свичей, которые подключены в этот dgs-3100 Т.е. если делать vlan на свич, то пользователи каждого свича будут коннектиться каждый к своему интерфейсу (ip-адресу) vpn-сервера? Зачем? Маршрутизацию можно сделать же... Яснее не стало. RTFM конечно, но можно было бы давно посоветовать что-то более менее конкретное :) Вставить ник Quote
Butch3r Posted June 1, 2015 Posted June 1, 2015 Ну пробуйте на 3100 ложить порты в сторону узлов и найдите порт, при отключении которого перестанет лупить. Дальше как я уже писал :) Вставить ник Quote
zhenya` Posted June 1, 2015 Posted June 1, 2015 включать лбд на коммутаторах за 3100.. в первую очередь.. Вставить ник Quote
Recommended Posts
Join the conversation
You can post now and register later. If you have an account, sign in now to post with your account.