Jump to content
Калькуляторы

Проблема на сетевом уровне Перебои в сети

Добрый день уважаемые форумчане!

 

Есть небольшая сеть в городе. В каждом районе стоит управляемое оборудование D-Link. В сети сеществует два кольца, остальная часть сети построенна по топологии "звезда". На протяжении долгого времени постоянно есть обрвыю. Только в каком то из районом пропадает свет, валится вся сеть..., пользователи не могут авторизироваться... Бешанная нагрузка на сервер (хотя и 4 ядра, Xeon 3.4) Сервер доступа Linux, на борту abills, radius, accel-ppp. Что бы завести все обратно, нужно убивать все сессии и рестартить accel-ppp и radius.

 

Постоянно проблемы, точно на сетевом уровне, но уже длительное время не могу понять в чем именно. Возможно нужно допилить конфигруцию свичей.

 

STP и BPDU настроенно, в логах нет ошибок.

 

Есть подозрения что перестраивается STP и сеть валится на 1,5 минуты.

 

Ребята, IT-шники, сисадмины, кто сталкивался с такими проблемами, помогите кто чем сможет.

 

Так же, в случае положительного результата оплату гарантирую.

Edited by electro_

Share this post


Link to post
Share on other sites

Есть подозрения что перестраивается STP и сеть валится на 1,5 минуты.

 

Вместо STP используйте ручную блокировку порта.

Т.к. траблешутить stp очень затратно и вероятность конечного успеха не велика.

Share this post


Link to post
Share on other sites

Есть подозрения что перестраивается STP и сеть валится на 1,5 минуты.

 

Вместо STP используйте ручную блокировку порта.

Т.к. траблешутить stp очень затратно и вероятность конечного успеха не велика.

 

 

Можно разжевать что имеется ввиду под ручной прокировкой порта?

Share this post


Link to post
Share on other sites
Есть подозрения что перестраивается STP и сеть валится на 1,5 минуты.

А что оно в логах то пишет?

 

STP надо правильно настраивать. В первую очередь отключать на абонентских портах.

 

Смотреть надо что там происходит.

 

Автор -т написал в личку.

Share this post


Link to post
Share on other sites
Есть подозрения что перестраивается STP и сеть валится на 1,5 минуты.

А что оно в логах то пишет?

 

STP надо правильно настраивать. В первую очередь отключать на абонентских портах.

 

Смотреть надо что там происходит.

 

Автор -т написал в личку.

 

 

 

 

STP на клиентах отключено.

 

В логах вот такая дрянь:

 

Spanning Tree port status change (Instance:0,

Port:21) Discarding->Learning

 

 

Spanning Tree port status change (Instance:0,

Port:21) Learning->Forwarding

 

Spanning Tree port role change (Instance:0, P

ort:10) DisabledPort->NonStpPort

 

 

Spanning Tree port role change (Instance:0, P

ort:18) DisabledPort->DesignatedPort

 

 

Это центральный коммутатор, такое творится на всех портах.

Share this post


Link to post
Share on other sites

Если возможно, запустите MSTP, если много виланов. Проверьте максимальную STP дистанцию в хопах. В тех частях сети, где избыточных связей нет, стп можно вообще отключить. Настройте ACL для маков сервера на разных уровнях сети.

Share this post


Link to post
Share on other sites

линки, котгрые не учавствуют в кольце можно защитить с помощью tcn restrict true. приоритеты настроены?

Share this post


Link to post
Share on other sites

Есть подозрения что перестраивается STP

Логи должны показать.

Вопрос: какой bridge diameter установлен (или какой диаметр должны дать установленные тайминги) и какой реально диаметр кольца? STP - имеется ввиду RSTP/MSTP, или таки древний STP? STP, надеюсь, включено только на тех коммутаторах, которые образуют кольцо? Кто рутом назначен - свич(и) агрегации, или девайсы сами разбираются? Если кольца подклчены к разным свичам агрегации - то стоило бы MSTP заюзать таки, с разными регионами.

Share this post


Link to post
Share on other sites

В общем проблема явно с STP.

Надо разбираться и корректно настраивать.

Без схем сети и настроек коммутаторов сказать что то сложно.

Share this post


Link to post
Share on other sites

Добрый день уважаемые форумчане!

 

Есть небольшая сеть в городе. В каждом районе стоит управляемое оборудование D-Link. В сети сеществует два кольца, остальная часть сети построенна по топологии "звезда". На протяжении долгого времени постоянно есть обрвыю. Только в каком то из районом пропадает свет, валится вся сеть..., пользователи не могут авторизироваться... Бешанная нагрузка на сервер (хотя и 4 ядра, Xeon 3.4) Сервер доступа Linux, на борту abills, radius, accel-ppp. Что бы завести все обратно, нужно убивать все сессии и рестартить accel-ppp и radius.

 

Постоянно проблемы, точно на сетевом уровне, но уже длительное время не могу понять в чем именно. Возможно нужно допилить конфигруцию свичей.

 

STP и BPDU настроенно, в логах нет ошибок.

 

Есть подозрения что перестраивается STP и сеть валится на 1,5 минуты.

 

Ребята, IT-шники, сисадмины, кто сталкивался с такими проблемами, помогите кто чем сможет.

 

Так же, в случае положительного результата оплату гарантирую.

 

А вы UPS поставьте на все оборудование по городу. Мощности там не большие. Проблемы не только могут быть от пропадания напряжения, но и от бросков напряжения в сети, и от коротких замыканий даже в других линиях. Возможно где то ваше оборудование запитано от дома. где нет заземляющего контура.

Edited by Electrolamp

Share this post


Link to post
Share on other sites

Если возможно, запустите MSTP, если много виланов. Проверьте максимальную STP дистанцию в хопах. В тех частях сети, где избыточных связей нет, стп можно вообще отключить. Настройте ACL для маков сервера на разных уровнях сети.

 

 

Виланов всего 4 + менеджмент. В сети всего навсего два кольца, вот на этих портах и включен stp. Даже в районах где нет колец, когда пропадает свет в целом районе, то всеравно валится вся сеть... Это просто невыносимо.. Спасибо что отзываетесь. Но пока результата нет, все логи пересмотрели. Ждем еще варианты решения проблемы.

 

Добрый день уважаемые форумчане!

 

Есть небольшая сеть в городе. В каждом районе стоит управляемое оборудование D-Link. В сети сеществует два кольца, остальная часть сети построенна по топологии "звезда". На протяжении долгого времени постоянно есть обрвыю. Только в каком то из районом пропадает свет, валится вся сеть..., пользователи не могут авторизироваться... Бешанная нагрузка на сервер (хотя и 4 ядра, Xeon 3.4) Сервер доступа Linux, на борту abills, radius, accel-ppp. Что бы завести все обратно, нужно убивать все сессии и рестартить accel-ppp и radius.

 

Постоянно проблемы, точно на сетевом уровне, но уже длительное время не могу понять в чем именно. Возможно нужно допилить конфигруцию свичей.

 

STP и BPDU настроенно, в логах нет ошибок.

 

Есть подозрения что перестраивается STP и сеть валится на 1,5 минуты.

 

Ребята, IT-шники, сисадмины, кто сталкивался с такими проблемами, помогите кто чем сможет.

 

Так же, в случае положительного результата оплату гарантирую.

 

А вы UPS поставьте на все оборудование по городу. Мощности там не большие. Проблемы не только могут быть от пропадания напряжения, но и от бросков напряжения в сети, и от коротких замыканий даже в других линиях. Возможно где то ваше оборудование запитано от дома. где нет заземляющего контура.

 

 

Добрый Вам день. Спасибо что отозвались. Но вариант с безперебойниками это самый крайний. Так как ком. шкафы маленькие и безперебойник туда втулить сложно... Перенапряжения в сети нет. Просто пропадает бывает свет и все....

Share this post


Link to post
Share on other sites

Есть подозрения что перестраивается STP

Логи должны показать.

Вопрос: какой bridge diameter установлен (или какой диаметр должны дать установленные тайминги) и какой реально диаметр кольца? STP - имеется ввиду RSTP/MSTP, или таки древний STP? STP, надеюсь, включено только на тех коммутаторах, которые образуют кольцо? Кто рутом назначен - свич(и) агрегации, или девайсы сами разбираются? Если кольца подклчены к разным свичам агрегации - то стоило бы MSTP заюзать таки, с разными регионами.

 

 

Добрый день. STP имеется ввиду таки древний STP. STP включен только на тех коммутаторах, которые образуют кольцо. Рутом свич агрегации. Да. кольца подключены к разным свичам агрегации. Если можно об этом чуть подробней. Этот вариант еще не рассматривали.

 

Сейчас планируем уходить от колец. На данный момент убрали одно кольцо и осталось одно кольцо, которое заходит в свич агрегации.

 

Но проблема присутствует :( Даже в тех районах, где нет колец, когда падает свет, все райно ложится сеть и все pppoe сессии валятся :(

 

Если надо могу выложить конфиги свичей агрегации - выслать на емейл. Всем кто отзывается спасибо. А кто избавит нас от этой проблемы - денежное вознаграждение ГАРАНТИРУЕМ.

Share this post


Link to post
Share on other sites
Если надо могу выложить конфиги свичей агрегации - выслать на емейл.

Это несерьезно.

Берите ваших админов, собирайте стенд и воспроизводите проблему. Потом крутите, проверяйте, внедряйте в продакшн.

Можно и нужно попробовать написать вендорам оборудования.

 

А решать проблему удаленно по емейлу - вариант плохой.

Share this post


Link to post
Share on other sites
Если надо могу выложить конфиги свичей агрегации - выслать на емейл.

Это несерьезно.

Берите ваших админов, собирайте стенд и воспроизводите проблему. Потом крутите, проверяйте, внедряйте в продакшн.

Можно и нужно попробовать написать вендорам оборудования.

 

А решать проблему удаленно по емейлу - вариант плохой.

 

Да писали уже в саппорт Д-Линка. Говорили что возможен шторм сети из за некоторой партии свичей, на который какая то прошивка.. А вот каких, хрен его знает, у нас их штук 100 :) Ну спс, будем собирать стенд и убирать кольца из сети.

Share this post


Link to post
Share on other sites

STP имеется ввиду таки древний STP.

Как минимум - перейти на RSTP. MSTP имел бы смысл если бы кольца как-то соприкасались, иначе профита от него не будет.

 

Даже в тех районах, где нет колец, когда падает свет, все райно ложится сеть и все pppoe сессии валятся :(

Сегментировать сеть. Включить в кольцах STP loop protection (если таковое имеется).

 

И да, сколько свичей в колечке, и какой установлен bridge diameter? Неверное значение bridge diameter вполне себе может привести сеть в подобное состояние. Суть bridge diameter - максимальное кол-во свичей между двумя точками сети в худшем случае (обрыв какого-то из линков). По дефолту он ставится в 7 (т.е. - свич агрегации + максимум 6 свичей в кольце).

 

Подробнее - без данных (примерная схема сети, конфиг STP свичей и т.п.) сказат сложно.

Share this post


Link to post
Share on other sites

STP имеется ввиду таки древний STP.

Как минимум - перейти на RSTP. MSTP имел бы смысл если бы кольца как-то соприкасались, иначе профита от него не будет.

 

Даже в тех районах, где нет колец, когда падает свет, все райно ложится сеть и все pppoe сессии валятся :(

Сегментировать сеть. Включить в кольцах STP loop protection (если таковое имеется).

 

И да, сколько свичей в колечке, и какой установлен bridge diameter? Неверное значение bridge diameter вполне себе может привести сеть в подобное состояние. Суть bridge diameter - максимальное кол-во свичей между двумя точками сети в худшем случае (обрыв какого-то из линков). По дефолту он ставится в 7 (т.е. - свич агрегации + максимум 6 свичей в кольце).

 

Подробнее - без данных (примерная схема сети, конфиг STP свичей и т.п.) сказат сложно.

 

 

Спасибо что отозвались. Да пробовали уже все.. Решили уйти от колец и перестроить сеть. Нарыл инфо что может быть из за галимой прошивки на некоторых свичах из старых партий... Будем шить сие чудо на что то новое. D-Link 1228 ME

Share this post


Link to post
Share on other sites

Create an account or sign in to comment

You need to be a member in order to leave a comment

Create an account

Sign up for a new account in our community. It's easy!

Register a new account

Sign in

Already have an account? Sign in here.

Sign In Now
Sign in to follow this