Jump to content

Периодически 'отваливаются' коммутаторы на оптике

Здание 15 этажей, топология 'звезда', в центре на 6-м стоит пара Q-Tech QSW-8400, на этажах - Qtech QSW-3400 и кое-где Cisco 2960/3750G; но каждый этаж - монобрендовый. К 'ядру' каждый этаж подключается по 1 оптическому линку портом одного из коммутаторов доступа ('центрального' на этаже). С оптикой - 'каша': СКС мультимод, поначалу почти все SFP-модули в коммутаторах и патч-корды до них были SM. Периодически то один этаж из 3-х 'отваливался', то другой: потери пакетов 30-50-100% на некоторое время, причём маленькие пакеты (32 байта в ICMP) теряются заметно меньше, чем пакеты, например, 1450 Б. И в то же время ответы на ARP-запросы приходят чётко всегда. Длиться это может 5-10...60 минут, потом (самое интересное!) - проходит САМО. И после работает час-два-полдня. Или если ребутнуть коммутатор на этаже - всё 'налаживается'. Думали - шторм или какие-то левые коммутаторы шлют свои BPDU и влияют на топологию, проверили - не обнаружили. Я вернулся к теории 'привести оптику в порядок'. Подключили 'проблемные' этажи по мультимоду only на б/у трансиверах Cisco и мультимодных патч-кордах. Сеть проработала стабильно полдня, но было 2 случая 'рецидива': разово утром на следующий день и спустя 5 дней. У меня закончились идеи( 'Люди говорят', что 'смесь' MM & SM на короткие расстояния работает норм, но если не работает - то разве не работает не перманентно? Тут главная непонятка - что само восстанавливается. Повангуйте :)

Edited by Safety1st

Share this post


Link to post
Share on other sites

Если порты не флапают, то это 99% шторма.

Спасибо за оперативный ответ!

Порты flap'али: оставшиеся несколько цисок это писали (они могут, не то что Qtech'и xD). Проблему решили: из-за оптической 'каши' в сети периодически возникали unidirectional link'и, а в те времена каждый этаж был подключен 2-мя линками в aggregation. Детект шторма на 8400 и всех Cisco ничего не показал. А на 3400 включить его нет возможности: коммутаторы с 6-й прошивкой тупо перезагружаются, с 7-й начинают бесконечно выводить ошибку ПО с кучей букв.

 

Если-таки шторм: то центральные коммутаторы его могут и не видеть? Или должны?

И на всякий случай: можно ли как-то косвенно определить наличие шторма на 3400-х Qtech'ах, раз напрямую невозможно?

Share this post


Link to post
Share on other sites

Ребята, сейчас всё оказалось просто: оба случая рецидива были на одном и том же этаже (по закону подлости - как раз на том, где сидят IT-ники). Там 1 линк из мультимода, а второй я оставил на всякий случай: там патч-корды и трансиверы SM. Прихожу - MM-линк не работает, активен 'смешанный'. Других вариантов, как сменить патч-корды с обоих сторон MM-линка у меня нет, заюзаю его.

 

P.S. Сегодня больше ничего ответить не смогу :)

Share this post


Link to post
Share on other sites

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.

Guest
Reply to this topic...

×   Pasted as rich text.   Paste as plain text instead

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.