Adimu Posted February 9, 2017 доброго времени суток . прошу помочь с коммутаторами esc3510-28. у нас их порядка нескольких десятков , приобрели менее года назад. помимо них есть также сотня других вендоров(cisco zyxel quidway(huawei) ) постепенно начали внедрять. и вот они начали виснуть почти сразу же , сначала редко , потому что их было мало и было непринципиально , потом больше и больше. и если раньше с прошивкой 1.5.1.17 отваливался только менеджмент + ну может 1 разок и юзеры остались ни с чем за компанию , то при переходе на 1.18 это ( доступ к ежу + трафик абонентов переставал передаваться) стало повторяться до невозможности часто( могут и по пару раз в день , или в пару дней раз) коммутаторы подключаются они у нас между собой просто - в линейку или в цепочку один в другой , 1 влан на управление , другие - юзерам. при зависании trunk-ые порты остаются в up-е . Помогает простой ребут edge-а. кто чем может помочь ? посоветовать что ? где копать ? может кто сталкивался . конфиг есть . edge.txt Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
witch Posted February 9, 2017 А rstp точно нужен? Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
Adimu Posted February 9, 2017 А rstp точно нужен? в принципе нет . никаких избыточных каналов между коммутаторами нет. Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
Adimu Posted February 9, 2017 при rstp в момент "простоя-зависания" порты вроде не блокируются , но трафика на транковых портах нет. может я чего недопонимаю товарищи... кто-нибудь может что-то ещё подсказать ? в какую сторону смотреть ? что мониторить ? фильтровать ? и ещё вопрос. при настройке команды spanning-tree bpdufilter на порту edgecore, как я понимаю , свитч сразу же будет фильтровать тут полученные bpdu, не тратя своего времени. будет ли он при этом не отсылать bpdu на данном интерфейсе ? насколько я знаю на цисках эта команда фильтрует в обе стороны, а тут .... Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
Sacrament Posted February 10, 2017 Пинг на менеджмент совсем не проходит? Было похожее пакеты больше 202 или 203 байт переставал пропускать через себя. Пришлось ждать пока допилят прошивку. Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
witch Posted February 10, 2017 (edited) Отулючайте всё лишнее. В логах то что? К зависшему свичу кончолью подключиться можно? Edited February 10, 2017 by witch Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
Adimu Posted February 10, 2017 Пинг на менеджмент совсем не проходит? Было похожее пакеты больше 202 или 203 байт переставал пропускать через себя. Пришлось ждать пока допилят прошивку. сегодня установили на два десятка edge-core-ов новую прошивку 2.7, посоветовали нам саппорт , сказали что баги подправлены по сравнению с предыдущими, проверьте. И вот в течении 2 часов отвалились 3 ветки свитчей. что странно во всех первым стоит zyxel mes 3500 и после него всё начинает отваливаться, хотя и без zyxel в ветке тоже висло . ветка 1: 1zyxelmes3500(45) - 2edge3510-28(10.10.10.46) - 3edge3510-28 - 4edge3510-28 - 5zyxelmes3500 - 6edge3510-28(10.10.10.49) тут отвалился доступ vty ( telnet ) со 2 по 6 свитчи. они пинговались , но трафик не ходил на 1 свитч , не считая около 0-2 байт ,такое ощущение что проходили только arp да İCMP-пакеты пинги , даже получилось попасть со 2 свитча на менеджмент. Однако с менеджента к себе на 2 свитч не хотел пускать. Ребутнули 2-ой , заработали все и всё, кроме 6-го. 6-ой пинговался(перед которым опять 5зюхельmes3500),но юзеры на нём не работали. ребутнули 6-ой,всё заработало . есть конфиги 2-го(46) и 6 -го(49) c логами. 46.txt 49.txt Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
Adimu Posted February 10, 2017 бывало , что и без zyxelmes3500 , с 1 -ым edge3510-28 подвисала цепочка. На zyxelmes3500 rstp отключён. Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
salex1990 Posted February 22, 2017 доброго времени суток . прошу помочь с коммутаторами esc3510-28. у нас их порядка нескольких десятков , приобрели менее года назад. помимо них есть также сотня других вендоров(cisco zyxel quidway(huawei) ) постепенно начали внедрять. и вот они начали виснуть почти сразу же , сначала редко , потому что их было мало и было непринципиально , потом больше и больше. и если раньше с прошивкой 1.5.1.17 отваливался только менеджмент + ну может 1 разок и юзеры остались ни с чем за компанию , то при переходе на 1.18 это ( доступ к ежу + трафик абонентов переставал передаваться) стало повторяться до невозможности часто( могут и по пару раз в день , или в пару дней раз) коммутаторы подключаются они у нас между собой просто - в линейку или в цепочку один в другой , 1 влан на управление , другие - юзерам. при зависании trunk-ые порты остаются в up-е . Помогает простой ребут edge-а. кто чем может помочь ? посоветовать что ? где копать ? может кто сталкивался . конфиг есть . Проверьте температурные показания в ящиках. По тех документации больше 65Цельсий может зависать процессор. У нас так решили посмотреть, повесив термометр. В конечном итоге температура росла до 80градусов, после чего они зависали, пока не ребутнем. Ну это как вариант... Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
wtyd Posted February 22, 2017 Отулючайте всё лишнее. В логах то что? К зависшему свичу кончолью подключиться можно? +1. У ежей это из поколения в поколение передаётся ;-). Там разработчики баги копипастят из предыдущего софта. Надо чтобы им в проц летело как можно меньше -- отключайте все подряд ненужные фичи, которые выполняются в ЦПУ (stp, lldp и т.п., снупинги, фигупинги, вообще всё, без чего сможете жить) , смотрите, что у вас летает в влане управления, сегментируйте управление, чтобы там меньше всяких броадкастов летало, ставьте на edge, на core не ставьте ;-). Ну если уж совсем быстро надо, то для начала отключите spanning-tree на порту вышестояшего мутатора для цепочки из ежей. Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
arhead Posted February 22, 2017 Покупали партию в 35 штук что ли. Ставили все работало. Но вот 5-6 свичей из коробки без обновления прошивки начали сами по себе терять управление. Если юзер выключал роутер или комп, то не получал адреса от дхцп. Пробовали загрузчик и прошивку обновлять и что только не делали все равно теряли управление. Хотя другие скажем на соседней ветке где даже нагрузка была больше чем где завис работал без нареканий и мультикаст гонял. Сдали по гарантии в Вимком выдали новые а что стало со старыми не знаю. Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
wtyd Posted February 22, 2017 (edited) Покупали партию в 35 штук что ли. Ставили все работало. Но вот 5-6 свичей из коробки без обновления прошивки начали сами по себе терять управление. Если юзер выключал роутер или комп, то не получал адреса от дхцп. Пробовали загрузчик и прошивку обновлять и что только не делали все равно теряли управление. Хотя другие скажем на соседней ветке где даже нагрузка была больше чем где завис работал без нареканий и мультикаст гонял. Сдали по гарантии в Вимком выдали новые а что стало со старыми не знаю. Если вы не обновляли прошивку, то рискну предположить, что вы и настраивали свичи не вполне достаточно ? может у вас влан управления и клиентский влан это один и тот же влан ? Может вы используете влан 1 ? Может вы их по веб-морде конфигурите ? Может вы spanning-tree оставляете с настройками по-умолчанию ? Да там столько всего может быть, что лучше вам начать пкоазывать конфиги свичей, которые виснут, и рисовать схемы :-). Вот чё это за хрень ? interface ethernet 1/25 switchport allowed vlan add 1 untagged switchport mode trunk switchport allowed vlan add 1,178,195,199,419 tagged Вот так надо аплинк настраивать: interface ethernet 1/26 switchport mode trunk switchport ingress-filtering #1 switchport allowed vlan add 18,936 tagged switchport allowed vlan remove 1 #4 spanning-tree edge-port #2 spanning-tree spanning-disabled spanning-tree bpdu-filter spanning-tree tc-prop-stop mvr domain 1 type source #3 #1 - без этой команды все неизвестные свичу вланы будут влетать ему в ЦПУ и ему будте "бо-бо" #2 - использовать спаннинг три в ежах не хочешь ты #3 - ну это если ойпи-тэвэ есть #4 - Первый влан нахер из сети выкорчёвываем -- потому что он для любого оборудовани дефолтный, можно наошибаться и получить кучу глюков, а если вы его использовать перестанете, то вы все вланы сконфигурите и скорее всего правильно - наошибаться вероятность меньше. Есть ещё другие причины, по которым использование влана номер один является показателем некомпетентности администраторов сети. Edited February 22, 2017 by wtyd Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
arhead Posted February 22, 2017 (edited) Если вы не обновляли прошивку, то рискну предположить, что вы и настраивали свичи не вполне достаточно ? может у вас влан управления и клиентский влан это один и тот же влан ? Может вы используете влан 1 ? Может вы их по веб-морде конфигурите ? Может вы spanning-tree оставляете с настройками по-умолчанию ? Да там столько всего может быть, что лучше вам начать пкоазывать конфиги свичей, которые виснут, и рисовать схемы :-). Забыл добавить что когда свич вис на него и по консоли не достучишься. Нет управляющий и абонентов вланы разные. 1 влан вообще не используем. Конфигурим через консоль. После замены свичей на новые, уже пол года без нареканий работают. На всех обновил прошивку до 1.5.1.18. Полет нормальный. :-) Edited February 22, 2017 by arhead Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
wtyd Posted February 22, 2017 Если вы не обновляли прошивку, то рискну предположить, что вы и настраивали свичи не вполне достаточно ? может у вас влан управления и клиентский влан это один и тот же влан ? Может вы используете влан 1 ? Может вы их по веб-морде конфигурите ? Может вы spanning-tree оставляете с настройками по-умолчанию ? Да там столько всего может быть, что лучше вам начать пкоазывать конфиги свичей, которые виснут, и рисовать схемы :-). Забыл добавить что когда свич вис на него и по консоли не достучишься. Нет управляющий и абонентов вланы разные. 1 влан вообще не используем. Конфигурим через консоль. После замены свичей на новые, уже пол года без нареканий работают. На всех обновил прошивку до 1.5.1.18. Полет нормальный. :-) Виснут они из-за утечек памяти -- консоль при этом тоже не работает. Утечки памяти у них в ДНК -- их копипастят китайцы из старого кода в новый, как я уже говорил -- из кода для старых свичей в код прошивок для новых моделей. Потому чтоу них одни и те же баги были замечены в разных моделях, которые на совсем разных чипсетах были сделаны. Утечки там есть и вряд ли их оттуда уберут. Значит надо делать так, чтобы в ЦПУ как можно меньше попадало трафика. Ещё было замечено, что у одной модели (ES3528M) одной h/w вершн было разное поведение, но это касалось diag кода: после одновления diag и reload все свичи загружались и работали, но после ребута по питанию больше половины не загружалось, но остальные загружались и работали нормально. Седых волос на голове у меня тогда стало на много больше чем было до этого :-), сильно я не мог экспериментировать собирать статистику, просто очень быстро поменял везде diag на прежнюю версию и больше никогда его удалённо не апгрейдил. Этот факт позволяет нам сделать вывод, что свичи в пределах одной модели и одной h/w version всёравно могут аппаратно отличаться. Завод изготовитель оставляет за собой право вносить изменения в конструкцию ... (с). А может у вас порсто дефектные свичи попались :-). Первый влан у ТС в тектовом файлике фигурирует, поэтому я про него и написал. У меня были 3528М с аптаймами больше года и это были не access свичи, за ними ещё было несколько свичей и клиенты в них тоже были включены. Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...