Перейти к содержимому
Калькуляторы

edgecore3510-28T

доброго времени суток .

прошу помочь с коммутаторами esc3510-28.

у нас их порядка нескольких десятков , приобрели менее года назад.

помимо них есть также сотня других вендоров(cisco zyxel quidway(huawei) )

постепенно начали внедрять.

и вот они начали виснуть почти сразу же , сначала редко , потому что их было мало и было непринципиально , потом больше и больше.

и если раньше с прошивкой 1.5.1.17 отваливался только менеджмент + ну может 1 разок и юзеры остались ни с чем за компанию ,

то при переходе на 1.18 это ( доступ к ежу + трафик абонентов переставал передаваться) стало повторяться до невозможности часто( могут и по пару раз в день , или в пару дней раз)

коммутаторы подключаются они у нас между собой просто - в линейку или в цепочку один в другой , 1 влан на управление , другие - юзерам.

при зависании trunk-ые порты остаются в up-е .

Помогает простой ребут edge-а.

кто чем может помочь ? посоветовать что ? где копать ?

может кто сталкивался .

конфиг есть .

edge.txt

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

А rstp точно нужен?

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

А rstp точно нужен?

в принципе нет .

никаких избыточных каналов между коммутаторами нет.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

при rstp в момент "простоя-зависания" порты вроде не блокируются , но трафика на транковых портах нет.

может я чего недопонимаю товарищи...

кто-нибудь может что-то ещё подсказать ?

в какую сторону смотреть ? что мониторить ? фильтровать ?

 

и ещё вопрос.

при настройке команды spanning-tree bpdufilter на порту edgecore, как я понимаю , свитч сразу же будет фильтровать тут полученные bpdu, не тратя своего времени.

будет ли он при этом не отсылать bpdu на данном интерфейсе ?

насколько я знаю на цисках эта команда фильтрует в обе стороны, а тут ....

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Пинг на менеджмент совсем не проходит? Было похожее пакеты больше 202 или 203 байт переставал пропускать через себя. Пришлось ждать пока допилят прошивку.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Отулючайте всё лишнее. В логах то что? К зависшему свичу кончолью подключиться можно?

Изменено пользователем witch

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Пинг на менеджмент совсем не проходит? Было похожее пакеты больше 202 или 203 байт переставал пропускать через себя. Пришлось ждать пока допилят прошивку.

сегодня установили на два десятка edge-core-ов новую прошивку 2.7, посоветовали нам саппорт , сказали что

баги подправлены по сравнению с предыдущими, проверьте.

 

 

И вот в течении 2 часов отвалились 3 ветки свитчей.

что странно во всех первым стоит zyxel mes 3500 и после него всё начинает отваливаться,

хотя и без zyxel в ветке тоже висло .

ветка 1:

1zyxelmes3500(45) - 2edge3510-28(10.10.10.46) - 3edge3510-28 - 4edge3510-28 - 5zyxelmes3500 - 6edge3510-28(10.10.10.49)

тут отвалился доступ vty ( telnet ) со 2 по 6 свитчи.

они пинговались , но трафик не ходил на 1 свитч , не считая около 0-2 байт ,такое ощущение что проходили только arp да İCMP-пакеты пинги ,

даже получилось попасть со 2 свитча на менеджмент.

Однако с менеджента к себе на 2 свитч не хотел пускать.

Ребутнули 2-ой , заработали все и всё, кроме 6-го.

6-ой пинговался(перед которым опять 5зюхельmes3500),но юзеры на нём не работали.

ребутнули 6-ой,всё заработало .

 

есть конфиги 2-го(46) и 6 -го(49) c логами.

46.txt

49.txt

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

бывало , что и без zyxelmes3500 , с 1 -ым edge3510-28 подвисала цепочка.

На zyxelmes3500 rstp отключён.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

доброго времени суток .

прошу помочь с коммутаторами esc3510-28.

у нас их порядка нескольких десятков , приобрели менее года назад.

помимо них есть также сотня других вендоров(cisco zyxel quidway(huawei) )

постепенно начали внедрять.

и вот они начали виснуть почти сразу же , сначала редко , потому что их было мало и было непринципиально , потом больше и больше.

и если раньше с прошивкой 1.5.1.17 отваливался только менеджмент + ну может 1 разок и юзеры остались ни с чем за компанию ,

то при переходе на 1.18 это ( доступ к ежу + трафик абонентов переставал передаваться) стало повторяться до невозможности часто( могут и по пару раз в день , или в пару дней раз)

коммутаторы подключаются они у нас между собой просто - в линейку или в цепочку один в другой , 1 влан на управление , другие - юзерам.

при зависании trunk-ые порты остаются в up-е .

Помогает простой ребут edge-а.

кто чем может помочь ? посоветовать что ? где копать ?

может кто сталкивался .

конфиг есть .

 

 

Проверьте температурные показания в ящиках. По тех документации больше 65Цельсий может зависать процессор. У нас так решили посмотреть, повесив термометр. В конечном итоге температура росла до 80градусов, после чего они зависали, пока не ребутнем. Ну это как вариант...

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Отулючайте всё лишнее. В логах то что? К зависшему свичу кончолью подключиться можно?

 

+1. У ежей это из поколения в поколение передаётся ;-). Там разработчики баги копипастят из предыдущего софта. Надо чтобы им в проц летело как можно меньше -- отключайте все подряд ненужные фичи, которые выполняются в ЦПУ (stp, lldp и т.п., снупинги, фигупинги, вообще всё, без чего сможете жить) , смотрите, что у вас летает в влане управления, сегментируйте управление, чтобы там меньше всяких броадкастов летало, ставьте на edge, на core не ставьте ;-).

 

Ну если уж совсем быстро надо, то для начала отключите spanning-tree на порту вышестояшего мутатора для цепочки из ежей.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Покупали партию в 35 штук что ли. Ставили все работало. Но вот 5-6 свичей из коробки без обновления прошивки начали сами по себе терять управление. Если юзер выключал роутер или комп, то не получал адреса от дхцп. Пробовали загрузчик и прошивку обновлять и что только не делали все равно теряли управление. Хотя другие скажем на соседней ветке где даже нагрузка была больше чем где завис работал без нареканий и мультикаст гонял. Сдали по гарантии в Вимком выдали новые а что стало со старыми не знаю.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Покупали партию в 35 штук что ли. Ставили все работало. Но вот 5-6 свичей из коробки без обновления прошивки начали сами по себе терять управление. Если юзер выключал роутер или комп, то не получал адреса от дхцп. Пробовали загрузчик и прошивку обновлять и что только не делали все равно теряли управление. Хотя другие скажем на соседней ветке где даже нагрузка была больше чем где завис работал без нареканий и мультикаст гонял. Сдали по гарантии в Вимком выдали новые а что стало со старыми не знаю.

 

Если вы не обновляли прошивку, то рискну предположить, что вы и настраивали свичи не вполне достаточно ? может у вас влан управления и клиентский влан это один и тот же влан ? Может вы используете влан 1 ? Может вы их по веб-морде конфигурите ? Может вы spanning-tree оставляете с настройками по-умолчанию ? Да там столько всего может быть, что лучше вам начать пкоазывать конфиги свичей, которые виснут, и рисовать схемы :-).

 

Вот чё это за хрень ?

interface ethernet 1/25
switchport allowed vlan add 1 untagged
switchport mode trunk
switchport allowed vlan add 1,178,195,199,419 tagged

 

Вот так надо аплинк настраивать:

interface ethernet 1/26
switchport mode trunk
switchport ingress-filtering #1
switchport allowed vlan add 18,936 tagged
switchport allowed vlan remove 1 #4
spanning-tree edge-port #2
spanning-tree spanning-disabled
spanning-tree bpdu-filter
spanning-tree tc-prop-stop
mvr domain 1 type source #3

 

#1 - без этой команды все неизвестные свичу вланы будут влетать ему в ЦПУ и ему будте "бо-бо"

#2 - использовать спаннинг три в ежах не хочешь ты

#3 - ну это если ойпи-тэвэ есть

 

#4 - Первый влан нахер из сети выкорчёвываем -- потому что он для любого оборудовани дефолтный, можно наошибаться и получить кучу глюков, а если вы его использовать перестанете, то вы все вланы сконфигурите и скорее всего правильно - наошибаться вероятность меньше. Есть ещё другие причины, по которым использование влана номер один является показателем некомпетентности администраторов сети.

Изменено пользователем wtyd

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Если вы не обновляли прошивку, то рискну предположить, что вы и настраивали свичи не вполне достаточно ? может у вас влан управления и клиентский влан это один и тот же влан ? Может вы используете влан 1 ? Может вы их по веб-морде конфигурите ? Может вы spanning-tree оставляете с настройками по-умолчанию ? Да там столько всего может быть, что лучше вам начать пкоазывать конфиги свичей, которые виснут, и рисовать схемы :-).

 

Забыл добавить что когда свич вис на него и по консоли не достучишься. Нет управляющий и абонентов вланы разные. 1 влан вообще не используем. Конфигурим через консоль. После замены свичей на новые, уже пол года без нареканий работают. На всех обновил прошивку до 1.5.1.18. Полет нормальный. :-)

Изменено пользователем arhead

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Если вы не обновляли прошивку, то рискну предположить, что вы и настраивали свичи не вполне достаточно ? может у вас влан управления и клиентский влан это один и тот же влан ? Может вы используете влан 1 ? Может вы их по веб-морде конфигурите ? Может вы spanning-tree оставляете с настройками по-умолчанию ? Да там столько всего может быть, что лучше вам начать пкоазывать конфиги свичей, которые виснут, и рисовать схемы :-).

 

Забыл добавить что когда свич вис на него и по консоли не достучишься. Нет управляющий и абонентов вланы разные. 1 влан вообще не используем. Конфигурим через консоль. После замены свичей на новые, уже пол года без нареканий работают. На всех обновил прошивку до 1.5.1.18. Полет нормальный. :-)

 

Виснут они из-за утечек памяти -- консоль при этом тоже не работает. Утечки памяти у них в ДНК -- их копипастят китайцы из старого кода в новый, как я уже говорил -- из кода для старых свичей в код прошивок для новых моделей. Потому чтоу них одни и те же баги были замечены в разных моделях, которые на совсем разных чипсетах были сделаны. Утечки там есть и вряд ли их оттуда уберут. Значит надо делать так, чтобы в ЦПУ как можно меньше попадало трафика.

 

Ещё было замечено, что у одной модели (ES3528M) одной h/w вершн было разное поведение, но это касалось diag кода: после одновления diag и reload все свичи загружались и работали, но после ребута по питанию больше половины не загружалось, но остальные загружались и работали нормально. Седых волос на голове у меня тогда стало на много больше чем было до этого :-), сильно я не мог экспериментировать собирать статистику, просто очень быстро поменял везде diag на прежнюю версию и больше никогда его удалённо не апгрейдил. Этот факт позволяет нам сделать вывод, что свичи в пределах одной модели и одной h/w version всёравно могут аппаратно отличаться. Завод изготовитель оставляет за собой право вносить изменения в конструкцию ... (с). А может у вас порсто дефектные свичи попались :-).

 

Первый влан у ТС в тектовом файлике фигурирует, поэтому я про него и написал. У меня были 3528М с аптаймами больше года и это были не access свичи, за ними ещё было несколько свичей и клиенты в них тоже были включены.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.

Гость
Ответить в тему...

×   Вставлено в виде отформатированного текста.   Вставить в виде обычного текста

  Разрешено не более 75 смайлов.

×   Ваша ссылка была автоматически встроена.   Отобразить как ссылку

×   Ваш предыдущий контент был восстановлен.   Очистить редактор

×   Вы не можете вставить изображения напрямую. Загрузите или вставьте изображения по ссылке.