roma33rus Posted August 21, 2017 Всем привет. Перепроверил все что знаю. Больше ничего в голову не лезет. Толкните в правильном направлении. Проблема заключается в следующем. Есть кусок сети, в котором есть конечный коммутатор DES-3200-10. На сети крутится RSTP. К нему периодически пропадает доступ, тобишь трафика в его сторону никакого нет. Буквально на несколько секунд. Графика пинга скину. Физически канал до этого коммутатора не отваливался, в логах ошибок никаких нету, на порту по ошибкам чисто. СФП меняли. Что еще можно глянуть? Сегодня еще отправим техников замерить затухания на оптике. Коммутатора DES-3200-10/C1 FW:4.46.B006. На скрине изобразил путь до проблемного коммутатора: Так же вот пинги до него: Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
Chrst Posted August 21, 2017 Нет ли в логах сообщений типа "Conflict IP was detected with this device" ? Пропадает весь трафик или трафик управляющего VLAN? Похожие проблемы были с серией DES-3200, да и в других моделях встречалось. При этом абоненты вполне себе нормально работали, а вот доступ к свитчам пропадал на какое-то время. Проблема связывалась с arp кэшем и возникает в сетях с большим количеством коммутаторов в одном сегменте. Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
s.lobanov Posted August 21, 2017 Присоединяюсь к посту выше. Нужно установить пробу за коммутатором в юзер-влане, чтобы понять, это проблема только с mgmt или же с юзер-трафиком тоже проблемы Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
roma33rus Posted August 21, 2017 Нет ли в логах сообщений типа "Conflict IP was detected with this device" ? Пропадает весь трафик или трафик управляющего VLAN? Похожие проблемы были с серией DES-3200, да и в других моделях встречалось. При этом абоненты вполне себе нормально работали, а вот доступ к свитчам пропадал на какое-то время. Проблема связывалась с arp кэшем и возникает в сетях с большим количеством коммутаторов в одном сегменте. Конфликтов в логах нету. Ну пропадает точно управляющий. От абонентов жалоб не поступало. По графику видно, что трафик исходящий в сторону этого порта падал. Вообще там трафика немного. Сложно по графикам различить за столь короткое время. У нас управляющая сеть /24, точней их несколько уже накопилось. Никогда таких проблем не было. Получается в этом сегменте менеджмент влана этого коммутатора где-то 250 устройств. Присоединяюсь к посту выше. Нужно установить пробу за коммутатором в юзер-влане, чтобы понять, это проблема только с mgmt или же с юзер-трафиком тоже проблемы Думаю на коммутатор можно какой-нибудь роутер повесить и на него пинг создать. Так и поступлю. Посмотрим что получится. Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
s.lobanov Posted August 21, 2017 Получается в этом сегменте менеджмент влана этого коммутатора где-то 250 устройств. это оооочень много, особенно для A/B ревизий 3200 если за тем свитчом нет геймеров, то на пропадания в 2 секунды скорее всего никто не пожалуется, при браузинге это сложно заметить, а ютуба буфер больше Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
roma33rus Posted August 21, 2017 Получается в этом сегменте менеджмент влана этого коммутатора где-то 250 устройств. это оооочень много, особенно для A/B ревизий 3200 если за тем свитчом нет геймеров, то на пропадания в 2 секунды скорее всего никто не пожалуется, при браузинге это сложно заметить, а ютуба буфер больше О как, не знал. как разбить тогда посоветуете? Мы недавно сеть купили, так там вообще менеджмент влан был /22. Вот это вообще край. У меня есть сетка, где устройств поменьше, попробую туда перенести его. Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
Butch3r Posted August 21, 2017 Получается в этом сегменте менеджмент влана этого коммутатора где-то 250 устройств. это оооочень много, особенно для A/B ревизий 3200 если за тем свитчом нет геймеров, то на пропадания в 2 секунды скорее всего никто не пожалуется, при браузинге это сложно заметить, а ютуба буфер больше О как, не знал. как разбить тогда посоветуете? Мы недавно сеть купили, так там вообще менеджмент влан был /22. Вот это вообще край. У меня есть сетка, где устройств поменьше, попробую туда перенести его. 764 mac address(es) found/22 проблем в управляющем влане нет вообще. Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
roma33rus Posted August 21, 2017 (edited) Получается в этом сегменте менеджмент влана этого коммутатора где-то 250 устройств. это оооочень много, особенно для A/B ревизий 3200 если за тем свитчом нет геймеров, то на пропадания в 2 секунды скорее всего никто не пожалуется, при браузинге это сложно заметить, а ютуба буфер больше О как, не знал. как разбить тогда посоветуете? Мы недавно сеть купили, так там вообще менеджмент влан был /22. Вот это вообще край. У меня есть сетка, где устройств поменьше, попробую туда перенести его. 764 mac address(es) found/22 проблем в управляющем влане нет вообще. Помоему 1к устройств в куче это перебор. Разве нет? У вас тоже длинки? Edited August 21, 2017 by roma33rus Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
Antares Posted August 21, 2017 у меня тоже /22, но проблем не возникало с длинками, а вот с snr иногда проскакивает Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
nixx Posted August 21, 2017 (edited) Получается в этом сегменте менеджмент влана этого коммутатора где-то 250 устройств. это оооочень много, особенно для A/B ревизий 3200 если за тем свитчом нет геймеров, то на пропадания в 2 секунды скорее всего никто не пожалуется, при браузинге это сложно заметить, а ютуба буфер больше О как, не знал. как разбить тогда посоветуете? Мы недавно сеть купили, так там вообще менеджмент влан был /22. Вот это вообще край. У меня есть сетка, где устройств поменьше, попробую туда перенести его. 764 mac address(es) found/22 проблем в управляющем влане нет вообще. Помоему 1к устройств в куче это перебор. Разве нет? У вас тоже длинки? у меня все длинки (хоть des-3200, хоть 1228, хоть dgs-3120), стоящие в подсетях /22, видят в arptable (не в fdb) два хоста - себя и шлюз. соседей они не видят вообще, потому что нет обмена трафиком и каких-то бродкастов, на которые соседи должны отвечать. откуда тут могут возникнуть проблемы - я не понимаю. хоть /16 сеть сделайте. другими словами, я это все к тому, что fdb у них 8к маков (у ревизии C - вообще 16к), а на размер arptable при наличии в ней всего двух активных записей грешить просто смешно. соответственно, предпосылок для глюков из-за размера менеджмент-сети в пределах мак-таблицы не вижу. Edited August 21, 2017 by nixx Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
nixx Posted August 22, 2017 Коммутатора DES-3200-10/C1 FW:4.46.B006. слона-то я и не заметил... откатитесь до прошивки 4.37 (точнее, до любой прошивки НИЖЕ версии 4.38) и посмотрите, останутся пропадания пингов, или нет. длинки что-то намутили в 4.38 и выше, то ли cpu protect, то ли еще какую-то хрень. Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
Butch3r Posted August 22, 2017 Получается в этом сегменте менеджмент влана этого коммутатора где-то 250 устройств. это оооочень много, особенно для A/B ревизий 3200 если за тем свитчом нет геймеров, то на пропадания в 2 секунды скорее всего никто не пожалуется, при браузинге это сложно заметить, а ютуба буфер больше О как, не знал. как разбить тогда посоветуете? Мы недавно сеть купили, так там вообще менеджмент влан был /22. Вот это вообще край. У меня есть сетка, где устройств поменьше, попробую туда перенести его. 764 mac address(es) found/22 проблем в управляющем влане нет вообще. Помоему 1к устройств в куче это перебор. Разве нет? У вас тоже длинки? у меня зоопарк из длинков, телесинов и райскомов. Но большинство длинков, причём 3028, которые вообще не любят много маков. Были планы перейти на /24, но пока не до этого Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
roma33rus Posted August 22, 2017 Получается в этом сегменте менеджмент влана этого коммутатора где-то 250 устройств. это оооочень много, особенно для A/B ревизий 3200 если за тем свитчом нет геймеров, то на пропадания в 2 секунды скорее всего никто не пожалуется, при браузинге это сложно заметить, а ютуба буфер больше О как, не знал. как разбить тогда посоветуете? Мы недавно сеть купили, так там вообще менеджмент влан был /22. Вот это вообще край. У меня есть сетка, где устройств поменьше, попробую туда перенести его. 764 mac address(es) found/22 проблем в управляющем влане нет вообще. Помоему 1к устройств в куче это перебор. Разве нет? У вас тоже длинки? у меня все длинки (хоть des-3200, хоть 1228, хоть dgs-3120), стоящие в подсетях /22, видят в arptable (не в fdb) два хоста - себя и шлюз. соседей они не видят вообще, потому что нет обмена трафиком и каких-то бродкастов, на которые соседи должны отвечать. откуда тут могут возникнуть проблемы - я не понимаю. хоть /16 сеть сделайте. другими словами, я это все к тому, что fdb у них 8к маков (у ревизии C - вообще 16к), а на размер arptable при наличии в ней всего двух активных записей грешить просто смешно. соответственно, предпосылок для глюков из-за размера менеджмент-сети в пределах мак-таблицы не вижу. Ну да логично. у меня так же. 2 записи получается. а Вот в fdb ~1300. Коммутатора DES-3200-10/C1 FW:4.46.B006. слона-то я и не заметил... откатитесь до прошивки 4.37 (точнее, до любой прошивки НИЖЕ версии 4.38) и посмотрите, останутся пропадания пингов, или нет. длинки что-то намутили в 4.38 и выше, то ли cpu protect, то ли еще какую-то хрень. У нас долгое время стояла 4.36.009, на ней все хорошо было и на ней же началась эта проблема. Поэтому собственно и обновился. Сейчас вернуть попробую. Не знаю совпадение или нет, вчера перевел этот коммутатор в другую подсеть и пока что ни одного пропадания. Понаблюдаю еще пару дней. Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
roma33rus Posted August 23, 2017 Отписываюсь о результатах. Еще одни сутки нормальной работы и ни одного пропадания, после переноса коммутатора в подсеть с меньшим количеством устройств. Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
s.lobanov Posted August 23, 2017 Отписываюсь о результатах. Еще одни сутки нормальной работы и ни одного пропадания, после переноса коммутатора в подсеть с меньшим количеством устройств. Ну вот, а местные обитатели продолжают говорить друг друга, что можно заснуть всё в один влан, расслабиться и играть в доту целыми днями, вместо того чтобы включить мозг и разгрести свои L2-помойки Особенно прикольно когда покупается сеть и видишь что всё в одном-двух-трех вланах. чем занимался админ долгие годы - непонятно Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
roma33rus Posted August 23, 2017 Отписываюсь о результатах. Еще одни сутки нормальной работы и ни одного пропадания, после переноса коммутатора в подсеть с меньшим количеством устройств. Ну вот, а местные обитатели продолжают говорить друг друга, что можно заснуть всё в один влан, расслабиться и играть в доту целыми днями, вместо того чтобы включить мозг и разгрести свои L2-помойки Особенно прикольно когда покупается сеть и видишь что всё в одном-двух-трех вланах. чем занимался админ долгие годы - непонятно В Варик гонял :-D Шутка конечно. Будем сейчас думать чего да как. Всем спасибо :-) Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
EShirokiy Posted August 23, 2017 Я даже в своих /26-/27 ловил проблемы, сейчас многое по /28, ключевые элементы /29-/30 Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
roma33rus Posted August 23, 2017 Хм. Я тогда подумал, что лучше наверно как-нибудь выделить менеджмент влан на район. Там порядка 20-40 устройств держать. Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
straus Posted August 23, 2017 Так, я не понял. Про баг с хэшами у чипсета в 3200 уже все забыли? А проявляться он может по-разному, в зависимости от окружения. Гарантированное лечение - избавиться от модели 3200 и забыть о её существовании. Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
s.lobanov Posted August 23, 2017 а у каких свитчей той же ценовой категории нет такого бага? ну и к тому же 3200 rev A/B и rev C это совсем разные чипсеты Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
EShirokiy Posted August 23, 2017 Хм. Я тогда подумал, что лучше наверно как-нибудь выделить менеджмент влан на район. Там порядка 20-40 устройств держать. Оптимально vlan на кольцо/кучку домов + агрегация в отдельном vlan. На 3028 даже с 5-10 маками случались казусы, с 3200 проблем не замечено. Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
straus Posted August 23, 2017 ну и к тому же 3200 rev A/B и rev C это совсем разные чипсеты В rev.C не работает enable flood_fdb и show flud_fdb, но это совсем не значит, что эта модель не подвержена коллизии хэшей. Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
s.lobanov Posted August 24, 2017 ну и к тому же 3200 rev A/B и rev C это совсем разные чипсеты В rev.C не работает enable flood_fdb и show flud_fdb, но это совсем не значит, что эта модель не подвержена коллизии хэшей. ок. какие свитчи той же ценовой категории хорошие и не имеют проблем из-за хешей? Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
Butch3r Posted August 24, 2017 ну и к тому же 3200 rev A/B и rev C это совсем разные чипсеты В rev.C не работает enable flood_fdb и show flud_fdb, но это совсем не значит, что эта модель не подвержена коллизии хэшей. ок. какие свитчи той же ценовой категории хорошие и не имеют проблем из-за хешей? да нет таких :)Даже у 76 кошки в статистике фигурирует понятие коллизий. Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
s.lobanov Posted August 24, 2017 да я понимаю, просто хотел послушать что же ответит straus Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...