Перейти к содержимому
Калькуляторы

Проблема в работе сети. Коммутаторы HP

Коллеги, приветствую.

Проблема: у некоторых (т.е. не у всех) пользователей в сети просидает скорость работы сетки. Начинают медленно загружаться интернет страницы, почта практически не доходит (почтовый сервер Exchаnge в облаке), скорость копирования файлов по сети еле доползает до 1 Мбита. В общем народ негодует, а мы не въезжаем, что происходит. Ребуты компа в данном случае не помогают и скорость сетки остается таже.

Как все устроено: в ядре HP-1920-16G, на доступе от него HP-1910-24G 2шт и один HP-2530-48G-Poe, плюс линк уходящий в ЦОД бизнес-центра с арендуемыми виртуалками с серверами (все cервисы и службы подняты на них кроме PDC). Все это уходит в инет через файрвол Dlink DFL-860e. На HP-1920 подняты все интерфейсы 6 VLAN'ов и один из них voice. На всех остальных прописаны нужные вланы и голосовой на всех. HP-2530-48G появился у нас недавно и настраивался без особенностей. Некоторые компы работают через телефонные интерфейсы, остальные без. Всего в сети 35 пользователей + телефоны+ тонкие клиенты + куча разной периферии.

Что уже пытались делать: искали флудящие источники рассылающие широковещательные пакеты. Некоторых нашли, отключили, но не помогло. Поделили 4 изначальных влана до 6, т.е. из одного основного с пользователями сделали еще 2 дополнительных. Тоже не помогло. Программно (без отключения питания) ребутали все коммутаторы. Решало проблему максимум на день. Проверили на все возможные петли. Пока снифил Wirshark-ом сеть обнаружил в сети ходящие пакеты STP. На свое удивление обнаружил, что по умолчанию на коммутаторах 1920 и 1910 был поднят RTSP. Посмотрев содержание пакетов выяснилось, что для моей сети Root-м была выбрана устройство Cisco, которого у нас нет и она принадлежит БЦ через оборудование которого мы подключены в ЦОД. Далее, вчера обнаружил у себя только на коммутаторах доступа HP-1910 странные пакеты с STP ругающиеся на контрольную сумму. Беседы с ИТ-никами БЦ пока ничего не дали и я на это время вообще отрубил STP. После отключения STP подобных пакетов не стало, но координально пока не помогло. Сегодня опять появлялись пользователи с теми же проблемами. Появление проблем стало отмечаться примерно после реорганизации сети, когда у нас появился HP-2530. В данном случае очень странно как он мог бы повлиять.

Товарищи, направьте куда копать.

post-141760-009273100 1492631265_thumb.jpg

post-141760-073098400 1492631274_thumb.jpg

post-141760-012671300 1492631284_thumb.jpg

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Вот уж кто тут точно не при делах, так это STP. Сколько записей в FDB? Не подпадает ли трафик проблемных компьютеров под Unknown unicast policy(изучаются ли их маки на всех свитчах, включая те, что в серверной бизнес центра)?

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Посмотрев содержание пакетов выяснилось, что для моей сети Root-м была выбрана устройство Cisco, которого у нас нет и она принадлежит БЦ через оборудование которого мы подключены в ЦОД

тоже не думаю, что тут дело в stp, но, набив шишки, включаю bpdu filter на портах, смотрящих наружу. чего и вам советую.

 

а по проблеме - хоть карту сети бы нарисовали, более конкретно сформулировали проблему (проблема только на доступе в интернет или внутри сети тоже, L2 или есть роутинг, ...), добавили объективные показатели (повесить пинг на предмет потерь, netperf в моменты проблем)

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Товарищи, направьте куда копать.

я бы копал в сторону мониторинга портов, самих свитчей (проц, память, всякие ресурсы типа температуры) в первую очередь. mrtg/cacti, что-то такое. по результатам хотя бы 3-5-суточного сбора статистики можно что-то говорить.

заодно и мониторинг серверов/шлюзов сделать. в общем, тех железок, через которые (с которыми) происходят тормоза.

может у вас тупо пачка вирусов на каждом компе )

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

А есть что-нибудь в логах самих коммутаторов? Утилизация портов? Можно попробовать igmp snooping.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Скорость менее мегабита намекает на unknown unicast policy.

 

Проверяется по наличию трафика, адресованному проблемному компьютеру на других портах свитча

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Вот уж кто тут точно не при делах, так это STP. Сколько записей в FDB? Не подпадает ли трафик проблемных компьютеров под Unknown unicast policy(изучаются ли их маки на всех свитчах, включая те, что в серверной бизнес центра)?

Все что менялось на коммутаторах с момента их прихода это вланы. Т.е. их количество и назначение на портах. Так как с сетевым оборудованием работаю далеко не плотно, то каких-то фитчей не плодил. На момент поиска проблем узнал, что RSTP был включен на коммутаторах 1910 и 1920 по умолчанию. Удивило.

В логах сплошником только есть ошибки LinkUpDown порта. Это реакция порта на включение ПК. На просторах инета, пишут, что это нормальная работа этих коммутаторов и появления в логах такой картины. В течении рабочего времени на порту таких ошибок нет.

post-141760-040177900 1492780160_thumb.jpg

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

А есть что-нибудь в логах самих коммутаторов? Утилизация портов? Можно попробовать igmp snooping.

Ответил со скрином в комментарии выше.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Скорость менее мегабита намекает на unknown unicast policy.

 

Проверяется по наличию трафика, адресованному проблемному компьютеру на других портах свитча

Если правильно понимаю, то речь идет контроле флудящего трафика на порту. Есть вот такие настройки (во вложении). Мы он них говорим?

post-141760-025051000 1492785928_thumb.jpg

post-141760-056024700 1492785940_thumb.jpg

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

изучаются ли их маки на всех свитчах, включая те, что в серверной бизнес центра)?

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

изучаются ли их маки на всех свитчах, включая те, что в серверной бизнес центра)?

Можно уточнить, что значит изучаются? Все что настроено на оборудовании БЦ мне неизвестно.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

изучаются ли их маки на всех свитчах, включая те, что в серверной бизнес центра)?

Можно уточнить, что значит изучаются? Все что настроено на оборудовании БЦ мне неизвестно.

 

Есть записи в mac address table? Сколько их? На аплинках изучаются маки?

 

Проблема наблюдается во всех vlan?

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

изучаются ли их маки на всех свитчах, включая те, что в серверной бизнес центра)?

Можно уточнить, что значит изучаются? Все что настроено на оборудовании БЦ мне неизвестно.

Да, проблемы наблюдаются во всех VLAN (хоть было их 4, хоть стало 6). При полной загрузке в сети даже тонкие клиенты еле-еле стягивают загрузочный образ с TFTP (образ всего до 10 Мб). По количеству записей mac-адресов на коммутаторе в ядре 65-80 шт. Изучений mac'ов никаких нет. STP отключил вовсе. Пакетов с ошибками больше нет, но проблема остается.

 

Есть записи в mac address table? Сколько их? На аплинках изучаются маки?

 

Проблема наблюдается во всех vlan?

 

Да, проблемы наблюдаются во всех VLAN (хоть было их 4, хоть стало 6). При полной загрузке в сети даже тонкие клиенты еле-еле стягивают загрузочный образ с TFTP (образ всего до 10 Мб). По количеству записей mac-адресов на коммутаторе в ядре 65-80 шт. Изучений mac'ов никаких нет. STP отключил вовсе. Пакетов с ошибками больше нет, но проблема остается.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Пришли после выходных. В выходные вообще никого не было на работе. Опять есть несколько жертв в сетке. Инет еле тянет, трафик по сети с этими компами тоже еле ходит. В этой подсети у остальных все ОК. Посмотрели Wireshark'ом, что происходит. Как только запускается приложение с доступов в инет или делается копирование по сети в дампе видим вот такое

post-141760-075110300 1493020003_thumb.jpg

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

ТС начни с начала

 

Нарисуй схему для себя если ее не можешь нарисовать в голове, чтобы исключить петли.

Если у тебя была бы петля в 1 гигабит у тебя не чего не работало от слова вообще, у меня были петли через Wi-Fi флапает но работает.

 

У тебя 35 устройств в сети, значит у тебя должно быть 40-60 маков в сети если их 100 и более делай вывод сам. Сколько маков видишь с ЦОД есть ли лишний?

 

Как писали желательно заиметь мониторинг типа заббикса, чтобы рисовать графики загрузки портов.

 

У нас был один случай, на коммутаторе сгорели порт, он флудил на всю сеть помогла замена.

 

Раз схемы сети нет берем 2 бука iperf идешм к HP-1920-16G отключаем ВСЁ! Делаем замер Если замер хороший, идем к другому коммутатору, добовляем его в сеть делаем еще один замер и т.д.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

ТС начни с начала

 

Нарисуй схему для себя если ее не можешь нарисовать в голове, чтобы исключить петли.

Если у тебя была бы петля в 1 гигабит у тебя не чего не работало от слова вообще, у меня были петли через Wi-Fi флапает но работает.

 

У тебя 35 устройств в сети, значит у тебя должно быть 40-60 маков в сети если их 100 и более делай вывод сам. Сколько маков видишь с ЦОД есть ли лишний?

 

Как писали желательно заиметь мониторинг типа заббикса, чтобы рисовать графики загрузки портов.

 

У нас был один случай, на коммутаторе сгорели порт, он флудил на всю сеть помогла замена.

 

Раз схемы сети нет берем 2 бука iperf идешм к HP-1920-16G отключаем ВСЁ! Делаем замер Если замер хороший, идем к другому коммутатору, добовляем его в сеть делаем еще один замер и т.д.

 

Схема для себя уже давно нарисована. Физику на петли проверили. STP вообще отключили. Как мне кажется в таких условиях уже бы вся сеть лежала, а не отдельные ПК. Со стороны БЦ вроде бы лишних маков нет, но проверю еще раз. Забикс есть, но еще не в продакшене. Тестим. Больше всего удивляет, что такая беда влияет исключительно не некоторые ПК. Т.е. у некоторых траблы, у остальных все гуд. Wareshark'ом собирали данные на проблемных ПК как с отключением вообще всех сетевых приложений (флудящего трафика не приходит), так и с включением. ЧТо происходит в предыдущем сообщении. Ниже прикладываю план локалки.

post-141760-097731200 1493035482_thumb.jpg

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

еще раз спрошу - маки проблемных пк изучаются всеми свитчами?

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Возможно такое, что у кого-то один и тот же мак или IP?

Если с линка проблемного ПК прогнать iperf(с заведомо рабочего пк) до сервера, скорость будет норм? Если норм, то проблема в пк. Если проблема осталась идете к коммутатору и пачкордом 2 метра замер, если норм, то линия, если нет меняете порт на коммутаторе если нет то идёте выше сегментом меряете если плохо, то отключаете меряете без этого сегмента, если не норм идете выше и т.д.

 

Ошибки с портов смотрели? Проблема примерно, когда появилась, что на кануне делали?

 

Есть кардинальный способ все в дефолт и заново настраиваем, как бы мы хотели видеть.

 

На проблемном пк dr cureit в помощь.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

флоу контроль попробовать отключить или включить на портах.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

еще раз спрошу - маки проблемных пк изучаются всеми свитчами?

Маки изучаются на всех свитчах. Это если мы говорим про таблицу коммутации.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

В пределах вашей зоны ответственности скорость такая же низкая?

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

В пределах вашей зоны ответственности скорость такая же низкая?

Зона ответственности тут вся моя. Еще раз поясню ситуацию: только у некоторых пользователей возникают проблемы, и то сегодня у одних, завтра у других. Захотели свитчи сегодня для одних сделать приоритет, они работают нормально, а другие тупят. Сейчас ушел народ с работы, включили проблемные компы, а у них все нормально. Вот где логика? Завтра появится нагрузка на сетку и опять у кого будут проблемы.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

скорость низкая между юзер-юзер в пределах влана(разных вланах), юзер-сервер БЦ, сервер БЦ-юзер, юзер-инет? Или во всех случаях?

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.

Гость
Ответить в тему...

×   Вставлено в виде отформатированного текста.   Вставить в виде обычного текста

  Разрешено не более 75 смайлов.

×   Ваша ссылка была автоматически встроена.   Отобразить как ссылку

×   Ваш предыдущий контент был восстановлен.   Очистить редактор

×   Вы не можете вставить изображения напрямую. Загрузите или вставьте изображения по ссылке.