pilottt Опубликовано 19 апреля, 2017 · Жалоба Коллеги, приветствую. Проблема: у некоторых (т.е. не у всех) пользователей в сети просидает скорость работы сетки. Начинают медленно загружаться интернет страницы, почта практически не доходит (почтовый сервер Exchаnge в облаке), скорость копирования файлов по сети еле доползает до 1 Мбита. В общем народ негодует, а мы не въезжаем, что происходит. Ребуты компа в данном случае не помогают и скорость сетки остается таже. Как все устроено: в ядре HP-1920-16G, на доступе от него HP-1910-24G 2шт и один HP-2530-48G-Poe, плюс линк уходящий в ЦОД бизнес-центра с арендуемыми виртуалками с серверами (все cервисы и службы подняты на них кроме PDC). Все это уходит в инет через файрвол Dlink DFL-860e. На HP-1920 подняты все интерфейсы 6 VLAN'ов и один из них voice. На всех остальных прописаны нужные вланы и голосовой на всех. HP-2530-48G появился у нас недавно и настраивался без особенностей. Некоторые компы работают через телефонные интерфейсы, остальные без. Всего в сети 35 пользователей + телефоны+ тонкие клиенты + куча разной периферии. Что уже пытались делать: искали флудящие источники рассылающие широковещательные пакеты. Некоторых нашли, отключили, но не помогло. Поделили 4 изначальных влана до 6, т.е. из одного основного с пользователями сделали еще 2 дополнительных. Тоже не помогло. Программно (без отключения питания) ребутали все коммутаторы. Решало проблему максимум на день. Проверили на все возможные петли. Пока снифил Wirshark-ом сеть обнаружил в сети ходящие пакеты STP. На свое удивление обнаружил, что по умолчанию на коммутаторах 1920 и 1910 был поднят RTSP. Посмотрев содержание пакетов выяснилось, что для моей сети Root-м была выбрана устройство Cisco, которого у нас нет и она принадлежит БЦ через оборудование которого мы подключены в ЦОД. Далее, вчера обнаружил у себя только на коммутаторах доступа HP-1910 странные пакеты с STP ругающиеся на контрольную сумму. Беседы с ИТ-никами БЦ пока ничего не дали и я на это время вообще отрубил STP. После отключения STP подобных пакетов не стало, но координально пока не помогло. Сегодня опять появлялись пользователи с теми же проблемами. Появление проблем стало отмечаться примерно после реорганизации сети, когда у нас появился HP-2530. В данном случае очень странно как он мог бы повлиять. Товарищи, направьте куда копать. Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
myth Опубликовано 19 апреля, 2017 · Жалоба Вот уж кто тут точно не при делах, так это STP. Сколько записей в FDB? Не подпадает ли трафик проблемных компьютеров под Unknown unicast policy(изучаются ли их маки на всех свитчах, включая те, что в серверной бизнес центра)? Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
edo Опубликовано 20 апреля, 2017 · Жалоба Посмотрев содержание пакетов выяснилось, что для моей сети Root-м была выбрана устройство Cisco, которого у нас нет и она принадлежит БЦ через оборудование которого мы подключены в ЦОД тоже не думаю, что тут дело в stp, но, набив шишки, включаю bpdu filter на портах, смотрящих наружу. чего и вам советую. а по проблеме - хоть карту сети бы нарисовали, более конкретно сформулировали проблему (проблема только на доступе в интернет или внутри сети тоже, L2 или есть роутинг, ...), добавили объективные показатели (повесить пинг на предмет потерь, netperf в моменты проблем) Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
nixx Опубликовано 20 апреля, 2017 · Жалоба Товарищи, направьте куда копать. я бы копал в сторону мониторинга портов, самих свитчей (проц, память, всякие ресурсы типа температуры) в первую очередь. mrtg/cacti, что-то такое. по результатам хотя бы 3-5-суточного сбора статистики можно что-то говорить. заодно и мониторинг серверов/шлюзов сделать. в общем, тех железок, через которые (с которыми) происходят тормоза. может у вас тупо пачка вирусов на каждом компе ) Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
paindrug Опубликовано 20 апреля, 2017 · Жалоба А есть что-нибудь в логах самих коммутаторов? Утилизация портов? Можно попробовать igmp snooping. Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
myth Опубликовано 20 апреля, 2017 · Жалоба Скорость менее мегабита намекает на unknown unicast policy. Проверяется по наличию трафика, адресованному проблемному компьютеру на других портах свитча Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
pilottt Опубликовано 21 апреля, 2017 · Жалоба Вот уж кто тут точно не при делах, так это STP. Сколько записей в FDB? Не подпадает ли трафик проблемных компьютеров под Unknown unicast policy(изучаются ли их маки на всех свитчах, включая те, что в серверной бизнес центра)? Все что менялось на коммутаторах с момента их прихода это вланы. Т.е. их количество и назначение на портах. Так как с сетевым оборудованием работаю далеко не плотно, то каких-то фитчей не плодил. На момент поиска проблем узнал, что RSTP был включен на коммутаторах 1910 и 1920 по умолчанию. Удивило. В логах сплошником только есть ошибки LinkUpDown порта. Это реакция порта на включение ПК. На просторах инета, пишут, что это нормальная работа этих коммутаторов и появления в логах такой картины. В течении рабочего времени на порту таких ошибок нет. Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
pilottt Опубликовано 21 апреля, 2017 · Жалоба А есть что-нибудь в логах самих коммутаторов? Утилизация портов? Можно попробовать igmp snooping. Ответил со скрином в комментарии выше. Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
pilottt Опубликовано 21 апреля, 2017 · Жалоба Скорость менее мегабита намекает на unknown unicast policy. Проверяется по наличию трафика, адресованному проблемному компьютеру на других портах свитча Если правильно понимаю, то речь идет контроле флудящего трафика на порту. Есть вот такие настройки (во вложении). Мы он них говорим? Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
myth Опубликовано 22 апреля, 2017 · Жалоба изучаются ли их маки на всех свитчах, включая те, что в серверной бизнес центра)? Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
pilottt Опубликовано 22 апреля, 2017 · Жалоба изучаются ли их маки на всех свитчах, включая те, что в серверной бизнес центра)? Можно уточнить, что значит изучаются? Все что настроено на оборудовании БЦ мне неизвестно. Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
paindrug Опубликовано 23 апреля, 2017 · Жалоба изучаются ли их маки на всех свитчах, включая те, что в серверной бизнес центра)? Можно уточнить, что значит изучаются? Все что настроено на оборудовании БЦ мне неизвестно. Есть записи в mac address table? Сколько их? На аплинках изучаются маки? Проблема наблюдается во всех vlan? Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
pilottt Опубликовано 24 апреля, 2017 · Жалоба изучаются ли их маки на всех свитчах, включая те, что в серверной бизнес центра)? Можно уточнить, что значит изучаются? Все что настроено на оборудовании БЦ мне неизвестно. Да, проблемы наблюдаются во всех VLAN (хоть было их 4, хоть стало 6). При полной загрузке в сети даже тонкие клиенты еле-еле стягивают загрузочный образ с TFTP (образ всего до 10 Мб). По количеству записей mac-адресов на коммутаторе в ядре 65-80 шт. Изучений mac'ов никаких нет. STP отключил вовсе. Пакетов с ошибками больше нет, но проблема остается. Есть записи в mac address table? Сколько их? На аплинках изучаются маки? Проблема наблюдается во всех vlan? Да, проблемы наблюдаются во всех VLAN (хоть было их 4, хоть стало 6). При полной загрузке в сети даже тонкие клиенты еле-еле стягивают загрузочный образ с TFTP (образ всего до 10 Мб). По количеству записей mac-адресов на коммутаторе в ядре 65-80 шт. Изучений mac'ов никаких нет. STP отключил вовсе. Пакетов с ошибками больше нет, но проблема остается. Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
myth Опубликовано 24 апреля, 2017 · Жалоба Не, я так больше не могу. Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
pilottt Опубликовано 24 апреля, 2017 · Жалоба Пришли после выходных. В выходные вообще никого не было на работе. Опять есть несколько жертв в сетке. Инет еле тянет, трафик по сети с этими компами тоже еле ходит. В этой подсети у остальных все ОК. Посмотрели Wireshark'ом, что происходит. Как только запускается приложение с доступов в инет или делается копирование по сети в дампе видим вот такое Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
Butch3r Опубликовано 24 апреля, 2017 · Жалоба Кольцо в сети? Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
pingz Опубликовано 24 апреля, 2017 · Жалоба ТС начни с начала Нарисуй схему для себя если ее не можешь нарисовать в голове, чтобы исключить петли. Если у тебя была бы петля в 1 гигабит у тебя не чего не работало от слова вообще, у меня были петли через Wi-Fi флапает но работает. У тебя 35 устройств в сети, значит у тебя должно быть 40-60 маков в сети если их 100 и более делай вывод сам. Сколько маков видишь с ЦОД есть ли лишний? Как писали желательно заиметь мониторинг типа заббикса, чтобы рисовать графики загрузки портов. У нас был один случай, на коммутаторе сгорели порт, он флудил на всю сеть помогла замена. Раз схемы сети нет берем 2 бука iperf идешм к HP-1920-16G отключаем ВСЁ! Делаем замер Если замер хороший, идем к другому коммутатору, добовляем его в сеть делаем еще один замер и т.д. Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
pilottt Опубликовано 24 апреля, 2017 · Жалоба ТС начни с начала Нарисуй схему для себя если ее не можешь нарисовать в голове, чтобы исключить петли. Если у тебя была бы петля в 1 гигабит у тебя не чего не работало от слова вообще, у меня были петли через Wi-Fi флапает но работает. У тебя 35 устройств в сети, значит у тебя должно быть 40-60 маков в сети если их 100 и более делай вывод сам. Сколько маков видишь с ЦОД есть ли лишний? Как писали желательно заиметь мониторинг типа заббикса, чтобы рисовать графики загрузки портов. У нас был один случай, на коммутаторе сгорели порт, он флудил на всю сеть помогла замена. Раз схемы сети нет берем 2 бука iperf идешм к HP-1920-16G отключаем ВСЁ! Делаем замер Если замер хороший, идем к другому коммутатору, добовляем его в сеть делаем еще один замер и т.д. Схема для себя уже давно нарисована. Физику на петли проверили. STP вообще отключили. Как мне кажется в таких условиях уже бы вся сеть лежала, а не отдельные ПК. Со стороны БЦ вроде бы лишних маков нет, но проверю еще раз. Забикс есть, но еще не в продакшене. Тестим. Больше всего удивляет, что такая беда влияет исключительно не некоторые ПК. Т.е. у некоторых траблы, у остальных все гуд. Wareshark'ом собирали данные на проблемных ПК как с отключением вообще всех сетевых приложений (флудящего трафика не приходит), так и с включением. ЧТо происходит в предыдущем сообщении. Ниже прикладываю план локалки. Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
myth Опубликовано 24 апреля, 2017 · Жалоба еще раз спрошу - маки проблемных пк изучаются всеми свитчами? Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
pingz Опубликовано 25 апреля, 2017 · Жалоба Возможно такое, что у кого-то один и тот же мак или IP? Если с линка проблемного ПК прогнать iperf(с заведомо рабочего пк) до сервера, скорость будет норм? Если норм, то проблема в пк. Если проблема осталась идете к коммутатору и пачкордом 2 метра замер, если норм, то линия, если нет меняете порт на коммутаторе если нет то идёте выше сегментом меряете если плохо, то отключаете меряете без этого сегмента, если не норм идете выше и т.д. Ошибки с портов смотрели? Проблема примерно, когда появилась, что на кануне делали? Есть кардинальный способ все в дефолт и заново настраиваем, как бы мы хотели видеть. На проблемном пк dr cureit в помощь. Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
Ivan_83 Опубликовано 26 апреля, 2017 · Жалоба флоу контроль попробовать отключить или включить на портах. Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
pilottt Опубликовано 26 апреля, 2017 · Жалоба еще раз спрошу - маки проблемных пк изучаются всеми свитчами? Маки изучаются на всех свитчах. Это если мы говорим про таблицу коммутации. Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
myth Опубликовано 26 апреля, 2017 · Жалоба В пределах вашей зоны ответственности скорость такая же низкая? Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
pilottt Опубликовано 26 апреля, 2017 · Жалоба В пределах вашей зоны ответственности скорость такая же низкая? Зона ответственности тут вся моя. Еще раз поясню ситуацию: только у некоторых пользователей возникают проблемы, и то сегодня у одних, завтра у других. Захотели свитчи сегодня для одних сделать приоритет, они работают нормально, а другие тупят. Сейчас ушел народ с работы, включили проблемные компы, а у них все нормально. Вот где логика? Завтра появится нагрузка на сетку и опять у кого будут проблемы. Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
myth Опубликовано 26 апреля, 2017 · Жалоба скорость низкая между юзер-юзер в пределах влана(разных вланах), юзер-сервер БЦ, сервер БЦ-юзер, юзер-инет? Или во всех случаях? Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...