Fredd Posted November 14, 2016 Доброго дня, коллеги! Столкнулись с этой проблемой. Проявилось так - при копировании файлов в сторону клиента с некоторого момента времени скорость упала вдвое (канал 100Мбит, скорость копирования 4,5МБ/с), в обратную сторону от клиента все в норме (11 МБ/с). 2 дня искали проблему пока не наткнулись на разговоры про коллизии маков на d-link. Проблему решили отключением режима learning на портах, т.к. вланов никаких нет и пока нет возможности их поднять. Железо - 3052 и 1228/ME rev.A1 Вопрос в следующем - как объяснить руководству, что проблема была именно во флуде? Дело в том, что мониторинг ничего критичного не показал. Загрузка CPU 3-9%, аплинк 20-30Мбит/с (оптика, 1Гбит/с), порт клиента в процессе передачи к нему показывает загрузку 50Мбит/с. Разъясните, пожалуйста. Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
kosmich7 Posted November 14, 2016 Столкнулись с этой проблемой. Проявилось так - при копировании файлов в сторону клиента с некоторого момента времени скорость упала вдвое (канал 100Мбит, скорость копирования 4,5МБ/с), в обратную сторону от клиента все в норме (11 МБ/с). 2 дня искали проблему пока не наткнулись на разговоры про коллизии маков на d-link. Проблему решили отключением режима learning на портах, т.к. вланов никаких нет и пока нет возможности их поднять. Железо - 3052 и 1228/ME rev.A1 Вопрос вероятней всего, не в коллизиях, в "буферах".В случае если включить learning на портах и гигабитный аплинк порт/ы перевести в сотку, проблема воспроизводится ? Если модель 1228/МЕ еще поддерживается и версия прошивки последняя, можно задать этот вопрос на форуме Длинка, упростив стенд для простоты повторения. 2Пк, 1228/МЕ, один линк 100Мbit, второй 1G. Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
Fredd Posted November 14, 2016 На форуме длинка уже написал, пока молчат. С аплинком не игрался. Но! если напортах вместо автоопределения скорости выставить руками 100Full, то проблема тоже исчезает. Проблема есть на 1228 старой ревизии. К ней, к сожалению, свежих прошивок нет. Дело в том, что не проблема заменить оборудование и, скорее всего, забыть о проблеме, но хочется понять причину ее возникновения и суть происходящих при этом процессов. Правильно ли я понимаю, что при отключении режима learning коммутатор станет тупым хабом? Или, прочитанная за несколько дней тонна инфы, создала кашу в голове? )) Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
Butch3r Posted November 14, 2016 Если вы меняете скорость и это помогает то коллизии тут не причём. Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
Fredd Posted November 14, 2016 (edited) Если вы меняете скорость и это помогает то коллизии тут не причём. Тогда, что это? И, почему помогает отключение learning? К тому же, если включаю контроль коллизий, то через минуту вижу в таблице как минимум 2 мака, у которых хеш совпал и, соответственно один из них не попал в таблицу fdb. Edited November 14, 2016 by Fredd Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
alibek Posted November 14, 2016 Да D-Link DES-3200 очень агрессивный полисер. На других моделях скорее всего тоже. Если под копированием файла подразумевается копирование в проводнике Windows, то я просто на полисере задавал вдвое большую ширину. Ну либо на доступе полисер нужно выключить, а шейпить на ядре (разумеется если трафик ходит через ядро). Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
Butch3r Posted November 14, 2016 Если вы меняете скорость и это помогает то коллизии тут не причём. Тогда, что это? И, почему помогает отключение learning? К тому же, если включаю контроль коллизий, то через минуту вижу в таблице как минимум 2 мака, у которых хеш совпал и, соответственно один из них не попал в таблицу fdb. Если это так - то проблема в коллизиях. Каким образом смена скорости может на это влиять? Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
AlFredd Posted November 14, 2016 Из-за ограничения кол-ва сообщений пришлось регить еще один акк. Да D-Link DES-3200 очень агрессивный полисер. На других моделях скорее всего тоже. Если под копированием файла подразумевается копирование в проводнике Windows, то я просто на полисере задавал вдвое большую ширину. Ну либо на доступе полисер нужно выключить, а шейпить на ядре (разумеется если трафик ходит через ядро). Нет у нас ничего подобного, никаких ACL. Тем более, что речь идет о 3028, у 3200 проблемы с коллизиями нет, т.к. чип другой. Если это так - то проблема в коллизиях. Каким образом смена скорости может на это влиять? Вот и я не понимаю. В итоге мне не верят, что проблема в коллизиях, а как это доказать я пока не знаю. Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
Butch3r Posted November 14, 2016 включаете flood. делаете в телнете несколько раз show flood. Если timestamp (так помоему там называется) растёт - значит коллизия активная и реально влияет на работу сети. Как доказать - снифер в руки и показать руководству трафик на порту, которого там быть не должно (а именно при коллизии так и будет) Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
straus Posted November 14, 2016 К тому же, если включаю контроль коллизий, то через минуту вижу в таблице как минимум 2 мака, у которых хеш совпал и, соответственно один из них не попал в таблицу fdb. Ну так известная проблема 3028. Можешь на конечном оборудовании прибить ручками другие маки, чтобы у них были разные хэши. Если проблема уйдёт - однозначно дело в коллизиях. Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
dmvy Posted November 14, 2016 включаете какой-нибудь девайс, который не генерирует трафика, в свободный порт коммутатора в том же vlan. Если на него начинет литься трафик синхронно в каким-нибудь еще, то значит коллизия есть. по tcpdump на это девайсе даже увидите, какой mac не изучился Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
kosmich7 Posted November 14, 2016 Если вы меняете скорость и это помогает то коллизии тут не причём. Тогда, что это? И, почему помогает отключение learning? К тому же, если включаю контроль коллизий, то через минуту вижу в таблице как минимум 2 мака, у которых хеш совпал и, соответственно один из них не попал в таблицу fdb. Если это так - то проблема в коллизиях. Каким образом смена скорости может на это влиять? Присоеденюсь к вопросу. Покажите копипастом из консоли то что видите в консоли и прокоментируйте. Можно редактировать предыдущие/первое сообщения ;) Вот и я не понимаю. В итоге мне не верят, что проблема в коллизиях, а как это доказать я пока не знаю. Проблема в другом месте, проблема решена - да. Какая разница в каком именно месте проблема ? Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
vurd Posted November 14, 2016 Что-то я не понял почему упала скорость. При коллизии такого быть не должно, если только не включен рейтлимит на unknown unicast в функционале strom control. Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
rdc Posted November 14, 2016 Проблема есть на 1228 старой ревизии. К ней, к сожалению, свежих прошивок нет.Его можно перешить в 3028, к которому прошивки регулярно выходят до сих пор. По сути проблемы - поменяйте мак у клиента. Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
AlFredd Posted November 14, 2016 если только не включен рейтлимит на unknown unicast в функционале strom control. Все отключено. Его можно перешить в 3028, к которому прошивки регулярно выходят до сих пор. По сути проблемы - поменяйте мак у клиента. Дык, у 3028 те же проблемы. Чипсет один и тот же. Менять маки не вариант. Это не выход Мне проще сменить оборудование, т.к. есть на что. Я понимаю, что проблема решается только костылями. Суть поста - понять, что же происходит на самом деле и, почему падает скорость. Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
Morbid Posted November 14, 2016 Сделайте как посоветовал dmvy: включаете какой-нибудь девайс, который не генерирует трафика, в свободный порт коммутатора в том же vlan. Если на него начинет литься трафик синхронно в каким-нибудь еще, то значит коллизия есть. по tcpdump на это девайсе даже увидите, какой mac не изучился Если это коллизии, туда будет сыпаться трафик и большой. Скорость может просесть, из-за того что такого трафика ОЧЕНЬ много. То есть 100 Мбитный порт перегружается мусором, из-за чего и падает "полезная скорость" Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
vurd Posted November 14, 2016 Скорость может просесть, из-за того что такого трафика ОЧЕНЬ много. То есть 100 Мбитный порт перегружается мусором, из-за чего и падает "полезная скорость" Тогда отключение лернинга бы не помогало. Кто-то что-то не договаривает) Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
Tosha Posted November 14, 2016 При интенсивных пингах есть потери? Влить со стороны аплинка поток "пингов" на 10080 Мбит и посмотреть куда они прилетят (на коммутаторе). Отключение learning может помогать только если там есть конфликт MAC. Или же неправильно отрабатывается конфликт хеш функции коммутации. Или же производитель сделал какую-нибудь другую невообразимую ерунду. Попробуйте сменить MAC абоненту. Кстати какой у абонента MAC? Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
rdc Posted November 14, 2016 Менять маки не вариант. Это не выходЭто не выход, это эксперимент.Если в итоге смены мака проблема останется, значит коллизии тут не при чём… Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
AlFredd Posted November 15, 2016 поток "пингов" на 10080 Мбит Стыдно спрашивать, но чем такой поток сгенерить? Вчера поставили 1228 rev.A2, коллизий не показал, но пироги теже. Learning есть - скорость 50МБит/с, learning выключен - все в норме, но режим хаба. Готовим Qtech. Посмотрим, что будет с ним. Я уже сдаюсь. Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
hRUst Posted November 15, 2016 Если вам 100full помогает, может автоопределение скорости на клиенте не работает? Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
Fredd Posted November 15, 2016 Если вам 100full помогает, может автоопределение скорости на клиенте не работает? в статусе порта на коммутаторе и на клиенте стоит 100 при автоопределении. По факту: к клиенту 50, от клиента 100. Было бы по 50 в обе стороны можно было бы списать на полудуплекс. Ни одной зацепки, блин (( Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
Tosha Posted November 15, 2016 Стыдно спрашивать, но чем такой поток сгенерить? с linux ping -f -s <1500 или больше> можно начать с "ping -f -s 100" и потихоньку увеличивать пока поток не дорастет до 80 Мбит Так же можно поиграть с параметром "-l" и более маленькими пакетами Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
Fredd Posted November 15, 2016 с linux Винда. Кругом. Но наверное софт есть и под окна. А чем копирование файлов не подходит? Пока итогом следующее - поставили Qtech 3450 (гигабит). Весь гигабит долетает до клиентов. Теперь уже не знаю, стоит ли дальше разбираться или просто списать на кривую серию длинков. Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
kosmich7 Posted November 15, 2016 learning выключен - все в норме Бывает, выключение/выключение совершенно постороннего функционала, влияет на другой, иногда, совершенно не взаимосвязанный. Ни одной зацепки, блин (( Сношайте Длинк)) Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...