Jump to content
Калькуляторы

Нужно разъяснение про fdb flood (на d-link, в частности)

Доброго дня, коллеги!

Столкнулись с этой проблемой. Проявилось так - при копировании файлов в сторону клиента с некоторого момента времени скорость упала вдвое (канал 100Мбит, скорость копирования 4,5МБ/с), в обратную сторону от клиента все в норме (11 МБ/с). 2 дня искали проблему пока не наткнулись на разговоры про коллизии маков на d-link.

Проблему решили отключением режима learning на портах, т.к. вланов никаких нет и пока нет возможности их поднять.

Железо - 3052 и 1228/ME rev.A1

 

Вопрос в следующем - как объяснить руководству, что проблема была именно во флуде? Дело в том, что мониторинг ничего критичного не показал. Загрузка CPU 3-9%, аплинк 20-30Мбит/с (оптика, 1Гбит/с), порт клиента в процессе передачи к нему показывает загрузку 50Мбит/с.

Разъясните, пожалуйста.

Share this post


Link to post
Share on other sites

Столкнулись с этой проблемой. Проявилось так - при копировании файлов в сторону клиента с некоторого момента времени скорость упала вдвое (канал 100Мбит, скорость копирования 4,5МБ/с), в обратную сторону от клиента все в норме (11 МБ/с). 2 дня искали проблему пока не наткнулись на разговоры про коллизии маков на d-link.

Проблему решили отключением режима learning на портах, т.к. вланов никаких нет и пока нет возможности их поднять.

Железо - 3052 и 1228/ME rev.A1

Вопрос вероятней всего, не в коллизиях, в "буферах".

В случае если включить learning на портах и гигабитный аплинк порт/ы перевести в сотку, проблема воспроизводится ?

Если модель 1228/МЕ еще поддерживается и версия прошивки последняя, можно задать этот вопрос на форуме Длинка, упростив стенд для простоты повторения.

2Пк, 1228/МЕ, один линк 100Мbit, второй 1G.

Share this post


Link to post
Share on other sites

На форуме длинка уже написал, пока молчат.

С аплинком не игрался. Но! если напортах вместо автоопределения скорости выставить руками 100Full, то проблема тоже исчезает.

Проблема есть на 1228 старой ревизии. К ней, к сожалению, свежих прошивок нет.

Дело в том, что не проблема заменить оборудование и, скорее всего, забыть о проблеме, но хочется понять причину ее возникновения и суть происходящих при этом процессов.

Правильно ли я понимаю, что при отключении режима learning коммутатор станет тупым хабом? Или, прочитанная за несколько дней тонна инфы, создала кашу в голове? ))

Share this post


Link to post
Share on other sites

Если вы меняете скорость и это помогает то коллизии тут не причём.

Тогда, что это? И, почему помогает отключение learning?

 

К тому же, если включаю контроль коллизий, то через минуту вижу в таблице как минимум 2 мака, у которых хеш совпал и, соответственно один из них не попал в таблицу fdb.

Edited by Fredd

Share this post


Link to post
Share on other sites

Да D-Link DES-3200 очень агрессивный полисер. На других моделях скорее всего тоже.

Если под копированием файла подразумевается копирование в проводнике Windows, то я просто на полисере задавал вдвое большую ширину.

Ну либо на доступе полисер нужно выключить, а шейпить на ядре (разумеется если трафик ходит через ядро).

Share this post


Link to post
Share on other sites

Если вы меняете скорость и это помогает то коллизии тут не причём.

Тогда, что это? И, почему помогает отключение learning?

 

К тому же, если включаю контроль коллизий, то через минуту вижу в таблице как минимум 2 мака, у которых хеш совпал и, соответственно один из них не попал в таблицу fdb.

Если это так - то проблема в коллизиях. Каким образом смена скорости может на это влиять?

Share this post


Link to post
Share on other sites

Из-за ограничения кол-ва сообщений пришлось регить еще один акк.

 

Да D-Link DES-3200 очень агрессивный полисер. На других моделях скорее всего тоже.

Если под копированием файла подразумевается копирование в проводнике Windows, то я просто на полисере задавал вдвое большую ширину.

Ну либо на доступе полисер нужно выключить, а шейпить на ядре (разумеется если трафик ходит через ядро).

Нет у нас ничего подобного, никаких ACL. Тем более, что речь идет о 3028, у 3200 проблемы с коллизиями нет, т.к. чип другой.

 

 

Если это так - то проблема в коллизиях. Каким образом смена скорости может на это влиять?

Вот и я не понимаю. В итоге мне не верят, что проблема в коллизиях, а как это доказать я пока не знаю.

Share this post


Link to post
Share on other sites

включаете flood. делаете в телнете несколько раз show flood. Если timestamp (так помоему там называется) растёт - значит коллизия активная и реально влияет на работу сети.

 

Как доказать - снифер в руки и показать руководству трафик на порту, которого там быть не должно (а именно при коллизии так и будет)

Share this post


Link to post
Share on other sites

К тому же, если включаю контроль коллизий, то через минуту вижу в таблице как минимум 2 мака, у которых хеш совпал и, соответственно один из них не попал в таблицу fdb.

Ну так известная проблема 3028. Можешь на конечном оборудовании прибить ручками другие маки, чтобы у них были разные хэши. Если проблема уйдёт - однозначно дело в коллизиях.

Share this post


Link to post
Share on other sites

включаете какой-нибудь девайс, который не генерирует трафика, в свободный порт коммутатора в том же vlan. Если на него начинет литься трафик синхронно в каким-нибудь еще, то значит коллизия есть. по tcpdump на это девайсе даже увидите, какой mac не изучился

Share this post


Link to post
Share on other sites

Если вы меняете скорость и это помогает то коллизии тут не причём.

Тогда, что это? И, почему помогает отключение learning?

 

К тому же, если включаю контроль коллизий, то через минуту вижу в таблице как минимум 2 мака, у которых хеш совпал и, соответственно один из них не попал в таблицу fdb.

Если это так - то проблема в коллизиях. Каким образом смена скорости может на это влиять?

Присоеденюсь к вопросу. Покажите копипастом из консоли то что видите в консоли и прокоментируйте.

 

Можно редактировать предыдущие/первое сообщения ;)

 

Вот и я не понимаю. В итоге мне не верят, что проблема в коллизиях, а как это доказать я пока не знаю.

Проблема в другом месте, проблема решена - да. Какая разница в каком именно месте проблема ?

Share this post


Link to post
Share on other sites

Что-то я не понял почему упала скорость. При коллизии такого быть не должно, если только не включен рейтлимит на unknown unicast в функционале strom control.

Share this post


Link to post
Share on other sites

Проблема есть на 1228 старой ревизии. К ней, к сожалению, свежих прошивок нет.
Его можно перешить в 3028, к которому прошивки регулярно выходят до сих пор.

 

По сути проблемы - поменяйте мак у клиента.

Share this post


Link to post
Share on other sites

если только не включен рейтлимит на unknown unicast в функционале strom control.

Все отключено.

 

 

Его можно перешить в 3028, к которому прошивки регулярно выходят до сих пор.

 

По сути проблемы - поменяйте мак у клиента.

Дык, у 3028 те же проблемы. Чипсет один и тот же.

Менять маки не вариант. Это не выход

Мне проще сменить оборудование, т.к. есть на что.

 

Я понимаю, что проблема решается только костылями. Суть поста - понять, что же происходит на самом деле и, почему падает скорость.

Share this post


Link to post
Share on other sites

Сделайте как посоветовал dmvy:

 

включаете какой-нибудь девайс, который не генерирует трафика, в свободный порт коммутатора в том же vlan. Если на него начинет литься трафик синхронно в каким-нибудь еще, то значит коллизия есть. по tcpdump на это девайсе даже увидите, какой mac не изучился

 

Если это коллизии, туда будет сыпаться трафик и большой.

 

Скорость может просесть, из-за того что такого трафика ОЧЕНЬ много. То есть 100 Мбитный порт перегружается мусором, из-за чего и падает "полезная скорость"

Share this post


Link to post
Share on other sites

Скорость может просесть, из-за того что такого трафика ОЧЕНЬ много. То есть 100 Мбитный порт перегружается мусором, из-за чего и падает "полезная скорость"

 

Тогда отключение лернинга бы не помогало. Кто-то что-то не договаривает)

Share this post


Link to post
Share on other sites

При интенсивных пингах есть потери?

 

Влить со стороны аплинка поток "пингов" на 10080 Мбит и посмотреть куда они прилетят (на коммутаторе).

 

Отключение learning может помогать только если там есть конфликт MAC. Или же неправильно отрабатывается конфликт хеш функции коммутации. Или же производитель сделал какую-нибудь другую невообразимую ерунду.

 

Попробуйте сменить MAC абоненту. Кстати какой у абонента MAC?

Share this post


Link to post
Share on other sites

Менять маки не вариант. Это не выход
Это не выход, это эксперимент.

Если в итоге смены мака проблема останется, значит коллизии тут не при чём…

Share this post


Link to post
Share on other sites

поток "пингов" на 10080 Мбит

Стыдно спрашивать, но чем такой поток сгенерить?

 

Вчера поставили 1228 rev.A2, коллизий не показал, но пироги теже. Learning есть - скорость 50МБит/с, learning выключен - все в норме, но режим хаба.

 

Готовим Qtech. Посмотрим, что будет с ним. Я уже сдаюсь.

Share this post


Link to post
Share on other sites

Если вам 100full помогает, может автоопределение скорости на клиенте не работает?

в статусе порта на коммутаторе и на клиенте стоит 100 при автоопределении.

По факту: к клиенту 50, от клиента 100. Было бы по 50 в обе стороны можно было бы списать на полудуплекс.

 

Ни одной зацепки, блин ((

Share this post


Link to post
Share on other sites

Стыдно спрашивать, но чем такой поток сгенерить?

с linux ping -f -s <1500 или больше>

можно начать с "ping -f -s 100" и потихоньку увеличивать пока поток не дорастет до 80 Мбит

 

Так же можно поиграть с параметром "-l" и более маленькими пакетами

Share this post


Link to post
Share on other sites

с linux

Винда. Кругом. Но наверное софт есть и под окна. А чем копирование файлов не подходит?

 

 

Пока итогом следующее - поставили Qtech 3450 (гигабит). Весь гигабит долетает до клиентов. Теперь уже не знаю, стоит ли дальше разбираться или просто списать на кривую серию длинков.

Share this post


Link to post
Share on other sites

learning выключен - все в норме

Бывает, выключение/выключение совершенно постороннего функционала, влияет на другой, иногда, совершенно не взаимосвязанный.

 

Ни одной зацепки, блин ((

Сношайте Длинк))

Share this post


Link to post
Share on other sites

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.

Guest
Reply to this topic...

×   Pasted as rich text.   Paste as plain text instead

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.