Alex_P89 Posted March 7, 2015 Posted March 7, 2015 Помогите разобраться с проблемой. Краткое описание конфигурации: Есть сервер с RouterOS х86 ver. 6.27 (была 6.26, обновление не помогло). Два аплинка. На одном NAT в пул и сеть /28, на другом маскарадинг и сеть /30. Размер max-arp-entries=16000, таймаут 1 минута, в ARP таблице 5 записей. Проблема: Через несколько минут после ребута (зависит от кол-ва трафика) в лог сыпятся сообщения "ARP table overflow, please consider increasing max-arp-entries". При этом происходят дикие лаги сервера. Увеличение max-arp-entries просто оттягивает наступление проблемы. При max-arp-entries=160000 и более сервер просто виснет через пару часов, очевидно по заполнению ARP. Если отрубить аплинк с маскарадингом, то работает стабильно, за 12 часов работы при таблице 16000 не было переполнения. Всю паранойю связанную с железом исключили. Проблемный аплинк свою вину всячески исключает. Похоже остаётся только баг в настройке RouterOS и баг самой RouterOS. Что это за безобразие может быть? Что такое летит в ARP таблицу RouterOS? Как она вообще работает на RouterOS? Вставить ник Quote
NiTr0 Posted March 7, 2015 Posted March 7, 2015 Если в момент лагов в арп таблице все те же 5 записей - печаль-беда. Придется перебирать разные версии в поисках той, в которой этого бага нет :) Вставить ник Quote
viver Posted March 7, 2015 Posted March 7, 2015 Да, в момент лагов сколько реально arp записей? Вставить ник Quote
Alex_P89 Posted March 7, 2015 Author Posted March 7, 2015 Да, в момент лагов сколько реально arp записей? Всегда 5 штук. Всего 5 записей... Вставить ник Quote
NiTr0 Posted March 7, 2015 Posted March 7, 2015 Ну что ж, можно тогда только поздравить с очередным кактусом. Ищите стабильную версию методом тыка. Или поспрашивайте тут местного продавана о его волшебных "правильных настройках". Вставить ник Quote
vladimirslk Posted March 7, 2015 Posted March 7, 2015 у меня после обновления софта на серверах тоже наблюдались кое-где проблемы. на одном гейтвее например начались лоссы 30%. откатился на 5.26 все нормально, хотя в то же время на других 6.27 завелись без проблем. можт иссуе железа хз. не разбирался Вставить ник Quote
SyJet Posted March 7, 2015 Posted March 7, 2015 Поставьте vyos (vyatta) и не мучайте ....у. Чесслово, мыши плакали, кололись, но продолжали жрать кактус. Вставить ник Quote
axisBeam Posted March 7, 2015 Posted March 7, 2015 знатная проблема, 3 сервера х86 с этим чудом(микротик). сильно проявилась проблема после перехода на 6 версию. Вставить ник Quote
s.lobanov Posted March 7, 2015 Posted March 7, 2015 возможно, дело в том, что какие-то клиенты пользуют ваш микротик как прокси-арп, т.е. шлют запросы на каждый dst ip и, вероятно, у шлакотика сносит крышу от этого Вставить ник Quote
viver Posted March 8, 2015 Posted March 8, 2015 Можно посмотреть на интерфейсах, что там по arp бегает. Может что-то прояснится. Вставить ник Quote
Alex_P89 Posted March 8, 2015 Author Posted March 8, 2015 Тьфу-тьфу-тьфу, но проблема похоже решена - сутки всё работает стабильно, ошибок нет. возможно, дело в том, что какие-то клиенты пользуют ваш микротик как прокси-арп, т.е. шлют запросы на каждый dst ip и, вероятно, у шлакотика сносит крышу от этого Можно посмотреть на интерфейсах, что там по arp бегает. Может что-то прояснится. Спасибо за советы. Я с самого начала крутил и вертел дампы, и там по ARP ничего не было, кроме запросов и ответов относящихся к соответствующим интерфейсам роутера. И судя по всему проблема не связана с ARP. Она связана с NAT. Исчерпание лимита трансляций через один адрес приводят к переполнению таблицы ARP, чем больше трафика и меньше внешних адресов для трансляции, тем быстрее переполнение. Не понимаю как это вообще может быть связано, но все эксперименты это подтверждают. Пути микротика неисповедимы. Решение: На интерфейсе второго аплинка убрали NAT-маскарадинг, сделали NAT в пул из 14 адресов. Всё работает, проблема ушла. Вставить ник Quote
NiTr0 Posted March 8, 2015 Posted March 8, 2015 Чтобы перестал болеть нос, нужно почесать пятку. Чудны деяния инженеров микротика... Вставить ник Quote
s.lobanov Posted March 8, 2015 Posted March 8, 2015 Может просто сообщение в логах перепутали они. Копипаста злая штука. Вставить ник Quote
NiTr0 Posted March 8, 2015 Posted March 8, 2015 Дык какие же клешни надо иметь вместо рук, чтобы обычный маскарадинг заломать... Не говоря уже о том, что изменение размера арп таблицы меняет поведение - т.е. проблема явно не в ошибочном сообщении. Вставить ник Quote
viver Posted March 8, 2015 Posted March 8, 2015 Говорил вам сааб, что нельзя маскарадинг в микротике использовать, а вы не верили! ;-) Вставить ник Quote
Recommended Posts
Join the conversation
You can post now and register later. If you have an account, sign in now to post with your account.