Jump to content

Recommended Posts

Posted

Есть старенький inpro archer с двумя двухъядерными xeon'ами, двумя встроенными сетевухами и одной двухпортовой ( в тике обозначены как 82541GI Gigabit Ethernet Controller (rev: 5) и 82571EB Gigabit Ethernet Controller (rev: 6)). На каждой сетевухе висит по влану - внутренние сервера+влан управления, пользовательский+офисный, интернет и влан для юриков. Версия тика 5.17.

Сервер роутит остатки локального трафика (200-300 мбит в пике), раздает интернет посредством pptp ну и шейпит (HTB) порядка 250 пользователей в пике.

Нагрузка собственно копеешная.

И вот, после 150 дней счастливого аптайма появляется первый глюк.

Отваливается пользовательский vlan: pptp рвется, локальные ресурсы не пингуются. 5 минут и все взлетает как ни в чем не бывало.

Где-то через неделю происходит такая же ерунда (всегда утром), накидываю куртку, бегу в офис, благо он в минутной доступности. Сажусь за рабочий комп и понимаю, что все работает...интернет, локалка, винбокс подключается, смотрю в активные PPP и вижу только два рабочих компа, еще через пару минут начинают подключаться пользюки и все опять довольны (напомню, что офисный вилан висит на одной сетевухе с пользовательским).

Вобщем в целях профилактики обновил микротик до 5.24, перевесил все виланы на две встроенных сетевушки.

Что имею теперь...локалка работает, pptp подключается - интернета нет. Оно и понятно ip'шка не добавилась в адрес лист, начал грешить на биллинг, который этим тиком управляет, хотя в логах тика вижу, что биллинг логинется и логаутиться при подключении пользователя, только команды почему-то не приходят, ребучу биллинг - ситуация не меняется, захожу по ssh на биллинг и пробую подключиться к тику, минут 15 он думал, потом разродился и отобразил мне текстовую заставку микротик, на этом все, терпение кончилось...ребучу тик и все становится хорошо, ровно на два дня. Сегодня опять таже проблема.

Процессор загружен на 20-30 процентов, оперативки свободно 950 из гига, дропов на сетевухах нет.

Доступ к тику открыт с нескольких серых адресов.

Posted

А как вы мониторите, если юзер займет адрес сервера?

Никак, на доброй половине домов уже стоят управляшки и настроен dhcp snooping.

Похоже на конфликт ip?

А каким образом такие вещи мониторить в неуправляемой сети?

Posted

На самой железке по-моему ни как.

Если в клиентской сети, есть еще один микротик то там скриптом можно отслеживать мак-адрес шлюза и записывать его в адрес лист в коментариях к этом ip указывает мак.

  • 1 month later...
Posted

Подниму тему.

Сегодня собрали железку на ASUS P8Z77-V LX, core i3 3.4 ггц.

Вытащил флешку с routeros со старого сервера, вставил в новый. Запустил, патчкорды переткнул, начали подключаться абоны, вроде все нормально, через 15 минут комп колом, на клавиатуру не реагирует.

Обновил до 5.25, сейчас стабильно каждые 2-3 часа получаю трупак...

Перевожу личные вещи в офис...

 

***последние новости с фронта***

Сейчас вывалился kernel panic, сфотографировать не догадался с перепугу...

Но точно видел, что внизу было написано про прерывания.

 

Выручите, пожалуйста.

Posted (edited)

Вобщем в целях профилактики обновил микротик до 5.24

в логах тика вижу, что биллинг логинется и логаутиться при подключении пользователя, только команды почему-то не приходят

 

захожу по ssh на биллинг и пробую подключиться к тику, минут 15 он думал, потом разродился и отобразил мне текстовую заставку микротик, на этом все, терпение кончилось...ребучу тик и все становится хорошо, ровно на два дня. Сегодня опять таже проблема.

Процессор загружен на 20-30 процентов, оперативки свободно 950 из гига, дропов на сетевухах нет.

Доступ к тику открыт с нескольких серых адресов.

А как билинг у вас отдает команды микротику ? если по ssh, то так и будет виснуть в самые различные моменты, на данной прошивке, последняя рабочая версия 5.17

Edited by inettel
Posted

А как билинг у вас отдает команды микротику ? если по ssh, то так и будет виснуть в самые различные моменты, на данной прошивке, последняя рабочая версия 5.17

Да, по ssh. У меня в пике 200 pptp пользователей, неужеле биллинг генерит такую нагрузку командами по ssh?

Вообще, до смены железки отваливалось сначала именно ssh, потом полностью пропадала связь, минут через 5 все заводилось.

Сейчас железо встает колом.

С telnet'ом таких проблем не наблюдается?

Posted (edited)

Дело не в нагрузке командами, может и на второй команде отданой подряд загнуться, а в баге, тема на микротиковском форуме уже почти год висит http://forum.mikrotik.com/viewtopic.php?f=2&t=65239

Насчет телнета - не пробовали, авторизацию придется довольно костыльно городить, какой ни будь expect, или еще что.

Решили для себя, что проще сидеть на 5.17, и ждать когда великие разработчики микротика чего ни будь уже сделают.

 

п.с. в ветка 6.xx баг тоже присутствует (последняя опробаванная 6.12)

Edited by inettel
Posted

Дело тут не в прошивке а видимо в настройках или самой организации сети.

 

Нужно было со старого сервера вытащить конфиг через export compact, сбросить конфиг на флэшке, далее залить текстовый конфиг. Сейчас же у вас может там быть что угодно.

 

По SSH все авторизуется без проблем, если нормально настроена связка с биллингом. Но тут скорее всего проблема во флуде от клиентов, либо где-то происходит заворот трафика. Версия 5.24 нормально работает в качестве PPPoE сервера.

 

Ну и естественно в биосе нужно поотключать все лишнее.

 

Что бы обезопасить себя от всех проблем с биллингом, нужно сделать так, что бы все работало и без него. И вместо запрещения всего и разрешения конкретных пользователей нужно делать наоборот - разрешено все что не запрещено.

Posted

Дело тут не в прошивке а видимо в настройках или самой организации сети.

Организация сети конечно не комильфо, но мы стремимся к лучшему.

Сейчас на 40 из 60 домов стоят управляшки, делаем из одной кучи влан на дом.

На свичах агрегации настроен шторм контрол, скоро переедет на доступ.

Штормов не видно.

Нужно было со старого сервера вытащить конфиг через export compact, сбросить конфиг на флэшке, далее залить текстовый конфиг. Сейчас же у вас может там быть что угодно.

В конфиге сейчас всё тоже самое, что и на старом железе, не вижу смысла в подобных телодвижениях.

Posted

Дело не в нагрузке командами, может и на второй команде отданой подряд загнуться, а в баге, тема на микротиковском форуме уже почти год висит http://forum.mikrotik.com/viewtopic.php?f=2&t=65239

Насчет телнета - не пробовали, авторизацию придется довольно костыльно городить, какой ни будь expect, или еще что.

Решили для себя, что проще сидеть на 5.17, и ждать когда великие разработчики микротика чего ни будь уже сделают.

 

п.с. в ветка 6.xx баг тоже присутствует (последняя опробаванная 6.12)

Спасибо за подсказку, действительно очень похоже на мой случай.

Хорошо, что костыли с expect придумали до меня :)

Posted

Дело тут не в прошивке а видимо в настройках или самой организации сети.

Организация сети конечно не комильфо, но мы стремимся к лучшему.

Сейчас на 40 из 60 домов стоят управляшки, делаем из одной кучи влан на дом.

На свичах агрегации настроен шторм контрол, скоро переедет на доступ.

Штормов не видно.

 

Тут дело не в контроле, а в маках и флуде. Что вам мешает сменить PPTP на PPPoE? Сейчас любой может указать адрес вашего сервера или его мак и парализует работу сети. В моем ведении есть сеть на PPPoE вообще сделаны чуть ли не полностью на не управляемом железе, однако на управляемых коммутаторах и иных устройствах, куда все эти не управляемые сегменты сходятся, стоит блокировка всего трафика, кроме PPPoE и никаких проблем вообще нет. Ни с зависаниями, ни с отвалами ресурсов, ни с доступом биллинга.

 

Искать проблему нужно в сети, поставьте в разрыв что-то для фильтрации. Микротик например позволяет через Torch посмотреть что в сети бегает, поставьте там все галочки и запустите на входном интерфейсе, увидите что там гуляет.

 

Нужно было со старого сервера вытащить конфиг через export compact, сбросить конфиг на флэшке, далее залить текстовый конфиг. Сейчас же у вас может там быть что угодно.

В конфиге сейчас всё тоже самое, что и на старом железе, не вижу смысла в подобных телодвижениях.

 

В конфиге есть специфичные настройки, например маки сетевых адаптеров и т.п. Которые после переноса конфига остаются такими же. Вообще этот файл с конфигом можно переносить только в пределах одной железки, например для бэкапа. То есть сломалась железка, купили такую же на замену и влили обратно. Получили точную копию. Во всех других случаях переносят через текстовый конфиг.

 

И вообще проверьте превильность настроек PPP сервера, сравните с этой статьей - http://www.lanmart.ru/blogs/how-to-become-isp/ - т.к. не правильная установка галочек в профиле PPP может приводить к очень серьезным глюкам.

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.

Guest
Reply to this topic...

×   Pasted as rich text.   Paste as plain text instead

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.

×
×
  • Create New...
На сайте используются файлы cookie и сервисы аналитики для корректной работы форума и улучшения качества обслуживания. Продолжая использовать сайт, вы соглашаетесь с использованием файлов cookie и с Политикой конфиденциальности.