Jump to content

Столкнулся с проблемой провалов SNMP на более-менее загруженном железе. В часности CCR1009 и CCR1016 обычно когда трафик превышает половину пропускной способности порта, или CPU LOAD показывает более 50%. В такие моменты даже SNMP tester не может выполнить READ device uptime, не говоря уже об остальном. Это как-то лечится или лучше отказаться от SNMP на загруженных железках?

Share this post


Link to post
Share on other sites

SNMP устаревший протокол. Если используете микротик, то всю информацию с него надо получать другими способами, которые не нагружают оборудование.

 

И с другой стороны, если у вас это роутер или маршрутизатор, который пропускает некий трафик, то зачем мониторить аптайм, загрузку процессора и прочую не нужную информацию? Какой смысл это несет? Если будет упираться в производительность, то увеличение задержки (пинга) сообщит о проблеме.

Share this post


Link to post
Share on other sites

о всю информацию с него надо получать другими способами, которые не нагружают оборудование.

и какими это?

 

maxkst, посмотрите wireshark'ом не "долбится ли" кто "левый" в SNMP?

6.37.1 - CCR1009-8G-1S (терминация PPPoE+QOS) 4-е штуки проблемы такой не испытываем.

Share this post


Link to post
Share on other sites

Saab95

Нет слов... Если увеличиваются задержки - это уже пздц, это уже надо срочно закупать оборудование. Но оно же не 10тыр стоит (даже микротик), заранее надо планировать. Поэтому важно видеть текущую загрузку, как влияет увеличение абонентов

Share this post


Link to post
Share on other sites

SNMP устаревший протокол

 

MikroTik - это устаревшая фигня :)

 

зачем мониторить аптайм, загрузку процессора и прочую не нужную информацию?

 

Конечно, лучше узнать о проблеме по-факту :) Руководство вызывает админа и спрашивает: Почему мы были не готовы к проблеме и вынуждены сейчас в спешке закупать новое оборудование? Админ: Потому что это - устаревший подход, узнавать о проблеме заранее, дело то житейское!

Edited by tartila

Share this post


Link to post
Share on other sites

Уже в который раз всё понемногу накапливающееся ощущение, что превзойти себя Saab95 уже не сможет, вдребезги разбивается об очередную лопату говна на вентидяторой ковш карьерного экскаватора с известной субстанцией, сброшенный на реактивную струю аэробуса. Не удивил, но реноме подтверждает регулярно.

Share this post


Link to post
Share on other sites

Проблема частично решена отказом от использования SNMP. Сейчас получаем статистику непосредственно от RouterOS. Графики загрузки какналов стали значительно ровнее, без провалов. Ищем способ собирать таким же способом статистику с кастомных OID

 

посмотрите wireshark'ом не "долбится ли" кто "левый" в SNMP?

Ну такое и без wireshark видно на фаерволе.

6.37.1 - CCR1009-8G-1S (терминация PPPoE+QOS) 4-е штуки проблемы такой не испытываем.

Какая в среднем у вас нагрузка на CPU и интерфейсы?

 

зачем мониторить аптайм, загрузку процессора и прочую не нужную информацию? Какой смысл это несет?

Мы стараемся заранее заказать более мощное оборудование для замены, или для распределения нагрузки на другое железо.

Share this post


Link to post
Share on other sites

Нет слов... Если увеличиваются задержки - это уже пздц, это уже надо срочно закупать оборудование. Но оно же не 10тыр стоит (даже микротик), заранее надо планировать. Поэтому важно видеть текущую загрузку, как влияет увеличение абонентов

 

Вообще каждое оборудование имеет пределы производительности. Если вести разговор про CCR1009, то даже с натом и шейперами он выдает гиг сквозного трафика, до этого момента в процессор не упирается. Следовательно какой смысл нагрузку на него мониторить?

Share this post


Link to post
Share on other sites

Какая в среднем у вас нагрузка на CPU и интерфейсы?

9 ядер - средняя 47%

магистральный линк - 400Мбит/с

к абонентам 4 линка 100Мбит/с - средняя 80Мбит/с на линк

Share this post


Link to post
Share on other sites

SNMP устаревший протокол. Если используете микротик, то всю информацию с него надо получать другими способами, которые не нагружают оборудование.

 

И с другой стороны, если у вас это роутер или маршрутизатор, который пропускает некий трафик, то зачем мониторить аптайм, загрузку процессора и прочую не нужную информацию? Какой смысл это несет? Если будет упираться в производительность, то увеличение задержки (пинга) сообщит о проблеме.

Сразу видно прогрессивного человека в толпе консерваторов. Поддерживаю полностью, SNMP устарел и не соответсвует современным реалиям

Сааб явно понимает о чем говорит, а для остальных есть вот такая презенташка:

http://ix.br/pttforum/9/slides/ixbr9-telemetry.pdf

 

Телеметрия - вот он современный стандарт, решает проблемы устаревшего SNMP.

 

Сааб, я пытался донести твои слова до руководства, но меня не поняли, мне сказали, если я не хочу мониторить железки то и не надо, а коммерческому департаменту нужно для рассчетов окупаемости инфу сколько пользователей пользуются нашими хотспотами. Т.к. ты явно знаешь микротики лучше меня, подскажи как я могу их настроить, чтобы они раз в минуту отправляли телеметрическую информацию о количестве активных юзеров на наших микротиковских хотспотах? Ну и заодно счетчики трафика с интерфейса, мы к сожалению не магистральный провайдер и доступ к интернет приходится покупать поэотму количество трафика на порту интересует чтобы обнаруживать перегрузку по шейперу и заказывать расширение.

Share this post


Link to post
Share on other sites

Вообще если у вас микротик то установите The DUDE версии 4 бета. Добавьте туда ваши хотспоты и нарисуйте график связи по потребленному трафику.

 

Далее в дуде добавьте функцию, в которой укажите - ros_command("/ip hotspot active print count-only") и для нее в probes добавьте новую запись функция с параметрами hotspot_clients(), if(hotspot_clients(), "", ""), hotspot_clients()

 

После добавляете ее дополнительной службой на устройство и все готово.

Share this post


Link to post
Share on other sites

ЕМНИП The Dude по snmp и ходит за данными.

 

Нет, на микротики она ходит по своему протоколу. При настройке дуды SNMP нужно принудительно отключать, т.к. при количестве устройств более 1000 это существенно увеличивает нагрузку, т.к. программа на каждый заведенный адрес отправляет запросы, которые оборудование не обрабатывает.

Посмотрите в торче что и как передается=)

Share this post


Link to post
Share on other sites

SNMP устаревший протокол

 

зачем мониторить аптайм, загрузку процессора и прочую не нужную информацию?

 

Saab95, ох и тяжкий же у тебя крест

Share this post


Link to post
Share on other sites

магистральный линк - 400Мбит/с

При таком трафике и у нас затыков SNMP не бывает. Они начинаются после 500Мбит/с и становятся чаще после 700Мбит/с. При этом нативная RouterOS статистика снимается с интерфейсов без проблем при любых нагрузках. Итог - частично уходим от SNMP

Share this post


Link to post
Share on other sites

Почему мы были не готовы к проблеме и вынуждены сейчас в спешке закупать новое оборудование? Админ: Потому что это - устаревший подход, узнавать о проблеме заранее, дело то житейское!

Ну почему же не готовы. Цены на MT вполне позволяют держать приличный запас оборудования на складе.

Share this post


Link to post
Share on other sites

кое при случае меняется на тазик

Ну можно конечно, но как правило либо портов маловато, либо габариты великоваты, либо прожорлив... Хотя дело вкуса. Я например однажды установил RouterOS на бесплатный DELL сервак с 8 ядрами XEON и 16 гигами оперативки. Так просто, поглядеть... так и остался он в продакшне...

Share this post


Link to post
Share on other sites

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.

Guest
Reply to this topic...

×   Pasted as rich text.   Paste as plain text instead

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.