Перейти к содержимому
Калькуляторы
Ваша система мониторинга  

1405 пользователей проголосовало

  1. 1. Ваша система мониторинга

    • Zabbix (zabbix.com)
      473
    • Nagios (nagios.org)
      322
    • MRTG (oss.oetiker.ch/mrtg/)
      182
    • Cacti (cacti.net)
      490
    • TclMon (tclmon.sourceforge.net)
      3
    • RRDtool (oss.oetiker.ch/rrdtool/)
      65
    • Zenoss (zenoss.com)
      21
    • OpenNMS (opennms.org)
      7
    • PRTG Network Monitor (www.paessler.com/prtg/)
      54
    • Munin (munin-monitoring.org)
      25
    • Argus (argus.tcp4me.com)
      3
    • Friendly Pinger (kilievich.com/rus/fpinger/)
      51
    • Ping, traceroute
      129
    • Нафиг нужно:)
      32
    • NetXMS netxms.org
      12
    • The Dude (mikrotik.com/dude/)
      208
    • Самописная система мониторинга
      122
    • Monit (mmonit.com/monit/)
      23
    • Ganglia (ganglia.info)
      1
    • Другая система
      84


Полный мониторинг сети. Кто как мониторит свою сеть.....

часть коллег упорно продвигает Zabbix, решил посмотреть.

 

Насколько я понял, напрямую нельзя настроить Zabbix так, чтобы хранить только изменения состояний, а не каждое значение.

Теоретически как изменения можно хранить историю triggers или events, дропая items. Посмотрел в housekeeper и не нашёл разделения items/triggers/events. Оно существует? Или чтобы хранить только изменения надо делать костыль в виде "на всё что надо вызываем Action-скрипт и пишем лог событий в файл/базу", а остальное постоянно чистим housekeeper'ом?

Да, хранить только изменение состояний в истории - нельзя.

История у заббикса - это именно все полученные значения по параметру, как они есть.

 

Events - суть история изменения триггеров. То есть если вы хотите хранить только историю изменений, да, вам нужно настроить триггер на изменения и тогда все изменения будут падать в events.

Правила хаускипера для events-ов и для history/trends различны. Для триггеров нет хаускипера, потому что это текущее состояние, история не ведется.

 

 

Небольшое исторической отступление:

Когда-то давно для параметров, где история не нужна вообще, я ставил срок хранения значения параметра 0, и все было отлично, параметр вообще не хранился, но триггер отрабатывал и в события складывал. Потом Заббикс переработал работу с историей, и этот механизм поломали, при нулевой истории триггеры на изменения работать перестали. Я им поднимал проблему, они её решили традиционно - документированный баг - это фича.

https://www.zabbix.com/documentation/3.2/manual/config/triggers/expression

"Triggers only evaluate history information. If history is not available (especially relevant for time shift), trend information is not used, thus history must be kept for at least the period trigger functions expect it."

С одной стороны - да, логично. С другой стороны, я хочу ловит, например, смену серийного номера модуля, поближе к моменту этой самой смены, то есть опросы частые. И мне не нужны в истории тысячи одинаковых значений. И тут, вроде бы, что проще - ставь один день хранения и все хорошо. Но, если переходит на приличный объем, и партирование таблиц истории, сразу все сложнее.

Для своей задачи я патчил забикс 2.2, чтоб вернуть прежнее поведение. :).

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Дискаверить-то дискаверит, full-text search по найденным IfAlias не работает.

Это в каком смысле? И в какой версии?

Вы хотите фильтровать по ним? Или что?

 

В 3.0.3 пофиксили проблемы с кодировками в LLD, если у вас была проблема с этим.

 

uxcr хочет что бы написав в поле поиске description порта появилась возможность перейти на нужный коммутатор\порт-график.

http://www.librenms.org/ у этих ребят есть почти всё что нужно, но нормальную карту там сделать нельзя

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Дискаверить-то дискаверит, full-text search по найденным IfAlias не работает.

Это в каком смысле? И в какой версии?

Вы хотите фильтровать по ним? Или что?

 

В 3.0.3 пофиксили проблемы с кодировками в LLD, если у вас была проблема с этим.

 

uxcr хочет что бы написав в поле поиске description порта появилась возможность перейти на нужный коммутатор\порт-график.

http://www.librenms.org/ у этих ребят есть почти всё что нужно, но нормальную карту там сделать нельзя

Что-то посмотрел бегло я на эту штуку, похоже, сколь-нибудь нагрузку оно не потянет.

Графики в rrd - это хорошо, но у меня есть сомнения насчет отработки хотя бы 100К параметров на этой поделке.

Офисную сеть на 10 роутеров, 100 интерфейсов разложить - наверно пойдет.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Мужики! Помогите кликабельность мониторингу добавить. Скажем в The Dude я уже получил почти все, что мне нужно, но вот кликнул бы я по объекту или правой бы клавишей сабменю открыл-выбрал пункт, и мой скрипт или батник, что бы запустился и выполнился. Куда идти? Или Кактусом? Заббиксом?

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Пользуюсь (zabbix+yandex-map) на (postgres+партиционинг) использую внешние скрипты мониторинга для бесперебойников. Считаю лучшей системой для мониторинга, очень много возможностей. Обязательно с партиционингом иначе диск погибнет при delete where date<>(housekeeping) при большом количестве узлов;

В другом городе cactus+nagios+mrtg, просто так исторически сложилось, моё мнение что системы морально устарели.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Пользуюсь (zabbix+yandex-map) на (postgres+партиционинг) использую внешние скрипты мониторинга для бесперебойников. Считаю лучшей системой для мониторинга, очень много возможностей. Обязательно с партиционингом иначе диск погибнет при delete where date<>(housekeeping) при большом количестве узлов;

В другом городе cactus+nagios+mrtg, просто так исторически сложилось, моё мнение что системы морально устарели.

Заббикс умирает на delete ... where itemid=xxx and clock < yyy.

Если item-ов много тысяч, а то и миллионы - он ожидаемо умирает от таких запросов в таблице на много-много миллионов строк.

 

В новом заббиксе в настойках можно сказать, чтоб для всей истории одинаковое время хранения, и тогда delete ... where clock < yyy и это работает сильно быстрее. Хотя, все равно, довольно тяжко и все плюсы раздельного хранения истории пропадают.

Поэтому, если хватает квалификации, да, сразу partitioning.

 

 

Но безусловно рекомендовать заббикс для начинающих я бы не стал, требуется время, чтоб с ним разобраться.

Если человек готов разбираться - да, сделать на нем можно очень многое, и API позволяет добавлять хосты в мониторинг из скриптов, без лишних сложностей.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Так я же и писал что нужен партиционинг, тогда таблицы создаются на каждый день и удаляются целиком нет ни каких delete where date<>. https://www.zabbix.org/wiki/Docs/howto/zabbix2_postgresql_autopartitioning

С забиксом сложного ни чего нет, по мне так очень логичный и понятный. А вот перелезть потом на него будет сложновато.

Всеми "плюшками" можно заморочиться потом.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Мужики! Помогите кликабельность мониторингу добавить. Скажем в The Dude я уже получил почти все, что мне нужно, но вот кликнул бы я по объекту или правой бы клавишей сабменю открыл-выбрал пункт, и мой скрипт или батник, что бы запустился и выполнился. Куда идти? Или Кактусом? Заббиксом?

 

В Dude есть такая возможность, посмотрите в сторону «Tools»

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

В Dude есть такая возможность, посмотрите в сторону «Tools»

редактировать тулзы!!! спасибоооо!!!!!!

 

И ещё.. не смог включить отображение цифрой результата измерения, прямо на иконке.

Как это делается ?

Не получается почему-то у меня как в этом примере тыц Может есть ещё подобные примеры?

Изменено пользователем alexnasa

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

10 LAN State Pro используем для общего мониторинга.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Коллеги, если в разрезе сабжевого вопроса надо не просто нарисовать графики, а еще и проверять доступность (живой/неживой) свичей, серверов и т.п.? У меня сейчас стоит mon , который по списку раз в 15 минут пингует мониторируемые железки и если те не отвечают, то шлет СМС/e-mail (графики рисуются отдельно mrtg). Но есть пара стареньких серверов, которые при выполнении ресурсоемких задач типа бэкапа и его слива на другие сервера, настолько загружены, что на пинги не отвечают. Происходят ложные срабатывания mon-а. Какие варианты используются в таких случаях?

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Коллеги, если в разрезе сабжевого вопроса надо не просто нарисовать графики, а еще и проверять доступность (живой/неживой) свичей, серверов и т.п.? У меня сейчас стоит mon , который по списку раз в 15 минут пингует мониторируемые железки и если те не отвечают, то шлет СМС/e-mail (графики рисуются отдельно mrtg). Но есть пара стареньких серверов, которые при выполнении ресурсоемких задач типа бэкапа и его слива на другие сервера, настолько загружены, что на пинги не отвечают. Происходят ложные срабатывания mon-а. Какие варианты используются в таких случаях?

а сам-то что думаешь?

надо ввести еще критерии оценки работоспособности сервера.

Изменено пользователем rover-lt

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

надо ввести еще критерии оценки работоспособности сервера.

Спасибо, кэп! :)

Какие например?

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Происходят ложные срабатывания mon-а. Какие варианты используются в таких случаях?

Изменить настройки оповещений. Например, после первой неудачной попытки продолжать пинговать через определенные промежутки времени и оповещать только после N-ой попытки, какую вы считаете критической.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Может кому пригодится, шаблон для snmptt для обработки трапов MAC-notification на длинках. У меня работает совместно с Zabbix'ом.

EVENT MacNotif .1.3.6.1.4.1.171.10.75.15.2.0.17 "Status Events" Normal
REGEX (01.(\w+).(\w+).(\w+).(\w+).(\w+).(\w+).(\w+))("Add MAC-address: ".uc($2)."-".uc($3)."-".uc($4)."-".uc($5)."-".uc($6)."-".uc($7)." on port $1")ei
REGEX (02.(\w+).(\w+).(\w+).(\w+).(\w+).(\w+).(\w+))("Remove MAC-address: ".uc($2)."-".uc($3)."-".uc($4)."-".uc($5)."-".uc($6)."-".uc($7)." on port $1")ei
REGEX (03.(\w+).(\w+).(\w+).(\w+).(\w+).(\w+).(\w+))("Move MAC-address: ".uc($2)."-".uc($3)."-".uc($4)."-".uc($5)."-".uc($6)."-".uc($7)." on port $1")ei
FORMAT ZBXTRAP $aA $1
SDESC
For DES-1210-28ME B2
EDESK
#
EVENT MacNotif .1.3.6.1.4.1.171.11.63.6.2.20.0.2 "Status Events" Normal
REGEX (01 (\w+)\s+(\w+)\s+(\w+)\s+(\w+)\s+(\w+)\s+(\w+) 00 (\w+) 00)("Add MAC-address: $1-$2-$3-$4-$5-$6 on port ".hex($7))ei
REGEX (02 (\w+)\s+(\w+)\s+(\w+)\s+(\w+)\s+(\w+)\s+(\w+) 00 (\w+) 00)("Remove MAC-address: $1-$2-$3-$4-$5-$6 on port ".hex($7))ei
REGEX (03 (\w+)\s+(\w+)\s+(\w+)\s+(\w+)\s+(\w+)\s+(\w+) 00 (\w+) 00)("Move MAC-address: $1-$2-$3-$4-$5-$6 on port ".hex($7))ei
FORMAT ZBXTRAP $aA $1
SDESC
For DES-3028
EDESK
#
EVENT MacNotif .1.3.6.1.4.1.171.11.64.1.2.15.0.3 "Status Events" Normal
REGEX (01 (\w+)\s+(\w+)\s+(\w+)\s+(\w+)\s+(\w+)\s+(\w+) 00 01 00 (\w+) 00)("Add MAC-address: $1-$2-$3-$4-$5-$6 on port ".hex($7))ei
REGEX (02 (\w+)\s+(\w+)\s+(\w+)\s+(\w+)\s+(\w+)\s+(\w+) 00 01 00 (\w+) 00)("Remove MAC-address: $1-$2-$3-$4-$5-$6 on port ".hex($7))ei
REGEX (03 (\w+)\s+(\w+)\s+(\w+)\s+(\w+)\s+(\w+)\s+(\w+) 00 01 00 (\w+) 00)("Move MAC-address: $1-$2-$3-$4-$5-$6 on port ".hex($7))ei
FORMAT ZBXTRAP $aA $1
SDESC
For DES-3526
EDESK
#
EVENT MacNotif .1.3.6.1.4.1.171.11.63.3.2.100.1.0.1 "Status Events" Normal
REGEX (01 (\w+)\s+(\w+)\s+(\w+)\s+(\w+)\s+(\w+)\s+(\w+) 00 (\w+) 00)("Add MAC-address: $1-$2-$3-$4-$5-$6 on port ".hex($7))ei
REGEX (02 (\w+)\s+(\w+)\s+(\w+)\s+(\w+)\s+(\w+)\s+(\w+) 00 (\w+) 00)("Remove MAC-address: $1-$2-$3-$4-$5-$6 on port ".hex($7))ei
REGEX (03 (\w+)\s+(\w+)\s+(\w+)\s+(\w+)\s+(\w+)\s+(\w+) 00 (\w+) 00)("Move MAC-address: $1-$2-$3-$4-$5-$6 on port ".hex($7))ei
FORMAT ZBXTRAP $aA $1
SDESC
For DES-3026
EDESK
#

 

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Использую:

 

Nagios+snmptt+Nagvis для активных проверок, сборки трапов и отображения карты сети

Logstash - сборка логов с сетевого железа, а так же netflow c последующим экспортом в Elastic Search

Collectd - сборка по SNMP статистики сетевых интерфейсов и т.п. с последующим экспортом в InfluxDB

Grafana - для красивого и удобного отображения различной статистики (логи, netflow, загрузка интерфейсов). Источники данных ES и Influx

 

 

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Добрый день. 

Dude(6.36) установили на сервак около месяца назад. Создали карты, завели устройства (в основном коммутаторы, порядка 200 железок).

Все красиво, устройства доступны, снимается нагрузка на транковых интерфейсах... Все ок, за исключением одного момента:

При включении SNMP в Dude для устройства, скажем для коммутатора, пинги до него взлетают с 5 Мс до 300 - 400Мс.

Так же вырастает нагрузка на CPU с 20% до 80% (Проверяли на Eltex3124F и Cisco 3560G - параллельно снимается загрузка по CPU в Zabbixe).    

Как только выставляешь default профиль snmp в Dude для коммутатора (на коммутаторе этого профиля нет) - проблема исчезает.

Probe Count стоят дефолтные.

Может кто сталкивался с проблемой и как решилась? 

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Доброго дня! Можете поделится шаблоном zabbix для eltex ltp 4x rev c и ltp 8x rev c?

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

В 27.10.2016 в 14:44, Ancient сказал:

http://www.librenms.org/ у этих ребят есть почти всё что нужно

Как ни странно, проект развивается. Есть опыт использования?

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Nagios + Cacti

Изменено пользователем neperpbl3

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.

Гость
Ответить в тему...

×   Вставлено в виде отформатированного текста.   Вставить в виде обычного текста

  Разрешено не более 75 смайлов.

×   Ваша ссылка была автоматически встроена.   Отобразить как ссылку

×   Ваш предыдущий контент был восстановлен.   Очистить редактор

×   Вы не можете вставить изображения напрямую. Загрузите или вставьте изображения по ссылке.