Jump to content
Калькуляторы

Вопрос по системам мониторинга

Кто пользовался системами мониторинга (Zabbix, Cacti, Zenoss, The Dude), есть такие вопросы:

1. Возможность использоваия плагинов в каждой системе (например, в Nagios у меня стоит собственный модуль оповещения, хотел бы знать, можно ли что-то подобное использовать в перечисленных системах)

2. Возможность обработки SNMP Trap

3. Можно ли при построении карты сети использовать загружать собственные картинки, фон и т.п. В Zenoss, знаю, есть интеграция с гугл мапс, но это совсем не то.

4. Возможность работы как через агента, так и без него

 

Сам работаю с Nagios, но мне сейчас нужно знать возможности этих систем

Share this post


Link to post
Share on other sites

Кто пользовался системами мониторинга (Zabbix, Cacti, Zenoss, The Dude), есть такие вопросы:

1. Возможность использоваия плагинов в каждой системе (например, в Nagios у меня стоит собственный модуль оповещения, хотел бы знать, можно ли что-то подобное использовать в перечисленных системах)

2. Возможность обработки SNMP Trap

3. Можно ли при построении карты сети использовать загружать собственные картинки, фон и т.п. В Zenoss, знаю, есть интеграция с гугл мапс, но это совсем не то.

4. Возможность работы как через агента, так и без него

 

Сам работаю с Nagios, но мне сейчас нужно знать возможности этих систем

 

Имею опыт работы с Заббикс, в теме по системам отписывал подробнее.

Да, все умеет, что хотите. Плагины - внешние скрипты.

Есть ряд вкусных плюшек, такие как API (управление через программный интерфейс - я добавляю/удаляю хосты программно, сразу в нужном шаблоне), LLD (определение сущностей, типа интерфейсов, и создание опрашиваемых параметров для каждой найденной сущности).

Не умеет автоматически строить карты, как Нагиос, но по опыту работы с Нагиос автоматические карты не пригодны для использования.

Можно загружать фон и свои значки для устройств, помимо стандартных, в наборе.

 

Из минусов - с 2.2 изменили структуру БД и значительно замедлили массовую отдачу последних значений по опрашиваемым параметрам. Пришлось патчить код, ибо для меня востребовано.

Share this post


Link to post
Share on other sites

Кто пользовался системами мониторинга (Zabbix, Cacti, Zenoss, The Dude), есть такие вопросы:

1. Возможность использоваия плагинов в каждой системе (например, в Nagios у меня стоит собственный модуль оповещения, хотел бы знать, можно ли что-то подобное использовать в перечисленных системах)

2. Возможность обработки SNMP Trap

3. Можно ли при построении карты сети использовать загружать собственные картинки, фон и т.п. В Zenoss, знаю, есть интеграция с гугл мапс, но это совсем не то.

4. Возможность работы как через агента, так и без него

 

Сам работаю с Nagios, но мне сейчас нужно знать возможности этих систем

Нету идеальной системы мониторинга, как правило все используют несколько.

Сам использую PRTG для мониторинга свичей и виртуальной инфраструктуры.

zabbix с его LLDP использую для сбора статистики с портов о наличии ошибок, коллизий и дропов. Про все аномалии PRTG и zabbix оповещают меня по почте. Раньше была прикрученка игрушка которая присылала смс и звонила.

Share this post


Link to post
Share on other sites

Больший интерес здесь представляет Cacti. Читал про эту систему и сложилось впечатление, что это система нужна чисто для просмотра статистики каких-либо параметров в виде графиков. В ней реализованы функции построения карты сети, как в Zabbix или в NagVis? по оповещениям, туда можно прикрутить что-то помимо e-mail и sms? Допустим у меня есть своя система оповещения, которая и картинку на экран шлет и звуковым сигналом сопровождается, могу я ее прикрутить к Cacti?

Share this post


Link to post
Share on other sites

Больший интерес здесь представляет Cacti.

Cacti это больше все-таки рисовалка графиков, чем система мониторинга.

Оповещения, триггеры, карты можно прикрутить (с помощью плагинов), но для большой сети лучше использовать Zabbix или Nagios.

Правда я использую именно Cacti, но у меня и сеть не очень большая, и мониторинг самодельный (Cacti именно для рисования графиков использую).

Share this post


Link to post
Share on other sites

Нету идеальной системы мониторинга, как правило все используют несколько.

 

Самый ужасный вариант это несколько систем. Например рисовать графики в Cacti и мониторить пинги в zabbix это очень-очень неправильно, если у вас сеть хотя бы больше 100 активных устройств под вашим управлением. zabbix умеет делать и то и то, без rrd, но это не суперкритично в самом деле.

Share this post


Link to post
Share on other sites

есть больше 100 активных железок, но графики все равно в кактусе :)

Share this post


Link to post
Share on other sites

таки не умеет :)

я надеюсь, пока, но реквестить эту фичу уже устал

Share this post


Link to post
Share on other sites

так ты же сам его и пилишь, в чём проблема туда добавить графики? или rrd это идеалогически неправильно для noc-а, а переписывать заббикс(он хранит данные в БД) на python всем лень?

Share this post


Link to post
Share on other sites

не, я на периферии трусь, так, скриптик поправить , новый скрипт написать методом аналогии с уже существующего, а с графиками нужно более глубоко влезать

на самом деле грфаки там есть, есть подсистема для сбора данных и даже хранения, rrd был объявлен некошерным, у заббикса есть какие-то проблемы, поэтому пошли своим путем и данные кладутся в монгу :)

проблема в отображении графиков и приложениях чтобы с графиками работать, фактически интерфейс пользователя и некому этим заниматься

Share this post


Link to post
Share on other sites

Нету идеальной системы мониторинга, как правило все используют несколько.

 

Самый ужасный вариант это несколько систем. Например рисовать графики в Cacti и мониторить пинги в zabbix это очень-очень неправильно, если у вас сеть хотя бы больше 100 активных устройств под вашим управлением. zabbix умеет делать и то и то, без rrd, но это не суперкритично в самом деле.

А если нет идеальной системы мониторинга??

zabbix у меня исключительно работает с ошибками на портах и работает полностью автономно без моего вмешательства.

А для всего остального у меня есть PRTG.

Share this post


Link to post
Share on other sites

Zabbix, опыт использования порядка 5ти лет, даже не знаю чего не умеет. Имея опыт написания скриптов и понимания системы можно сделать все что угодно, а чего нельзя сделать можно сделать через api, к примеру сейчас:

ДЦ, куча сетевого оборудования, свои сервера, сервера клиентов, комлексные экраны перерисовываем через api, путем выборки и формирования, уведомления, скрипты, смс. Полное использование LLD, мониторинги серверов виртуализации, в том числе полное LLD для proxmox, впереди работа с системными журналами и траперами, в общем zabbix полностью мой выбор, только к сожалению эта система требует спецефического подхода.

Share this post


Link to post
Share on other sites

Меня всегда интересовала производительность этих систем. Вот например наша самописная софтинка может каждые 5 минут опрашивать более 2к устройств и собирать около 100k параметров. А забикс сможет?

Share this post


Link to post
Share on other sites

Посмотрите, возможно вас заинтересует.

Он и не такое может вытворять при правильно подходе.

 

В догонку, http://download.yandex.ru/company/experience/rit2008/highload_lapan.pdf

заббикс очень медленная система D:

Edited by Megas

Share this post


Link to post
Share on other sites

Вот например наша самописная софтинка может каждые 5 минут опрашивать более 2к устройств и собирать около 100k параметров.

 

И куда ложит данные? на диск? mysql? mongodb? mssql?

 

Я хочу посмотреть на винт при 350 write iops

Edited by vlad11

Share this post


Link to post
Share on other sites

Вот например наша самописная софтинка может каждые 5 минут опрашивать более 2к устройств и собирать около 100k параметров.

 

И куда ложит данные? на диск? mysql? mongodb? mssql?

 

Я хочу посмотреть на винт при 350 write iops

SSD диски - легко.

Обычно, самописные системы используют RRD. Просто и объем данных фиксированный.

 

Тем не менее, 100к параметров за 5 минут - это 333 параметра в секунду.

У меня заббикс на виртуалке о 4 виртуальных ядрах и 12G RAM делал за 500 параметров в секунду с кучей внешних скриптов.

Основная проблема забикса - хранение истории и трендов в БД, что приводит к быстрому росту БД и медленному удалению старых данных, что сильно грузит БД. Решается через партиции, в сети описано подробно.

Share this post


Link to post
Share on other sites

данные на ложаться в mysql, тюнинг в mysql на большое кол-во памяти для кеша.

сейчас посмотрел 155к графиков. примено 10% опрашивается раз в минуту, 5-8% раз в 15 минут, остальные раз в 5 минут.

Работает это все на какой-то старенькой машинке:

Intel(R) Xeon(R) CPU 3040  @ 1.86GHz / 4Gb RAM
Cpu0  : 26.4%us,  5.3%sy,  0.0%ni, 68.0%id,  0.3%wa,  0.0%hi,  0.0%si,  0.0%st
Cpu1  : 32.0%us,  8.9%sy,  0.0%ni, 54.8%id,  0.0%wa,  0.0%hi,  4.3%si,  0.0%st
Mem:   3607348k total,  3292212k used,   315136k free,    47160k buffers
Swap:  8388600k total,    57876k used,  8330724k free,  2288368k cached

 

для забикса (не говоря уже о других) пришлось бы ставить как минимум 2-3 сервера.

 

Но опять же, буду смотреть в сторону Забикса, потому-что надоело постоянно что-то дописывать в системе мониторинга и оповещения

Share this post


Link to post
Share on other sites

 

для забикса (не говоря уже о других) пришлось бы ставить как минимум 2-3 сервера.

 

Но опять же, буду смотреть в сторону Забикса, потому-что надоело постоянно что-то дописывать в системе мониторинга и оповещения

 

Сказки про 2-3 сервера, реальные сказки, забикс переварит это и не подавится. Да, проблемы есть только если вам требуются хранение данных за безумно длинный промежуток, но смысл в этом? в базовом варианте хватает хранения за 2 недели, выше головы, обычных пара сата винтов справляется без проблем. Для снижения нагрузки ставится zabbix proxy, и уже через него идет работа, при чем прокси можно держать в виртуалке, там уже используются оптимизированные алгоритмы и прокси скидывает данные на сервер порциями в отличии от прямого общения с сервером, что значительно снижает нагрузки. В общем кто хочет тот разберется, просто не надо городить огород и делать лишнего, заба система очень сильная, к стати исходники на C на сколько вижу, не каких ипанутых ++ и прочей лабуды.

Share this post


Link to post
Share on other sites

Create an account or sign in to comment

You need to be a member in order to leave a comment

Create an account

Sign up for a new account in our community. It's easy!

Register a new account

Sign in

Already have an account? Sign in here.

Sign In Now
Sign in to follow this