Jump to content
Калькуляторы

Вопрос по системе мониторинга

Задумался наконец о внедрении системы мониторинга сети и оборудования.

Сейчас в качестве мониторинга используется:

- Cacti, который мониторит и рисует графики с основных инфраструктурных устройств в ядре (в основном трафик на портах);

- UserSide, в котором заполнена модель сети (список устройств и схема соединений);

- самописный скрипт, который пингует все активное оборудование (список устройств и схема соединений задаются в давно не обновляемом XML-файле, остальные данные подтягиваются из базы данных UserSide);

 

Планирую все переводить на Zabbix, причем с детальным мониторингом всего и вся, для этого подготовлен достаточно производительный сервер.

Но есть некоторые моменты, которые мне еще непонятны.

1. Где держать модель сети? Сейчас модель держится в UserSide. Если дублировать ее в Zabbix, то это двойной объем работ и неизбежные расхождения/ошибки. Можно ли настроить Zabbix таким образом, чтобы список устройств брать с внешней БД (с UserSide)?

2. Мне очень нравится RRD. Понятно, что часть данных Zabbix будет хранить в обычной реляционной БД, но очень существенный объем данных (по моим прикидкам гигабайты в месяц) нет никакого резона хранить дольше, чем пару месяцев и для них кольцевая БД идеальна. Можно ли приспособить Zabbix к RRD?

3. Графики Zabbix мне не нравятся, они некрасивые и неудобные. Можно ли прикрутить к Zabbix свою рисовалку графиков? Zabbix Custom Graphs это немного не то.

Share this post


Link to post
Share on other sites

3 часа назад, alibek сказал:

Можно ли настроить Zabbix таким образом, чтобы список устройств брать с внешней БД (с UserSide)?

Наверняка можно делать периодический импорт скриптами.

 

3 часа назад, alibek сказал:

Графики Zabbix мне не нравятся, они некрасивые и неудобные.

Там определенно должны быть какие-то настройки.

 

Share this post


Link to post
Share on other sites

Ну графану можно прикрутить для красивых метрик и графиков, только надо ли оно? Время хранения данных в заббиксе также очень гибко настраивается.

Для хранения всего и вся юзайте сразу партицирование и желательно ssd

Share this post


Link to post
Share on other sites

2 часа назад, alibek сказал:

Альтернатив ему особо и нет.

Nagios куда неудобнее.

А по топ-посту именно Nagios и подходит.

Share this post


Link to post
Share on other sites

А почему такое мнение?

Я тщательно обе системы не изучал, просто немного погонял в виртуалке.

И у меня сложилось впечатление, что Nagios больше подходит для мониторинга сервисов или какой-то более-менее постоянной системы.

А для большой масштабируемой сети Zabbix удобнее и архитектурно больше подходит.

Share this post


Link to post
Share on other sites

1 час назад, alibek сказал:

А почему такое мнение?

Потому, что именно он у нас на сети и прижился. Требования были изначальные более-менее теже.

 

А теперь оно разве что за пирожками не бегает. :-)

Share this post


Link to post
Share on other sites

23 часа назад, alibek сказал:

1. Где держать модель сети? Сейчас модель держится в UserSide. Если дублировать ее в Zabbix, то это двойной объем работ и неизбежные расхождения/ошибки. Можно ли настроить Zabbix таким образом, чтобы список устройств брать с внешней БД (с UserSide)?

В zabbix есть API, у себя мы держим базу оборудования в биллинге, импорт/экспорт данных об оборудовании осуществляется через API

23 часа назад, alibek сказал:

2. Мне очень нравится RRD. Понятно, что часть данных Zabbix будет хранить в обычной реляционной БД, но очень существенный объем данных (по моим прикидкам гигабайты в месяц) нет никакого резона хранить дольше, чем пару месяцев и для них кольцевая БД идеальна. Можно ли приспособить Zabbix к RRD?

zabbix не умеет RRD, но есть куча других способов облегчить БД и уменьшить нагрузку, TimescaleDB, clickhouse

23 часа назад, alibek сказал:

3. Графики Zabbix мне не нравятся, они некрасивые и неудобные. Можно ли прикрутить к Zabbix свою рисовалку графиков? Zabbix Custom Graphs это немного не то.

В версии 4,2 они перешли на java графики. Но если вам прям пи*дец какой красоты хочется, прикручивайте графану, делается это за 5 минут.

Share this post


Link to post
Share on other sites

В 18.05.2019 в 22:40, snvoronkov сказал:

Потому, что именно он у нас на сети и прижился.

Прижился или выбрали?

Я сейчас второй день на виртуальной машине Zabbix и Nagios смотрю.

С Zabbix все более-менее стандартно.

А вот Nagios просто оторопь вызывает. Некоторую самобытность при установке из исходников я заметил, но это в конце концов дело привычки и традиций. Но видеть в готовом продукте (причем коробочном и коммерческом) CGI и смешанную кашу из PHP и HTML по нынешним временам довольно странно. Да и подход к написанию плагинов тоже не очень удобен.

Я вот сейчас сравниваю Zabbix и Nagios и лично для себя не вижу преимуществ у последнего. Может быть я что-то упускаю?

 

В 19.05.2019 в 10:28, FATHER_FBI сказал:

Но если вам прям пи*дец какой красоты хочется, прикручивайте графану, делается это за 5 минут.

Люблю красивые графики, у меня к ним слабость.

Но помимо красоты я имел ввиду и совмещение на одном графике нескольких разных источников данных.

В cacti/rrdtool если чуть повозиться, графики можно сделать очень информативными.

Share this post


Link to post
Share on other sites

2 часа назад, alibek сказал:

А вот Nagios просто оторопь вызывает. Некоторую самобытность при установке из исходников я заметил, но это в конце концов дело привычки и традиций. Но видеть в готовом продукте (причем коробочном и коммерческом) CGI и смешанную кашу из PHP и HTML по нынешним временам довольно странно. Да и подход к написанию плагинов тоже не очень удобен.

Nagios Core. Никаких коробок/коммерции. Никакой мешанины. Пыха тоже не обнаружено особо.

 

Плагины для мониторинга хоть на и-го-го пишите, хоть на змеюке или верблюде. Никто не запрещает. Для эстетов есть библиотека готовых. Это простой вызов сторонней программы в большинстве случаев с описаными аргументами и возвратом.

 

Мне, например, не понравился имеющийся мониторинг Arp. Накостылял свой за полчаса, включая время на разобраться с snmp выгрузкой.

Share this post


Link to post
Share on other sites

https://github.com/xcme/briseis

+

https://rascal.su/blog/2017/09/25/настраиваем-graphite-с-хранилищем-метрик-в-clickhouse/

+

https://grafana.com/

 

На массовые однотипные коммутаторы - более чем. Работает быстро, внимания особо не требует. Места - за счет кликхауса ест немного. 

 

Для остального заббикс.

 

а! из us api в БД каждый час ссыпается список свичей. 

В БД brieseis берет что мониторить. 

 

Можно настроить чтобы brieses брал напрямую из БД юзерсайда. 

 

 

 

 

Share this post


Link to post
Share on other sites

1)

в Zabbix'е до сих пор нету Host based dependencies

https://support.zabbix.com/browse/ZBXNEXT-46

 

Для некоторых, которые видели другие системы мониторинга, это может быть неприятным открытием

 

Вроде как в 5.0 собираются сделать (есть в roadmap), после угроз оплатить фичу

 

А сейчас из коробки - это тонны писем "сломалось/починилось"

 

2) лично мне нравятся графики загрузки, где по оси (Y) - загрузка в порт, а по оси (-Y ) - отдача из порта.

В Zabbix'е, кто так пытается делать (костылить), потом я вижу жалуются что у них что-то разъезжается

 

3) нету возможности оперативно "показать несколько графиков на одной странице", так чтобы они были 1) на одной странице 2) отдельными картинками

Есть только stacked graphs, которое не то; и Screens, которые долго и не то

Эта фишка очень полезна для оперативного изучения аномалий по трафику. А её нет.

https://support.zabbix.com/browse/ZBX-10589

 

4) Плохая страница поиска и группировки оборудования (Inventory), бывает гораздо лучше

 

Из плюсов - большое коммунити в СНГ, есть telegram канал, где мне даже отвечали на простые вопросы.

В других NMS - другие проблемы :)

Share this post


Link to post
Share on other sites

36 минут назад, alex39x сказал:

Для настройки nagios есть nagiosql.  Плюс nagios - настроил и забыл. Работает как часы. Zabbix - БД со всеми вытекающими. 

Что такого странного в БД Заббикса?

Share this post


Link to post
Share on other sites

 У активно растущих баз есть некоторые моменты, которые нужно учитывать. Но у меня и так есть несколько баз, ещё одна погоды не делает.

Я убедился, что Nagios это не мое, не нравится он мне ни архитектурой, ни подходом. А вот Zabbix пока что нравится.

Share this post


Link to post
Share on other sites

 А можно философский вопрос ? Набуя система глобального мониторинга всего и всея, если у меня нет возможности держать круглосуточно ремонтников(смысла нету, ночью на домовые узлы всё равно доступа нету) Достаточно мониторить ядро и районные линки(но они и так в кольце) Сэкономить на умном админе не получится, любые данные надо правильно понять.... Трапы и алерты о критических событиях и так приходят, так зачем надрывать себе сердце, понадеявшись на логику системы мониторинга , если ничего не сделать ? Ну только резервирование каналов и сервисов может помочь, а не разглядывание красивых графиков и читание смсок. Кстати, с смсками у меня не айс, через gsm-gate с корпоративным тарифом от яйцеголовых ходят через раз (статус -не отправлено)

Share this post


Link to post
Share on other sites

4 часа назад, YuryD сказал:

корпоративным тарифом от яйцеголовых ходят через раз

Пчел попробуйте. На них остались в итоге. Хотя связь по городу вцелом у них не ахти, но для алертов вышло в самый раз. И никаких, заметьте, революций уже давненько.

Share this post


Link to post
Share on other sites

4 часа назад, YuryD сказал:

через gsm-gate с корпоративным тарифом от яйцеголовых ходят через раз (статус -не отправлено)

смсцэ точка ру

Share this post


Link to post
Share on other sites

15 минут назад, vurd сказал:

смсцэ точка ру

Внешний сервис (от SMSC) у нас тоже есть и активно используется, но не для алертов.

Все же для алертов лучше автономное решение, так как внешние сервисы могут и не работать (как сами по себе, так и из-за аварии аплинков, например).

У нас уже несколько лет работает GSM-шлюз N2 Ateus EasyGate. За все это время было только два или три случая, когда с SMS были какие-то странности и требовалась перезагрузка шлюза. Используется для алертов, а также для обработки SMS-команд сотрудников и абонентов.

Share this post


Link to post
Share on other sites

11 часов назад, YuryD сказал:

Кстати, с смсками у меня не айс, через gsm-gate с корпоративным тарифом от яйцеголовых ходят через раз (статус -не отправлено)

Для системы мониторинга ваша сеть не является доверенным оборудованием, которое можно использовать по минимуму. Особенно для доставки критичных сообщений. Потому только аппаратный GSM-шлюз, напрямую подкюченный к серверу мониторинга. Потому как при аварии ядра, падении пограничников и отсыхании аплинков, вам ничто не испортит пикника с шашлыками, если уведомления шлются через внешний СМС-сервис.

Share this post


Link to post
Share on other sites

 Это я косноязычно выразился про гсмшлюз. Конечно он аппаратный, аналогом в миниатс смотрит, а по ком-порту я ему перловой программой смски кормлю, и увы - через раз, например 3 штуки на разные номера шлю, 1-2 доходят. Антифрод какой-то у яйцеголовых ?

Share this post


Link to post
Share on other sites

Погодите, немного не понял про "аналогом в миниАТС", у вас черех эту же железку еще и голос гоняется? Если да, то попробуйте под аварийные СМС выделить отдельную железку. Что-то мне подсказывает, что частота потерь СМС тем выше, чем активнее через нее общаются голосом.

Share this post


Link to post
Share on other sites

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.

Guest
Reply to this topic...

×   Pasted as rich text.   Paste as plain text instead

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.