Перейти к содержимому
Калькуляторы
Ваша система мониторинга  

1405 пользователей проголосовало

  1. 1. Ваша система мониторинга

    • Zabbix (zabbix.com)
      473
    • Nagios (nagios.org)
      322
    • MRTG (oss.oetiker.ch/mrtg/)
      182
    • Cacti (cacti.net)
      490
    • TclMon (tclmon.sourceforge.net)
      3
    • RRDtool (oss.oetiker.ch/rrdtool/)
      65
    • Zenoss (zenoss.com)
      21
    • OpenNMS (opennms.org)
      7
    • PRTG Network Monitor (www.paessler.com/prtg/)
      54
    • Munin (munin-monitoring.org)
      25
    • Argus (argus.tcp4me.com)
      3
    • Friendly Pinger (kilievich.com/rus/fpinger/)
      51
    • Ping, traceroute
      129
    • Нафиг нужно:)
      32
    • NetXMS netxms.org
      12
    • The Dude (mikrotik.com/dude/)
      208
    • Самописная система мониторинга
      122
    • Monit (mmonit.com/monit/)
      23
    • Ganglia (ganglia.info)
      1
    • Другая система
      84


Полный мониторинг сети. Кто как мониторит свою сеть.....

Уже около года используем как вторичный мониторинг Centreon. Жаль что о нем у нас мало кто значет. Форк Nagios, но со своим движком. Очень удобный и функциональный. Много плюшек. Советую погонять на досуге. Скриншоты можно найти в сети, есть готовый образ для развертывания.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

есть к заббиксу дополнения с интерактивной картой, хоть гугл, хоть яндекс.

Единственный минус заббикса - пожиратель ресурсов.

Он жрет ресурсы, если параметров много, а хаускипер стоит по дефолту. Есть такая беда. Но есть и решения.

Все остальное - очень экономно к ресурсам.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Не успел в прошлый раз как следует рассказать про Centreon.

Что умеет:

- шаблоны служб

- шаблоны хостов

- графики (в том числе их катомизация)

- настраиваемые дашборды

- списки доступа пользователей

- рассылки оповещений по пользователям и группам

- Command Line API

- распределенный мониторинг

- анализ лог-файлов

- пакет плагинов на все случаи жизни

- snmp-traps

- хаускипинг БД

- ведение логов изменений конфигурации хостов и служб

- мета-службы (объединение нескольких метрик служб, например суммирование трафика на аплинках)

- расчет доступности хостов, хост-групп, служб

- выстраивание иерархии

(как вертикальной "родительский-дочерний", так и горизонтальной, например по географическому признаку)

- не требовательность к ресурсам

- все настраивается как из веб-морды, так и из командной строки

- сообщество на гитхабе

Это из бесплатного.

Отдельно ставится NagVis ждя карт.

Есть платные модули:

- бизнес-аналитика

- бакап-сервер

- партицирование БД на особо больших инсталляциях

- десткоп-агент карт

- мониторинг веб-приложений через Selenium

- техническая поддержка

- база знаний прямо в интерфейсе

(что делать если что то сломалось)

- автодискавери оборудования

 

Вроде ничего не забыл.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Он жрет ресурсы, если параметров много, а хаускипер стоит по дефолту. Есть такая беда. Но есть и решения.

Все остальное - очень экономно к ресурсам.

 

Плюсую. housekeeper на больших системах зло. Спасает партицирование таблиц.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

.... И при этом чертовски нравятся Grafana c InfluxDB. Найти б к ним какой-то нормальный snmp поллер...

Держите https://github.com/ircop/hpoller :)

 

Одна проблема - данные о хостах берет из ораклового билинга (гидра), для других датасурсов надо немного перепиливать код работы с бд под себя )

Тысячи три хостов (в основном 26-28 портов, по 4 параметра с порта - брудкаст, crc, ин/аут) при 30 потоках обходит у нас за пару минут; данные шлёт в графит

 

Модели железа, кол-во портов в них, собираемые снмп-индексы настраиваются в конфиге

 

[12.01.2016 21:40:15] Total switches count got: 3505
[12.01.2016 21:40:15] [DEBUG] Switch per worker (30 workers): 117
[12.01.2016 21:41:38] [DEBUG] Sleeping 215 sec. before next loop...

Правда, графит я поставил на tmpfs - данные некритичны, потерять при ребуте не страшно, зато писаться на фс успевают. Правда, с ним возникла другая проблема - почему-то не удаляются просроченные данные из бд графита, но это уже совсем другая история...

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Может ли кто-то сделать в заббиксе, чтобы при падении узла он отсылал сообщение на мобильный телефон?

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Может ли кто-то сделать в заббиксе, чтобы при падении узла он отсылал сообщение на мобильный телефон?

У нас админ так сделал, но:

Отсылает не zabbix, а sms шлюз, zabbix обрабатывать трапы. Можно и почтовые сообщения отправлять на смартфоны- бесплатно :)

Изменено пользователем Sonneandsky

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Может ли кто-то сделать в заббиксе, чтобы при падении узла он отсылал сообщение на мобильный телефон?

Втыкаем модем в сервер с zabbix, настраиваем smsd, настраиваем скрипт отправки смс, настраиваем действия в zabbix.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

У нас стоит старенький MC-35 на отправке SMS. Заббибкс обращается к нему напрямую через /dev/ttyS0. Со времено 2.0 так уже.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Может ли кто-то сделать в заббиксе, чтобы при падении узла он отсылал сообщение на мобильный телефон?

У нас админ так сделал, но:

Отсылает не zabbix, а sms шлюз, zabbix обрабатывать трапы. Можно и почтовые сообщения отправлять на смартфоны- бесплатно :)

Кто-то это сможет сделать не за бесплатно? Шлюз есть

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Приветствую, есть у кого нибудь шаблон бэкапа конфигов для Zabbix?

Я такое накостылял:

telnet_zabbix.JPG

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Приветствую, есть у кого нибудь шаблон бэкапа конфигов для Zabbix?

Ух ты, мне даже в голову не приходило такое делать zabbix-ом.

Присоединяюсь к вопросу.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Вы планируете конфиг хранить в базе заббикса?

Это куча лишних данных в БД, мне кажется!

Вы же должны ловить изменения, и хранить только существенно отличающиеся конфиги!

Да и неудобно работать с конфигами в БД :).

 

Я делал скрипт, который вызывался заббиксом, забирал конфиг, сравнивал с последним актуальным (за исключениям некоторых динамических строчек, кстати), в случае обновления - клал в иерархию каталогов и обновлял линк для актуального конфига, потом отдавал в забикс результат своей работы.

 

Делал это через внешний скрипт, а не телнет, но никаких проблем не было.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Господа, я тут новую вещь делаю, которая как мне кажется может оказаться крайне полезной в делах мониторинга. Нужно ваше мнение.

Так как меня задолбали всякие извращения с СМС/мессенджерами, они вообще совсем не для того были сделаны. В них например не посмотришь быстро - есть таки алерт или нет, список текущих проблем, особенно если алертов насыпало много и они дергаются туда-сюда. Плюс независимо от срочности алерта - мобилка квакнет, а иногда ночью хочется спать и некоторые проблемы могут подождать до утра.

Я пришел к немного другой концепции - андроид приложение, которое поллит раз в 5 минут определенный URL и забирает оттуда список текущих алармов в сети. Если есть аларм с высоким приоритетом - постоянно квакает (но можно поставить алерт в игнор). В ближайшее время сделаю еще пуш-нотификации, где при поступлении нового алерта будет заставлять мониторящие мобилки проверять список алертов. Сделан пока простейший функционал, т.к. для себя достаточен "минимум".

 

Ну и прицепом андроид приложение позволяет заложить намного большую гибкость (программа минимум):

1)Передавать например геолокацию алерта, и сверяя с мобилками автоматически назначать ближайшего сотрудника-бригаду на исправление.

2)Контролировать "отрабатывание" алерта бригадой, например если она вошла в зону обьекта, передавать в NOC, чтобы они начинали звонить и координировали работы.

3)Собственно можно мониторить сотрудника, если он видел алерт или нет, прога "настучит" - что он увидел, проигнорил, и пошел дальше бить баклуши. Заодно "ой батарея села" - не прокатит, центр точно знает, что резидент не мониторит и вырубил телефон, когда батареи у него было дофига процентов. Ну и если сотрудник не мониторит по какой-то причине, например нет сигнала (но прога этот факт запишет, и потом отрепортит в центр - когда именно не было сигнала), автоматически назначается другой сотрудник.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Ух ты, мне даже в голову не приходило такое делать zabbix-ом.

Присоединяюсь к вопросу.

В общем, набэкапил вчера несколько сотен конфигов.

Заббикс через телнет сливает конфиги на TFTP-сервер под виндой в виде название_узла_сети.txt, потом ручками конфиги по папочкам разношу. В принципе устраивает, но лучше для каждой модели свитча сделать отдельный элемент данных, представленный вариант выше глючит. Иногда конфиги пустые сливает.

Хочу попробовать по микротикам пройтись, но как я понял, они не умеют по TFTP конфиги сливать.

Вы планируете конфиг хранить в базе заббикса?

Вы же должны ловить изменения, и хранить только существенно отличающиеся конфиги!

Да и неудобно работать с конфигами в БД :).

Согласен, что не удобно) Я доволен тем, что хоть какие то бэкапы есть. Раз в недельку проходить по свитчам и сливать конфиги, пока все что надо)

nuclearcat, идея интересная. Мне СМС информирование не нравится тем, что это не очень информативно.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Нужно ваше мнение.

надо.

третий пункт вполне нужен, остальные мне лично нет...

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Вы планируете конфиг хранить в базе заббикса?

Вы же должны ловить изменения, и хранить только существенно отличающиеся конфиги!

Да и неудобно работать с конфигами в БД :).

Согласен, что не удобно) Я доволен тем, что хоть какие то бэкапы есть. Раз в недельку проходить по свитчам и сливать конфиги, пока все что надо)

nuclearcat, идея интересная. Мне СМС информирование не нравится тем, что это не очень информативно.

Я ходил раз в 8 часов, но хранил только измененный конфиг. Итого - есть в иерархии каталогов история изменений конфигов по железкам за полтора года :).

Нашел косяк - можно найти когда он был внесен.

Заббикс же выполнял функцию пуллера, заместо крона, и, заодно, ведет лог самих фактов изменений.

Заходишь на график, и по графику сразу видно за период времени, когда было много изменений, когда мало, а когда вообще не было.

Интересно еще агрегированную по группам по этому параметру статистику, тоже, кстати, интересно вести :).

 

Но есть нюанс - максимальный timeout 30 секунд не всегда позволяет собрать конфиг с больших железяк и успеть отдать статус обратно.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Господа, я тут новую вещь делаю, которая как мне кажется может оказаться крайне полезной в делах мониторинга. Нужно ваше мнение.

Так как меня задолбали всякие извращения с СМС/мессенджерами, они вообще совсем не для того были сделаны. В них например не посмотришь быстро - есть таки алерт или нет, список текущих проблем, особенно если алертов насыпало много и они дергаются туда-сюда. Плюс независимо от срочности алерта - мобилка квакнет, а иногда ночью хочется спать и некоторые проблемы могут подождать до утра.

Я пришел к немного другой концепции - андроид приложение, которое поллит раз в 5 минут определенный URL и забирает оттуда список текущих алармов в сети. Если есть аларм с высоким приоритетом - постоянно квакает (но можно поставить алерт в игнор). В ближайшее время сделаю еще пуш-нотификации, где при поступлении нового алерта будет заставлять мониторящие мобилки проверять список алертов. Сделан пока простейший функционал, т.к. для себя достаточен "минимум".

 

Ну и прицепом андроид приложение позволяет заложить намного большую гибкость (программа минимум):

1)Передавать например геолокацию алерта, и сверяя с мобилками автоматически назначать ближайшего сотрудника-бригаду на исправление.

2)Контролировать "отрабатывание" алерта бригадой, например если она вошла в зону обьекта, передавать в NOC, чтобы они начинали звонить и координировали работы.

3)Собственно можно мониторить сотрудника, если он видел алерт или нет, прога "настучит" - что он увидел, проигнорил, и пошел дальше бить баклуши. Заодно "ой батарея села" - не прокатит, центр точно знает, что резидент не мониторит и вырубил телефон, когда батареи у него было дофига процентов. Ну и если сотрудник не мониторит по какой-то причине, например нет сигнала (но прога этот факт запишет, и потом отрепортит в центр - когда именно не было сигнала), автоматически назначается другой сотрудник.

Если делать "для всех" - я бы предложил, в первую очередь, не привязываться к бекенду.

То есть, сделать эту софтинку с открытым api - чтобы она лазила (или принимала, не важно) на любой произвольно указанный урл, который обязан бы был отдать данные в согласованном формате (например, жсон). У нас, например, заббиксом только магистрали, аплинки и т.д. мониторятся, а тысячи свитчей - собственной шустрой пинговалкой и снмп-собиралкой :)

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Что бы настроить бэкап mikrotik через zabbix пришлось поднимать FTP сервер и использовать SSH агент заббикса. Zabbix по телнету не хочет работать с микротиками. В Items выбираем SSH-агент, прописываем логин-пароль, выбираем авторизацию по паролю.

Скрипт:

export compact file={HOST.HOST}
%
tool fetch address=0.0.0.0 src-path={HOST.HOST}.rsc user=login mode=ftp password=password dst-path={HOST.HOST}.rsc upload=yes

% - без этого символа не работает.

Бэкап делается в текстовом формате, так удобнее.

 

Скрипт для Ubiquiti (по TFTP)

tftp -l /tmp/system.cfg -r /{HOST.HOST}.cfg -p 0.0.0.0

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Если делать "для всех" - я бы предложил, в первую очередь, не привязываться к бекенду.

То есть, сделать эту софтинку с открытым api - чтобы она лазила (или принимала, не важно) на любой произвольно указанный урл, который обязан бы был отдать данные в согласованном формате (например, жсон). У нас, например, заббиксом только магистрали, аплинки и т.д. мониторятся, а тысячи свитчей - собственной шустрой пинговалкой и снмп-собиралкой :)

Я именно так и делаю, формат будет самый простой для понимания.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Zabbix по телнету не хочет работать с микротиками

Это политическая профанация: микротик делается латвийцами латышского происхождения, заббикс - русского.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Вышел релиз Zabbix 3.0, и есть мнение, что проблемы остались старые.

Марафет немного навели.

new_interface.png

Изменено пользователем Dimka88

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Вышел релиз Zabbix 3.0, и есть мнение, что проблемы остались старые.

Марафет немного навели.

По бетте какой-то смотрел. Да, проблемы старые.

Из интересных фич - добавили создание группы элементов (application) из LLD, то есть, например, на свой интерфейс можно сделать свою группу. Но ценность этого несколько сомнительна.

Писали, что сделали юзерские карты или экраны, то есть перенесли их из меню настроек.

И добавили предсказательные функции, которые можно использовать для оценки отклонений от baseline.

 

Но, в целом, методы решения проблем более-менее известны, а производительность системы меня вполне устраивает.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.

Гость
Ответить в тему...

×   Вставлено в виде отформатированного текста.   Вставить в виде обычного текста

  Разрешено не более 75 смайлов.

×   Ваша ссылка была автоматически встроена.   Отобразить как ссылку

×   Ваш предыдущий контент был восстановлен.   Очистить редактор

×   Вы не можете вставить изображения напрямую. Загрузите или вставьте изображения по ссылке.