Перейти к содержимому
Калькуляторы

Cacti Cacti не рисует графики

О, а можно поподробнее? :)

Коллега полез в сундук, достал бороду, свитер и потертые джинсы... В итоге написал модуль, который подгружается в ядро приставки. Параметром ему передается группа, которую надо мониторить. Модуль ловит пропуски CC и раз в минуту шлет сообщение от имени ядра. Потом эти сообщения забираются скриптом, запущенным на приставке, и при помощи ncat отправляются в Graphite.

 

Мы выбрали 1 канал (который вещаем сами) и мониторим его на узлах агрегации. Потом можно смотреть как и где "подсыпало". Приставка при этом является "пробником". Абонентов не мониторим, т.к. Graphite нагружать сейчас больше нельзя. Балуемся такой штукой не так давно, но на практике уже нашли пару проблемных мест и приняли меры. :)

 

Остаётся только придумать, чем поллить :) Тоже думаю уже свой поллер пиасать

Только нужен многопоточный, а еще лучше многопроцессорный+многопоточный. Ну и bulk'ами или комбинированными get'ами не брезговать. Ну и да, на PHP не получится, если вдруг что... :)

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Только нужен многопоточный, а еще лучше многопроцессорный+многопоточный. Ну и bulk'ами или комбинированными get'ами не брезговать. Ну и да, на PHP не получится, если вдруг что... :)

 

Да это всё понятно :) Недавно осилил многопоточную пинговалку на сях, тягающую свитчи из оракла, думаю, и с снмп справлюсь :)

 

 

Мы выбрали 1 канал (который вещаем сами) и мониторим его на узлах агрегации. Потом можно смотреть как и где "подсыпало". Приставка при этом является "пробником". Абонентов не мониторим, т.к. Graphite нагружать сейчас больше нельзя. Балуемся такой штукой не так давно, но на практике уже нашли пару проблемных мест и приняли меры. :)

Понял, спасибо! Примерно в этом же направлении думаем, только руки никак не доходят заняться =)

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

xcme, а сколько у вас метрик в графите мониторится?

Я таки написал на сях поллер; всё хорошо; но чего-то графит, как будто, пропускает и не пишет часть данных

 

А так - если всё будет ок, то с графаневской scripted dashboard получается просто великолепно - на каждом свитче в нашей црмке будет линк с красивыми графиками на любые данные :)

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

xcme, а сколько у вас метрик в графите мониторится?

Где-то 280 тысяч каждые 5 минут. А всего опрашивается около 460к метрик, многие проверяются на аномалии, но сами нигде не сохраняются.

 

Я таки написал на сях поллер

Круто! Быстро, однако. :)

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Мда, у нас в 2 раза больше, и карбон, похоже, немного не успевает писать :)) Думаю, попробую писать на ram-диск, постоянное хранение данных ведь не нужно

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

У нас тоже не успевает. Копит в памяти и потом пишет пачкой. При этом отрисовывает нормально, т.к. умеет данные брать и с диска и с памяти.

Я тоже хотел сначала все писать, но потом посмотрел как все печально и оставил только необходимый минимум: RX, TX, RX CRC, CPU, Temp. Всего опрашивается ~3300 железок.

У вас сколько устройств и что собираете?

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Около 4к; писать попробовал inOctets+outOctets+crc+broadcast со всех портов

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Ну а почему в 2 раза больше? 48 портовые чтоли?:)

Что за метрика broadcast?

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

>> Ну а почему в 2 раза больше? 48 портовые чтоли?:)

 

А хрен знает, я посчитал число файлов, и так вот вышло :)

Ну и да - хоть и не очень много, но есть 52, 28 портовые

 

>> Что за метрика broadcast?

.1.3.6.1.2.1.31.1.1.1.9 (ifHCInBroadcastPkts)

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Есть еще вопрос, Подскажите пожалуйста, графики кактус рисует, запросы делает раз в минуту. НО, возник еще 1 вопрос при просмотре графика, когда интервал выбран в 1 минуту выбираем просмотр графика за последние пол часа видим, что график отрисовывается раз в 5 минут, он берет какое-то среднее значение. Если я правильно понимаю, скорость на порту не может быть в течении 5 минут одинаковая.

 

ПЫ.СЫ. Чет картинка не вставляется :( и ссылка тоже норм тоже :(

Изменено пользователем Spisoch_nik

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Ну так патчить Data Templates нужно, заменять step с 300 на 60.

rrd-файлы придется удалить и пересоздать.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Ну так патчить Data Templates нужно, заменять step с 300 на 60.

rrd-файлы придется удалить и пересоздать.

 

Понятно - все нашел, изменил - работает. Спс.

Изменено пользователем Spisoch_nik

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

У меня для большой части устройств опрос данных и сохранение в RRD осуществляет самодельный скрипт, а Cacti только рисует графики с RRD-файлов, в нем это делать удобно.

Большую сеть в Cacti обслуживать (добавлять, изменять, контролировать) неудобно.

У меня сеть не очень большая, но я тоже хотел бы Cacti заменить на что-нибудь другое.

Вот только на что — не найду никак, Zabbix мне тоже не сильно понравился.

Скорее всего будет самописная система, интегрированная с UserSide.

ZABBIX совсем не то, что cacti.

ZABBIX - полноценный мониторинг,в котором можно настроить пороги реагирования по тысячам параметров у тысяч хостов. И сделать это двумя кликами. И вывод по критическим параметрам давать хоть в чатик\смс, хоть на тревожную сирену в курилку монтажников. =)

cacti - построитель графиков, в котором удобно быстренько глянуть, как обстоит ситуация на фронтах. Не более того.

Тем не менее, я не могу привыкнуть к аскетичным графикам zabbix, и использую их только в случаях вида "а покажи-ка мне сколько было входящего трафика на порту 12 коммутатора в доме Х, подъезд Y три года назад, с 6 до 9 утра".

cacti используется для графиков интересующих параметров в серверах \ железках ядра. ZABBIX - для мониторинга и реагирования по ситуациям железок транспортной сети. Ну и следит за cjcnzybtv серверов и сервисов на них с помощью zabbix_agent.

Разные задачи - разные инструменты.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.

Гость
Ответить в тему...

×   Вставлено в виде отформатированного текста.   Вставить в виде обычного текста

  Разрешено не более 75 смайлов.

×   Ваша ссылка была автоматически встроена.   Отобразить как ссылку

×   Ваш предыдущий контент был восстановлен.   Очистить редактор

×   Вы не можете вставить изображения напрямую. Загрузите или вставьте изображения по ссылке.