Spisoch_nik Posted July 21, 2015 · Report post Добрый день, подскажите пожалуйста. Поставил cacti 0.8.8f. Кактус ставил на Debian +весь пакет нужного ПО. И вот вопрос. если в настройках кактуса Setting > Ppoller > Poller Interval и Cron Interval стоит 5 минут - графики рисует без проблем, как только ставлю интервал в 1 минуту - перестаёт рисовать, удалял устройство, выставлял заново интервалы в 1 минуту, создавал заново устройство - не рисует :(. Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
s.lobanov Posted July 21, 2015 · Report post если хотите одну минуту, то меняйте php-poller на spine Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
Spisoch_nik Posted July 21, 2015 · Report post сделал. Предварительно удалив устройство, интервалы сделал по 1 минуте - теперь в девайсах пишет статус роутера Unknown В логах кактуса выдает ERROR: The path: /usr/sbin/spine is invalid. Can not continue WARNING: Cron is out of sync with the Poller Interval! The Poller Interval is '60' seconds, with a maximum of a '300' second Cron, but 300 seconds have passed since the last poll! Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
Spisoch_nik Posted July 21, 2015 · Report post Доставил Spine теперь в логах пишет 07/21/2015 02:50:02 PM - SYSTEM STATS: Time:0.8915 Method:spine Processes:1 Threads:1 Hosts:3 HostsPerProcess:3 DataSources:2 RRDsProcessed:1 07/21/2015 02:50:01 PM - POLLER: Poller[0] WARNING: Cron is out of sync with the Poller Interval! The Poller Interval is '60' seconds, with a maximum of a '300' second Cron, but 299 seconds have passed since the last poll! что-то ни то с синхронизацией - но что не могу понять. Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
s.lobanov Posted July 21, 2015 · Report post ну так замените в крое */5 на * Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
vlad11 Posted July 23, 2015 · Report post Интервал 1 минута - бесполезная нагрузка на cacti. За это время она не успевает опросить все ваши устройства. Ставьте 5 минут. Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
s.lobanov Posted July 23, 2015 · Report post Интервал 1 минута - бесполезная нагрузка на cacti. За это время она не успевает опросить все ваши устройства. Ставьте 5 минут. наркоман чтоле? Устройств может быть 1.5 штуки это раз. А во-вторых spine он же умеет multithread и вообще http://www.cacti.net/downloads/docs/html/using_spine.html Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
vlad11 Posted July 23, 2015 · Report post Интервал 1 минута - бесполезная нагрузка на cacti. За это время она не успевает опросить все ваши устройства. Ставьте 5 минут. наркоман чтоле? Устройств может быть 1.5 штуки это раз. А во-вторых spine он же умеет multithread и вообще http://www.cacti.net/downloads/docs/html/using_spine.html Г-н Лобанов! Вы хоть эксплуатировали cacti? Или читаете документацию между строк? Уменьшение частоты опросы с увеличением числа потоков только увеличит нагрузку на диски. Я уже молчу про CPU и резервирование памяти под php скрипты. Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
Antares Posted July 23, 2015 · Report post У меня так и не получилось сделать графики с опросом раз в минуту Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
vlad11 Posted July 23, 2015 · Report post У меня так и не получилось сделать графики с опросом раз в минуту Читайте. В гугле полно ссылок по фразе "cacti spine 60 seconds" Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
s.lobanov Posted July 23, 2015 · Report post Интервал 1 минута - бесполезная нагрузка на cacti. За это время она не успевает опросить все ваши устройства. Ставьте 5 минут. наркоман чтоле? Устройств может быть 1.5 штуки это раз. А во-вторых spine он же умеет multithread и вообще ts http://www.cacti.net/downloads/docs/html/using_spine.html Г-н Лобанов! Вы хоть эксплуатировали cacti? Или читаете документацию между строк? Уменьшение частоты опросы с увеличением числа потоков только увеличит нагрузку на диски. Я уже молчу про CPU и резервирование памяти под php скрипты. Эксплуатировал конечно. >Уменьшение частоты опросы с увеличением числа потоков только увеличит нагрузку на диски. спасибо КЭП. это вообще не относится к Cacti, а к любому аналогичному ПО >Я уже молчу про CPU и резервирование памяти под php скрипты. хорошо, что молчите ибо spine написан на C - https://github.com/Cacti/spine/blob/develop/poller.c и мало того, он даже умеют делать snmpbulkget, что ещё повышает скорость не только за счёт замены PHP на C. До PHP 5.4 оно вообще не умело делать bulkget Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
vlad11 Posted July 23, 2015 · Report post Эксплуатировал конечно. >Уменьшение частоты опросы с увеличением числа потоков только увеличит нагрузку на диски. спасибо КЭП. это вообще не относится к Cacti, а к любому аналогичному ПО >Я уже молчу про CPU и резервирование памяти под php скрипты. хорошо, что молчите ибо spine написан на C - https://github.com/Cacti/spine/blob/develop/poller.c и мало того, он даже умеют делать snmpbulkget, что ещё повышает скорость не только за счёт замены PHP на C. До PHP 5.4 оно вообще не умело делать bulkget Ну, заявить мультипотоковость - не значит эффективно ее использовать :) + при использовании spine надо думать и оптимизировать опции "Spine Specific Execution Parameters" Также не увидел у spine опций кеширования Mysql-запросов, в итоге к мускулу можно получить несколько Krs, а значит без тюнинга базы и Мускула не обойтись. P.S. У меня php 5.5.12, cmd.php и items total: 2516 Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
s.lobanov Posted July 23, 2015 · Report post vlad11 Просто не надо писать всякую чушь. Не зная параметров сервера и количества итемов вот так взять и сказать, что при изменении интервала с 5 минут до одной приведёт к тому, что система не справится, это как минимум не профессионально. "Просто не будет успевать и точка. Потому что я так сказал." Во-вторых, опыт показывает, что тупая замена php-поллера на spine и больше ничего не делать вообще в разы сокращает время опроса Ну и придумывать новые отмазы типа mysql кеширования это уже даже не смешно. Просто признайте, что сморозили какую-то ерунду. Со всеми бывает Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
alibek Posted July 23, 2015 · Report post Вы хоть эксплуатировали cacti? У меня мониторится четыре сотни устройств (и сотен 6 datasource), с интервалом раз в минуту, на достаточно скромном сервере. Часть устройств опрашивает spine, для других устройств используется самодельный скрипт. Все успевает. Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
vlad11 Posted July 23, 2015 · Report post vlad11 Просто не надо писать всякую чушь. Не зная параметров сервера и количества итемов вот так взять и сказать, что при изменении интервала с 5 минут до одной приведёт к тому, что система не справится, это как минимум не профессионально. "Просто не будет успевать и точка. Потому что я так сказал." Во-вторых, опыт показывает, что тупая замена php-поллера на spine и больше ничего не делать вообще в разы сокращает время опроса Ну и придумывать новые отмазы типа mysql кеширования это уже даже не смешно. Просто признайте, что сморозили какую-то ерунду. Со всеми бывает Ваша агрессивная риторика говорит о том, что вы с цифрами таки не дружите. Даже в порядках путаетесь. Да, начните с прочтения этой темы. По поводу spine и cmd.php - зависит от версий cacti и OS системы, одно время spine не работал или был значительно тормознутее cmd.php. Вы хоть эксплуатировали cacti? У меня мониторится четыре сотни устройств (и сотен 6 datasource), с интервалом раз в минуту, на достаточно скромном сервере. Часть устройств опрашивает spine, для других устройств используется самодельный скрипт. Все успевает. Цифры будут? IOPS дисковой системы сервера? Больше 30 запросов к одному источнику есть? Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
alibek Posted July 24, 2015 · Report post Какие именно цифры? Сервер бюджетный, мало отличающийся от обычного офисного ПК. Большая часть устройств - это коммутаторы доступа, их опрашивает самодельный многопоточный perl-скрипт. Остальные устройства опрашивает spine, часть устройств это ядро (там на отдельных устройствах по полторы сотни запросов есть), часть различные специальные устройства. Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
s.lobanov Posted July 24, 2015 · Report post По поводу spine и cmd.php - зависит от версий cacti и OS системы, одно время spine не работал или был значительно тормознутее cmd.php. Ну давайте, вспомним, что ядро linux 2.4 работало медленнее чего-нибудь другого. Раньше и трава была зеленее, да. В топике же всё указано Поставил cacti 0.8.8f. + http://web.archive.org/web/20150724073911/http://www.cacti.net/download_cacti.php - это как бы latest stable на сегодня Да, начните с прочтения этой темы. к технической части обсуждения это вообще не имеет отношения вы с цифрами таки не дружите. Даже в порядках путаетесь. где именно у меня ошибка в цифрах? P.S. глянул исходники PHP-шного поллера, он так и не научился bulkget, хотя все нужные фичи для этого появились в 5.4 Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
xcme Posted July 24, 2015 (edited) · Report post Мы вот Cacti выводим из эксплуатации. Переходим на Zabbix+самописное_ПО->Graphite+Grafana. Edited July 24, 2015 by xcme Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
ayf Posted July 24, 2015 · Report post Мы вот Cacti выводим из эксплуатации. Переходим на Zabbix+самописное_ПО->Graphite+Grafana. А по какой причине? Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
alibek Posted July 24, 2015 · Report post У меня для большой части устройств опрос данных и сохранение в RRD осуществляет самодельный скрипт, а Cacti только рисует графики с RRD-файлов, в нем это делать удобно. Большую сеть в Cacti обслуживать (добавлять, изменять, контролировать) неудобно. У меня сеть не очень большая, но я тоже хотел бы Cacti заменить на что-нибудь другое. Вот только на что — не найду никак, Zabbix мне тоже не сильно понравился. Скорее всего будет самописная система, интегрированная с UserSide. Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
xcme Posted July 24, 2015 · Report post А по какой причине? Как верно заметил alibek, "большую сеть в Cacti обслуживать ... неудобно". Преимуществом кактуса являются красивые графики, минусами - все остальное. :) Реакция на пересечений граничных значений оставляет желать лучшего. Есть сложность с мониторингом НЕ-snmp параметров. Да и в целом, в нашем случае эта штука просто избыточна - все нужное уже есть в других системах. Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
zi_rus Posted July 24, 2015 · Report post к слову, NOC умеет данные собирать и в графане их рисовать Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
Wingman Posted July 24, 2015 (edited) · Report post Мы вот Cacti выводим из эксплуатации. Переходим на Zabbix+самописное_ПО->Graphite+Grafana. Оффтопну :) Не подскажете, чем в графит метрики со свитчей (да и со всего остального) запихиваете? Я тут как раз про графит начитался/наслушался презентаций яндекса, но в жизни оно как-то не так красиво выглядит :) Нет триггеров; нет снмп-поллеров; и вообще как-то после заббикса скудновато для меня выглядит :) Update: вопрос снят, нашел тему с вашим поллером Edited July 24, 2015 by Wingman Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
xcme Posted July 24, 2015 · Report post Update: вопрос снят, нашел тему с вашим поллером Ага, им самым. :) Ну и NOC еще чутка пишет, не стал лишать его этого удовольствия. :) и вообще как-то после заббикса скудновато для меня выглядит :) Мониторинг бывает разный. Бывает, что данные пишутся только для разбора полетов задним числом. Иногда, наоборот, нужно все наблюдать онлайн. В третьем случае важны отклонения от норм, которые уже произошли, а в четвертом - которые вот вот произойдут. К том уже разным отделам внутри сети нужны разные данные. Техподдержки интересен только трафик и ошибки на портах, да и то только в том случае, если абонент к ним уже позвонил. Дежурным админам интересны состояния железок на доступе и происходящие в данный момент события в сети. Инженерам - состояние ядра и линков для долгосрочного планирования. Системному админу - параметры серверов. И так далее. Я к тому, что пихать все в один котел смысла нет. Нравится заббикс для триггеров - прекрасно. Но вот складировать в него просто так загрузку десятков или сотен тысяч портов смысла нет никакого. Под каждую задачу свой инструмент. :) Сейчас у нас такой расклад: Zabbix - для мониторинга магистральных узлов и серверов, для обнаружения отклонений и аномалий. NOC+самописное ПО - для съема большого объема редко нужных данных с коммутаторов доступа. Graphite - для складирования этих данных и рендеринга картинок для техподдержки. Grafana - для удобных дашбордов с данными из графита и заббикса. Cacti мониторит магистральные железки. От него потихоньку избавляемся, просто он был первым. What's Up - для мониторинга коммутаторов. Пытаюсь пересесть с него на Pandora FMS. Темная лошадка, но мне нравится. Есть карта GIS и можно управлять конфигурацией через API. В Zabbix тоже можно, но он погибнет, если в него все это свалить, да и с картами там не очень. +Разные мелкие штуки для конкретных задач (например, мониторинг каналов на MAG250 выполняет специальный модуль ядра). Сейчас, конечно, слегка колхоз, НО. Cacti и What's Up выкинем, это -2 системы. Моя тулза ручного управления (добавление/удаление устройств) не требует, NOC вроде как тоже. Их можно не считать. Graphite - просто коллектор. Pandora (по задумке) будет управляться с биллинга исключительно автоматически через API. В итоге управлять надо будет только Zabbix, ну и иногда в Grafana дашборды клепать. Не так уж и страшно. :) Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
Wingman Posted July 24, 2015 · Report post Ну я уже примерно к такому выводу и пришёл: заббикс - для критичного, важного, редкого - магистрали, аплинки, серверы; что-то вроде Graphite или "что-то"+infludb - для всяких массовых штук. Остаётся только придумать, чем поллить :) Тоже думаю уже свой поллер пиасать например, мониторинг каналов на MAG250 выполняет специальный модуль ядра О, а можно поподробнее? :) Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...