nixx Опубликовано 9 июня · Жалоба Стоят SNR'овские упсы разных мощностей с картами мониторинга (версия/модель ниже), некоторые покупались достаточно давно - года три и более назад. Последние несколько месяцев начались приколы с отвалом портов железок, в которые воткнуты эти карты. Порт может упасть на минуты три. Может на сутки. Один лежит уже пару недель, вставая на несколько минут, и снова падая на несколько часов. Понятное дело, что грешили на порты/патч-корды, но когда проблема стала массовой, и переключения/замены ничего не дали, стало также понятно, что это никак не патч-корды. В одном упсе даже поменяли карту мониторинга, купив новую взамен старой, ушедшей окончательно в астрал - и она все равно падает (правда, редко). Статистически - из ~20 карт мониторинга хронически колбасятся 4-5, причем одна плясала давно, а 3-4 добавились в последние месяцы. Кто-нибудь встречался с подобным? Hardware Version HDL801 Firmware Version 3.7.DL520.5 причем вот прям сейчас заметил еще один прикольный глюк - в настройках стоит self-test - "Every 2 Weeks" Однако в статусе карты читаю такое: UPS Last Self Test 2024/06/04 06:45:00 UPS Next Self Test 2024/06/11 06:45:00 где тут две недели? Прошивки кривые? Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
tcup Опубликовано 11 июня · Жалоба Пользуем. Подглючивают, бывает. Некоторые линк похоже теряют периодически. Из более критичного - одна теряет много пингов, отключил триггер в мониторинге, вроде работает дальше Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
witch Опубликовано 11 июня · Жалоба Может попробовать зажать на 10/Half ? Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
tcup Опубликовано 11 июня · Жалоба witch зажать пробовал, не дало эффекта Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
witch Опубликовано 11 июня · Жалоба Как вариант, может в сторону модуля из сети летит что-то неприятное для модуля? Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
nixx Опубликовано 11 июня (изменено) · Жалоба скорость зажимать пробовал, с одним помогло на пару недель, потом опять колбаситься начал. с другими пофигу. 28 минут назад, witch сказал: Как вариант, может в сторону модуля из сети летит что-то неприятное для модуля? об этом вот неделю назад подумал. перенёс интерфейс, через который ходит трафик к упсам, на микротик, ограничил в файерволле форвард пакетов только от "нужных" сетей. картина без изменений. уточню - все упсы сидят в отдельном влане, кроме них в нем - никого. доступ - только через упомянутый интерфейс. Изменено 11 июня пользователем nixx Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
witch Опубликовано 11 июня · Жалоба Зарезали все протоколы кроме нужных? Снять tcpdump ? Ps. Я вот сразу от UPS отказался, мне проще батарейка+инвертор и данные по 485 снимаю... Но у меня уже не телеком сфера. Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
nixx Опубликовано 11 июня · Жалоба 1 час назад, witch сказал: Зарезали все протоколы кроме нужных? Снять tcpdump ? я не настолько впал в паранойю, чтобы предполагать, что из офиса или из серверной сети в упсы полетит что-то нештатное )) зарезаны все src адреса, кроме нужных. все остальное открыто. по tcpdump ничего, кроме snmp/http/icmp не бегало - смотрел, но недолго. пока что думаю достать из вторсырья "умершую" платку, которую поменяли на новую, и посмотреть, насколько она реально дохлая. Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
Saab95 Опубликовано 17 июня · Жалоба В 12.06.2024 в 02:19, nixx сказал: пока что думаю достать из вторсырья "умершую" платку, которую поменяли на новую, и посмотреть, насколько она реально дохлая. Питание эти карты получают от UPS же, и имеют интерфейсную шину до его внутренних компонентов. Попробуйте плату мониторинга подключить к другому UPS и проверить как она будет с ним работать. У нас используются ИБП Поверман с картами мониторинга, ни разу не было никаких проблем с отвалами портов или зависаний, каждый подключен в отдельный свой порт микротика, без всяких вланов работает. Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
Alex_78 Опубликовано 5 июля (изменено) · Жалоба То же самое наблюдаем у нас, используется порядка 60шт 1500 ибп. Отваливается процентов 5-10, с чем связано не понятно, замена карт мониторинга не помогает. Изменено 5 июля пользователем Alex_78 Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
Saab95 Опубликовано 5 июля · Жалоба 12 часов назад, Alex_78 сказал: Отваливается процентов 5-10, с чем связано не понятно, замена карт мониторинга не помогает. Сами ИБП чудят, нужно смотреть питание и интерфейсные шины. Как вариант нагреваются / высыхают конденсаторы БП, он выдает не стабильное (пульсирующее) напряжение, в некоторых случаях (просадка входного напряжения, ток заряда аккумуляторов и т.п.) карте мониторинга не подходят параметры по питанию и она зависает. Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
nixx Опубликовано 5 июля · Жалоба 12 часов назад, Alex_78 сказал: То же самое наблюдаем у нас, используется порядка 60шт 1500 ибп. Отваливается процентов 5-10, с чем связано не понятно, замена карт мониторинга не помогает. обратите внимание на нагрев в тех местах, где стоят ибп. у меня подозрение (на основе личной статистики), что карты мониторинга мрут/глючат от перегрева своего личного. сейчас, по жаре в нашей полосе, стало очень заметно. подбейте свою статистику - похоже? Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...