Jump to content
Калькуляторы

Чудеса с NetAgent IX / HDL801

Стоят SNR'овские упсы разных мощностей с картами мониторинга (версия/модель ниже), некоторые покупались достаточно давно - года три и более назад.

Последние несколько месяцев начались приколы с отвалом портов железок, в которые воткнуты эти карты. Порт может упасть на минуты три. Может на сутки. Один лежит уже пару недель, вставая на несколько минут, и снова падая на несколько часов.

Понятное дело, что грешили на порты/патч-корды, но когда проблема стала массовой, и переключения/замены ничего не дали, стало также понятно, что это никак не патч-корды.

В одном упсе даже поменяли карту мониторинга, купив новую взамен старой, ушедшей окончательно в астрал - и она все равно падает (правда, редко).

Статистически - из ~20 карт мониторинга хронически колбасятся 4-5, причем одна плясала давно, а 3-4 добавились в последние месяцы.

 

Кто-нибудь встречался с подобным?

 

Hardware Version HDL801

Firmware Version  3.7.DL520.5

 

причем вот прям сейчас заметил еще один прикольный глюк - в настройках стоит self-test - "Every 2 Weeks"

Однако в статусе карты читаю такое:

UPS Last Self Test   2024/06/04 06:45:00

UPS Next Self Test  2024/06/11 06:45:00

где тут две недели?

 

Прошивки кривые?

Share this post


Link to post
Share on other sites

Пользуем. Подглючивают, бывает. Некоторые линк похоже теряют периодически. Из более критичного - одна теряет много пингов, отключил триггер в мониторинге, вроде работает дальше

Share this post


Link to post
Share on other sites

скорость зажимать пробовал, с одним помогло на пару недель, потом опять колбаситься начал. с другими пофигу.

28 минут назад, witch сказал:

Как вариант, может в сторону модуля из сети летит что-то неприятное для модуля?

об этом вот неделю назад подумал. перенёс интерфейс, через который ходит трафик к упсам, на микротик, ограничил в файерволле форвард пакетов только от "нужных" сетей. картина без изменений.

уточню - все упсы сидят в отдельном влане, кроме них в нем - никого. доступ - только через упомянутый интерфейс.

Edited by nixx

Share this post


Link to post
Share on other sites

Зарезали все протоколы кроме нужных? Снять tcpdump ? 

Ps. Я вот сразу от UPS отказался, мне проще батарейка+инвертор и данные по 485 снимаю... Но у меня уже не телеком сфера.

Share this post


Link to post
Share on other sites

1 час назад, witch сказал:

Зарезали все протоколы кроме нужных? Снять tcpdump ?

я не настолько впал в паранойю, чтобы предполагать, что из офиса или из серверной сети в упсы полетит что-то нештатное ))

зарезаны все src адреса, кроме нужных. все остальное открыто. по tcpdump ничего, кроме snmp/http/icmp не бегало - смотрел, но недолго.

 

пока что думаю достать из вторсырья "умершую" платку, которую поменяли на новую, и посмотреть, насколько она реально дохлая.

Share this post


Link to post
Share on other sites

В 12.06.2024 в 02:19, nixx сказал:

пока что думаю достать из вторсырья "умершую" платку, которую поменяли на новую, и посмотреть, насколько она реально дохлая.

Питание эти карты получают от UPS же, и имеют интерфейсную шину до его внутренних компонентов. Попробуйте плату мониторинга подключить к другому UPS и проверить как она будет с ним работать.

 

У нас используются ИБП Поверман с картами мониторинга, ни разу не было никаких проблем с отвалами портов или зависаний, каждый подключен в отдельный свой порт микротика, без всяких вланов работает.

Share this post


Link to post
Share on other sites

То же самое наблюдаем у нас, используется порядка 60шт 1500 ибп.
Отваливается процентов 5-10, с чем связано не понятно, замена карт мониторинга не помогает.

Edited by Alex_78

Share this post


Link to post
Share on other sites

12 часов назад, Alex_78 сказал:

Отваливается процентов 5-10, с чем связано не понятно, замена карт мониторинга не помогает.

Сами ИБП чудят, нужно смотреть питание и интерфейсные шины. Как вариант нагреваются / высыхают конденсаторы БП, он выдает не стабильное (пульсирующее) напряжение, в некоторых случаях (просадка входного напряжения, ток заряда аккумуляторов и т.п.) карте мониторинга не подходят параметры по питанию и она зависает.

Share this post


Link to post
Share on other sites

12 часов назад, Alex_78 сказал:

То же самое наблюдаем у нас, используется порядка 60шт 1500 ибп.
Отваливается процентов 5-10, с чем связано не понятно, замена карт мониторинга не помогает.

обратите внимание на нагрев в тех местах, где стоят ибп.

у меня подозрение (на основе личной статистики), что карты мониторинга мрут/глючат от перегрева своего личного. сейчас, по жаре в нашей полосе, стало очень заметно.

подбейте свою статистику - похоже?

Share this post


Link to post
Share on other sites

Все доброго дня.

Имеем 15 плат Netagent 9 mini (прошивка платы 3.7.DL520.6) и аналогичную проблему - периодически (чаще всего после автоматического теста раз в квартал) плата начинает флэпать портом, приходится ехать на узел и дёргать плату (выдернуть и воткнуть назад). Данная манипуляция помогает до следующего раза.

Стоит сказать, что не после каждого теста и не всегда после теста это происходит, но помогает только выдернуть/вставить плату, игры со скоростью и дуплексом ничего не дают.

Share this post


Link to post
Share on other sites

11 часов назад, shurdre сказал:

Стоит сказать, что не после каждого теста и не всегда после теста это происходит, но помогает только выдернуть/вставить плату, игры со скоростью и дуплексом ничего не дают.

Оборудование сколько лет уже работает и какой ИБП используется?

 

Кто с подобным встречался, после разбирательств, находили причину в не стабильности подачи питания на плату от ИБП, конденсаторы там высохли и т.п.

Share this post


Link to post
Share on other sites

допишу в тему, ну просто чтобы новую не создавать )

 

узрел между делом, что MegaTec выпустил обновление прошивок для карт NetAgent

https://www.megatec.com.tw/software-download/

шьются путём запуска софта Netility (берется в соседней вкладке) в той же подсети, что и карта мониторинга

Share this post


Link to post
Share on other sites

Нового то ничего не добавили в этой прошивке. Только можно платы испортить, если вдруг прошивка пойдет не по плану.

Share this post


Link to post
Share on other sites

Тоже были отвалы упсов, лечили заменой конденсатора на плате питания модуля управления. Надеюсь в серии Element 2 пофиксили проблему.

Share this post


Link to post
Share on other sites

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.

Guest
Reply to this topic...

×   Pasted as rich text.   Paste as plain text instead

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.