Jump to content
Калькуляторы

Мониторинг абонентских портов Что с ним делать?

На Кроссе-2011 поднималась тема про мониторинг каждого абонентского порта на наличие ошибок.

Сделали мы такую штуку.

Говоря по простому - скрипт ежедневно обегает все абонентские порты и собирает кол-во ошибок на порту.

В 19.00 собирает статистику

в 00.30 - очищает счетчики.

 

Набрали статистики, начали искать проблемы в сети, возможно звонить абонентам (а вдруг у вас проблема и надо переобжать и т.п.).

 

В итоге - ничего не нашли. Статистика работает, но с проблемами непонятки.

Сегодня на порту есть ошибки и растут, завтра ошибок нет.

Так, чтобы ошибки были постоянно на протяжении хотя бы пары дней - нет таких случаев. Более того - и позднее не появляются.

Просто оно сегодня навалило 80.000 ошибок - а завтра все хорошо. Причем никто ничего не делал.

И таких портов ежедневно достаточно много.

Вопрос - как интерпретировать результаты всего этого? И что надо делать?

 

Кто то пробовал делать подобные штуки? Как ищете проблемы?

 

Цель всего этого следующая - отловить проблему без обращения юзера. А то некоторые вместо обращения могут без звонка уйти к конкурентам.

Share this post


Link to post
Share on other sites

запустил у себя такую же штуку.

Только я решил в rrdtool ошибки складывать.

 

Пока накапливаем, будем отправлять ремонтников на посмотреть...

Share this post


Link to post
Share on other sites

Просто оно сегодня навалило 80.000 ошибок - а завтра все хорошо. Причем никто ничего не делал.

Абонент делал. Включал и выключал свой роутер или комп.

Надо аларм делать на появление ошибок и смотреть непосредственно в момент их накопления.

Может там дуплекс то сходится, то не сходится или ещё что-то подобное.

Share this post


Link to post
Share on other sites

запустил у себя такую же штуку.

Только я решил в rrdtool ошибки складывать.

Я пока в базу складываю. Какие там графики - другой вопрос.

 

Ошибки бывают разные. Чего считаем-то?

CRC Error. А вообще хрен его знает правильно ли это. Возможно что то другое надо считать.

 

Абонент делал. Включал и выключал свой роутер или комп.

Надо аларм делать на появление ошибок и смотреть непосредственно в момент их накопления.

Может там дуплекс то сходится, то не сходится или ещё что-то подобное.

 

Ну и толку мне от этой статистики. Мне проблему найти нужно, а не факт отключения его компа. Собственно и вопрос -как?

Может я что не так делаю?

С дуплексом/скоростью все в порядке.

 

Суть в том, что проблемы вроде и есть, а вроде и нет. Сегодня ошибки есть, завтра нет. И проблемы ли это вообще? Или абонент просто прошелся по кабелю или выткнул/воткнул коннектор?

А момент появления хрен поймаешь. Это уже ловят когда абонент звонит. Но это уже совсем другой разговор.

Нужно понять критерий что считать ошибкой.

Пока понятно - что явная ошибка - это когда ежедневно растут ошибки на одном порту. Скажем за 2-3 дня. Но таких случаев пока не было.

 

 

 

По порт-флапу на доступе намного эфективнее получается выявлять хреновые коннекторы.

Есть какие то наработки для автоматического режима?

Как поймать порт флап? SNMP -trap -ом? Что является нормой, а что нет? А то "скачущих портов много судя по логам свича, а вот жалоб на это не очень много"

 

 

Вообще сейчас ловим маки на порту с помощью mac-notification и пишем в базу.

Может попробовать проанализировать в этом направлении? Типа порт-флап -> мак на порту появляется часто ->snmp trap->запись в базе.

Попробовать посчитать кол-во трапов с каждого порта за единицу времени?

Share this post


Link to post
Share on other sites

\Кто то пробовал делать подобные штуки? Как ищете проблемы?

 

Цель всего этого следующая - отловить проблему без обращения юзера. А то некоторые вместо обращения могут без звонка уйти к конкурентам.

Пару лет назад тоже пытались что-то подобное делать.

Ничего путного не вышло - приостановили.

Думаю, что по порт-флапу, как тут выше советовали, будет больше толку.

Share this post


Link to post
Share on other sites

Пока понятно - что явная ошибка - это когда ежедневно растут ошибки на одном порту. Скажем за 2-3 дня. Но таких случаев пока не было.

 

По порт-флапу на доступе намного эфективнее получается выявлять хреновые коннекторы.

Есть какие то наработки для автоматического режима?

Как поймать порт флап? SNMP -trap -ом? Что является нормой, а что нет? А то "скачущих портов много судя по логам свича, а вот жалоб на это не очень много"

 

Сбор ошибок куда-нить в базу помогает понять проблему при жалобе пользователя на скорость или неустойчивое соединение.

 

А вот портфлап - реально рулит. Хоть трапами, хоть журналом собирай.

Share this post


Link to post
Share on other sites

Просто оно сегодня навалило 80.000 ошибок - а завтра все хорошо. Причем никто ничего не делал.

Абонент делал. Включал и выключал свой роутер или комп.

Надо аларм делать на появление ошибок и смотреть непосредственно в момент их накопления.

Может там дуплекс то сходится, то не сходится или ещё что-то подобное.

А есть ещё куча людей с ноутами, которым пока не нужен wifi. Они не просто комп выключают, они шнурок каждый день перетыкают.

Share this post


Link to post
Share on other sites

Да, есть такое. Пока родственникам не подарил роутер, они шнурок прямо в ноутбук втыкали. К сожалению ни коннектора ни инструмента с собой не было.

А смотреть было страшно. И 20 метров кабеля, затянутые в хату, замучали сильно пока не убрали из под ног.

И коннектор в хлам. Защёлка отломана, внешняя оболочка выскочила и коннектор только на болтающихся проводах держался.

Share this post


Link to post
Share on other sites

А смотреть было страшно. И 20 метров кабеля, затянутые в хату, замучали сильно пока не убрали из под ног.

И коннектор в хлам. Защёлка отломана, внешняя оболочка выскочила и коннектор только на болтающихся проводах держался.

Похоже на еще одного провайдера, который на банальной розетке сэкономил. Ну вот нафига провайдерский шнурок прямо в комп включается?

Share this post


Link to post
Share on other sites

Ростелеком. Только я не слышал ни разу чтобы провайдер розетку ставил.

Затягивают в квартиру соплю длиной по желанию абонента. Все местные провайдеры.

Share this post


Link to post
Share on other sites

Только я не слышал ни разу чтобы провайдер розетку ставил.

Я тоже. И меня это уже который год удивляет. Телефонисты розетку ставят, а провайдерам, видимо, 50-ти рублей жалко.

А потом бегают, решают проблемы с поломанным проводом и разболтавшимся коннектором.

Share this post


Link to post
Share on other sites

Ростелеком. Только я не слышал ни разу чтобы провайдер розетку ставил.

Затягивают в квартиру соплю длиной по желанию абонента. Все местные провайдеры.

 

У меня дома розетка на стене поставлена по моей просьбе.

 

Наши монтажники ставят розетки по первой-же просьбе.

 

( Странные у вас провайдеры. Неужто самим потом не лень бегать и переобжимать? )

Share this post


Link to post
Share on other sites

Заладили вы про эту розетку.

Можно подумать, что это панацея.

Или вы лесом шлёте всех с проблемами на линии, кому розетку поставили?

Share this post


Link to post
Share on other sites

Есть какие то наработки для автоматического режима?

Как поймать порт флап? SNMP -trap -ом?

Железо доступа валит трапы по событиям линкчейндж, оно складывается в базу, раз в сутки делается выборка (группировка событий к клиентам),

достаточно точно получается если брать для анализа интервал 5 суток и кол-во событий около 750, т.е. более 150 смен статуса порта,

это 75 падений линка в сутки на протяжении не менее 5 дней.

Share this post


Link to post
Share on other sites

Заладили вы про эту розетку.

Можно подумать, что это панацея.

Или вы лесом шлёте всех с проблемами на линии, кому розетку поставили?

 

Почему-же лесом? В магазин или до коробки от роутера за новым патчкордом.

 

Напрячь немного ноги и деньги можно сэкономить. (Вызов при повреждении в квартире - плантый.)

Share this post


Link to post
Share on other sites

На Кроссе-2011 поднималась тема про мониторинг каждого абонентского порта на наличие ошибок.

Сегодня на порту есть ошибки и растут, завтра ошибок нет.

Так, чтобы ошибки были постоянно на протяжении хотя бы пары дней - нет таких случаев. Более того - и позднее не появляются.

Просто оно сегодня навалило 80.000 ошибок - а завтра все хорошо. Причем никто ничего не делал.

Абсолютные величины бессмысленны. Мы отслеживаем отношение количества ошибок к объёму трафика отданного или принятого с порта. Эмпирически подобрали пороговые величины, которые уже отслеживаем. В 2/3 случаев проблема на нашей стороне (кабель, порт), остальное - на стороне клиента, тот же кабель по квартире или неисправное оборудование.

Share this post


Link to post
Share on other sites

Железо доступа валит трапы по событиям линкчейндж, оно складывается в базу, раз в сутки делается выборка (группировка событий к клиентам),

достаточно точно получается если брать для анализа интервал 5 суток и кол-во событий около 750, т.е. более 150 смен статуса порта,

это 75 падений линка в сутки на протяжении не менее 5 дней.

 

75 в сутки - маловато будет, на мой взгляд. Все кривые сетевухи соберете, которые засыпать нормально не умеют.

 

Был тут индивидуум. Форум один троллил. Дык он для регулярной смены адреса врукопашную за три-четыре часа бутил свой вайфай более чем по 200 раз.

Share this post


Link to post
Share on other sites

Заладили вы про эту розетку.

Можно подумать, что это панацея.

Или вы лесом шлёте всех с проблемами на линии, кому розетку поставили?

 

Почему-же лесом? В магазин или до коробки от роутера за новым патчкордом.

 

Напрячь немного ноги и деньги можно сэкономить. (Вызов при повреждении в квартире - плантый.)

а как вы без визита определяете, что дело в патчкорде, а не вашем кабеле или розетке?

что вам говорит абонент, который смотался в магазин за патчкордом, но ему не помогло?

Share this post


Link to post
Share on other sites

Почему-же лесом? В магазин или до коробки от роутера за новым патчкордом.

 

Напрячь немного ноги и деньги можно сэкономить. (Вызов при повреждении в квартире - плантый.)

а как вы без визита определяете, что дело в патчкорде, а не вашем кабеле или розетке?

 

Во многих случаях перебитый/обломленный патчкорд даже неопытный пользователь может увидеть при должном объяснении.

 

что вам говорит абонент, который смотался в магазин за патчкордом, но ему не помогло?

 

Таких пока только один/два нашлось за все время. Во всех неоднозначных ситуациях - выезд.

Share this post


Link to post
Share on other sites

75 в сутки - маловато будет, на мой взгляд.

Минимум 75 падений каждый день, на протяжении 5 дней. Достаточно чтобы бить тревогу.

Пусть сетевуха, тут важнее всего просто позвонить и сказать, что видим проблему, готовы решить, подсказать если она ему мешает.

Тогда при звонках продажников федералов он уже не примет неверное решение.

Share this post


Link to post
Share on other sites

Ростелеком. Только я не слышал ни разу чтобы провайдер розетку ставил.

Затягивают в квартиру соплю длиной по желанию абонента. Все местные провайдеры.

 

У меня дома розетка на стене поставлена по моей просьбе.

 

Наши монтажники ставят розетки по первой-же просьбе.

 

( Странные у вас провайдеры. Неужто самим потом не лень бегать и переобжимать? )

 

Розетку то не сложно прикрутить к стене. И денег она немного стоит. Вот только наверняка абоненту захочется, что бы розетка стояла рядом с компом, а комп окажется в самом дальнем углу квартиры. Кабель опять же не жалко. Но тянуть в обжитой квартире его да же по плинтусу скобками уж слишком геморойное занятие (диваны\шкафы\по цвету не подходит к плинтусу... и т.д.).

Share this post


Link to post
Share on other sites

Розетку то не сложно прикрутить к стене. И денег она немного стоит. Вот только наверняка абоненту захочется, что бы розетка стояла рядом с компом, а комп окажется в самом дальнем углу квартиры. Кабель опять же не жалко. Но тянуть в обжитой квартире его да же по плинтусу скобками уж слишком геморойное занятие (диваны\шкафы\по цвету не подходит к плинтусу... и т.д.).

 

Ага.

 

Гораздо лучше выносить с клиентами друг другу мозги бросив сопли по полу о огребя проблем со звенящими контактами.

 

Логично, чё. По-русски фундаментально - авось не порвут...

Share this post


Link to post
Share on other sites

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.

Guest
Reply to this topic...

×   Pasted as rich text.   Paste as plain text instead

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.