Перейти к содержимому
Калькуляторы

Мониторинг абонентских портов Что с ним делать?

disappointed спасибо.

Будем думать в сторону порт флапа.

А собираете как? SNMP trap Link change? Или все таки mac notification ?

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Розетку то не сложно прикрутить к стене. И денег она немного стоит. Вот только наверняка абоненту захочется, что бы розетка стояла рядом с компом, а комп окажется в самом дальнем углу квартиры. Кабель опять же не жалко. Но тянуть в обжитой квартире его да же по плинтусу скобками уж слишком геморойное занятие (диваны\шкафы\по цвету не подходит к плинтусу... и т.д.).

 

Ага.

 

Гораздо лучше выносить с клиентами друг другу мозги бросив сопли по полу о огребя проблем со звенящими контактами.

 

Логично, чё. По-русски фундаментально - авось не порвут...

Лично с моей точки зрения логичней рядом с входной дверью (или тем местом, где кабель заходит) поставить простенький роутер с Wi-Fi, а для стационарного компа вручить USB-свисток. Лишь бы только не занимать монтажными работами в обжитой квартире. Вот только может резко встать вопрос на тему скорости. особенно на современных тарифах. Да и денег это уже других стоит.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Лично с моей точки зрения логичней рядом с входной дверью (или тем местом, где кабель заходит) поставить простенький роутер с Wi-Fi, а для стационарного компа вручить USB-свисток. Лишь бы только не занимать монтажными работами в обжитой квартире. Вот только может резко встать вопрос на тему скорости. особенно на современных тарифах. Да и денег это уже других стоит.

 

У вас все-еще не засран 2.4 диапазон?

 

У нас в детской комнате на 15 поддиапазонах где-то 17 сетей. С другой стороны дома получше - всего 7.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Лично с моей точки зрения логичней рядом с входной дверью (или тем местом, где кабель заходит) поставить простенький роутер с Wi-Fi, а для стационарного компа вручить USB-свисток. Лишь бы только не занимать монтажными работами в обжитой квартире. Вот только может резко встать вопрос на тему скорости. особенно на современных тарифах. Да и денег это уже других стоит.

За чей счет? "роутер с Wi-Fi + USB-свисток" уже далеко не стоимость розетки.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

А собираете как? SNMP trap Link change

Линкчейндж конечно. Собираю snmptrapd.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

У нас конечно своя специфика и не все применимо...

 

Для клиентских портов интересно обращать внимание на:

- CRC ошибки

- другие input, output errors & drops

- нормальность уровней сигналов (Rx, Tx) на оптических клиентских портах. Для эффективности механизма, клиентов в этом случае целесообразно подключать на собственные вставки, способные предоставить данную информацию.

- кол-во up-down порта в единицу времени

- попытки или факты переучивания MAC-адреса клиента с его порта на магистральный порт и обратно (возможно петля)

- попытки или факты переучивания MAC-адреса клиента с его порта на другой клиентский порт этого же самого коммутатора и обратно (возможно немного другая петля)

- ...

 

Методики сбора, хранения, обработки данных и механизмы уведомлений клиентов - отдельная песня.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Вернусь к теме.

Написали подобную штуку по порт-флапу, тестируем.

Результаты чуть лучше:

Если за сутки более 500 падений линка - тут явно проблема.

Но таких в сети нашлось всего двое, их отправили на перетяжку.

Довольно много пользователей, у которых более 100 падений линка за сутки. Сегодня обзвонили десяток абонентов:

Итог -никто не жалуется. Интернет есть и работает.

 

На свичах симптомы следующие:

регулярно начинает скакать линк.

 

7457   2013/03/22 16:09:06  Port 11 link down
7456   2013/03/22 16:08:56  Port 5 link down
7455   2013/03/22 16:07:32  Port 5 link up, 100Mbps FULL duplex
7454   2013/03/22 16:07:30  Port 5 link down
7453   2013/03/22 16:06:46  Port 11 link up, 100Mbps FULL duplex
7452   2013/03/22 16:06:45  Port 11 link down
7451   2013/03/22 16:06:26  Port 5 link up, 100Mbps FULL duplex
7450   2013/03/22 16:06:24  Port 5 link down
7449   2013/03/22 15:59:31  Port 11 link up, 100Mbps FULL duplex
7448   2013/03/22 15:59:30  Port 11 link down
7447   2013/03/22 15:44:41  Port 11 link up, 100Mbps FULL duplex
7446   2013/03/22 15:44:39  Port 11 link down
7445   2013/03/22 15:25:27  Port 11 link up, 100Mbps FULL duplex
7444   2013/03/22 15:25:25  Port 11 link down
7443   2013/03/22 15:25:04  Port 11 link up, 100Mbps FULL duplex
7442   2013/03/22 15:24:59  Port 11 link down
7441   2013/03/22 15:22:13  Port 11 link up, 100Mbps FULL duplex
7440   2013/03/22 15:22:06  Port 11 link down
7439   2013/03/22 15:18:51  Port 11 link up, 100Mbps FULL duplex
7438   2013/03/22 15:18:49  Port 11 link down
7437   2013/03/22 15:18:32  Port 11 link up, 100Mbps FULL duplex
7436   2013/03/22 15:18:30  Port 11 link down
7435   2013/03/22 15:18:06  Port 11 link up, 100Mbps FULL duplex
7434   2013/03/22 15:18:04  Port 11 link down
7433   2013/03/22 15:18:04  Port 11 link up, 100Mbps FULL duplex
7432   2013/03/22 15:18:02  Port 11 link down
7431   2013/03/22 15:18:01  Port 11 link up, 100Mbps FULL duplex
7430   2013/03/22 15:17:59  Port 11 link down
7429   2013/03/22 15:17:58  Port 11 link up, 100Mbps FULL duplex
7428   2013/03/22 15:17:57  Port 11 link down
7427   2013/03/22 15:17:56  Port 11 link up, 100Mbps FULL duplex
7426   2013/03/22 15:17:52  Port 11 link down
7425   2013/03/22 15:17:51  Port 11 link up, 100Mbps FULL duplex
7424   2013/03/22 15:17:49  Port 11 link down
7423   2013/03/22 15:17:49  Port 11 link up, 100Mbps FULL duplex
7422   2013/03/22 15:17:47  Port 11 link down
7421   2013/03/22 15:17:46  Port 11 link up, 100Mbps FULL duplex
7420   2013/03/22 15:17:44  Port 11 link down
7419   2013/03/22 15:17:43  Port 11 link up, 100Mbps FULL duplex
7418   2013/03/22 15:17:40  Port 11 link down
7417   2013/03/22 15:17:39  Port 11 link up, 100Mbps FULL duplex
7416   2013/03/22 15:17:37  Port 11 link down
7415   2013/03/22 15:17:36  Port 11 link up, 100Mbps FULL duplex
7414   2013/03/22 15:17:33  Port 11 link down
7413   2013/03/22 15:17:29  Port 11 link up, 100Mbps FULL duplex
7412   2013/03/22 15:17:20  Port 11 link down
7411   2013/03/22 15:17:20  Port 11 link up, 100Mbps FULL duplex
7410   2013/03/22 15:17:19  Port 11 link down
7409   2013/03/22 15:17:12  Port 11 link up, 100Mbps FULL duplex
7408   2013/03/22 15:17:10  Port 11 link down
7407   2013/03/22 15:17:03  Port 11 link up, 100Mbps FULL duplex
7406   2013/03/22 15:17:01  Port 11 link down
7405   2013/03/22 15:16:44  Port 11 link up, 100Mbps FULL duplex
7404   2013/03/22 15:16:43  Port 11 link down
7403   2013/03/22 15:15:15  Port 11 link up, 100Mbps FULL duplex
7402   2013/03/22 15:15:13  Port 11 link down
7401   2013/03/22 15:15:11  Port 11 link up, 100Mbps FULL duplex
7400   2013/03/22 15:15:09  Port 11 link down
7399   2013/03/22 15:15:08  Port 11 link up, 100Mbps FULL duplex
7398   2013/03/22 15:15:07  Port 11 link down
7397   2013/03/22 15:15:06  Port 11 link up, 100Mbps FULL duplex
7396   2013/03/22 15:15:04  Port 11 link down
7395   2013/03/22 15:15:03  Port 11 link up, 100Mbps FULL duplex
7394   2013/03/22 15:15:00  Port 11 link down
7393   2013/03/22 15:14:59  Port 11 link up, 100Mbps FULL duplex
7392   2013/03/22 15:14:57  Port 11 link down
7391   2013/03/22 15:14:56  Port 11 link up, 100Mbps FULL duplex
7390   2013/03/22 15:14:54  Port 11 link down
7389   2013/03/22 15:14:53  Port 11 link up, 100Mbps FULL duplex
7388   2013/03/22 15:14:52  Port 11 link down
7387   2013/03/22 15:14:51  Port 11 link up, 100Mbps FULL duplex
7386   2013/03/22 15:14:47  Port 11 link down
7385   2013/03/22 15:14:46  Port 11 link up, 10Mbps HALF duplex
7384   2013/03/22 15:14:45  Port 11 link down
7383   2013/03/22 15:14:44  Port 11 link up, 100Mbps FULL duplex
7382   2013/03/22 15:14:42  Port 11 link down
7381   2013/03/22 15:14:41  Port 11 link up, 100Mbps FULL duplex
7380   2013/03/22 15:14:39  Port 11 link down
7379   2013/03/22 15:14:38  Port 11 link up, 100Mbps FULL duplex
7378   2013/03/22 15:14:37  Port 11 link down
7377   2013/03/22 15:14:36  Port 11 link up, 100Mbps FULL duplex
7376   2013/03/22 15:14:28  Port 11 link down

 

Поскачет поскачет и успокоится еще на пол дня.

У абонента жалоб вроде как нет, но у всех роутеры, и естественно если линк скачет это можно заметить не всегда.

 

Вот и думай что это, либо глюки длинка, либо порты действительно порты скачут.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Довольно много пользователей, у которых более 100 падений линка за сутки.

Тут половина за час уже.

Потом активность пропадает и не скачет?

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Вот и думай что это, либо глюки длинка, либо порты действительно порты скачут.

А на порту стоит автоопределение скорости и дуплекса?

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

А на порту стоит автоопределение скорости и дуплекса?

Да, а вы предлагаете всем абонентам ставить 100/Full жестко?

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

А на порту стоит автоопределение скорости и дуплекса?

Да, а вы предлагаете всем абонентам ставить 100/Full жестко?

 

нет, лучше это делать через capabilities, у хуавей это так:

 

int XXX
auto speed 100
auto duplex full

при этом автосогласование работает, но согласовывает только "правильный" режим

 

длинк тоже так умеет, но команды на память не помню

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

длинк тоже так умеет, но команды на память не помню

перерыл все команды, не нашел ничего похожего.

Пните в нужном направлении, 1 раз про такое слышу.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

длинк тоже так умеет, но команды на память не помню

перерыл все команды, не нашел ничего похожего.

Пните в нужном направлении, 1 раз про такое слышу.

 

Для серии 3600

config ports 1 speed auto capability_advertised 100_full

 

Для серий 3028/3200/3526 сходу не нашёл, может и в самом деле нет. Поговорите на эту тему с длинком и попросите запилить эту фичу, если её нет, она ОЧЕНЬ полезная

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Сотни тысяч портов собираются по snmp и рисуются графики трафик/ошибки/мультикаст/броадкаст/скорость линка. Собираются раз в пять минут и стабильно все работает.

И какой смысл изобретать грабли с портфлапом?

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Чем собираете/рисуете? cacti с boost плагином? Какой сервер необходим для такого к-ва портов?

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Самописка за день с использованием библиотек Netsnmp, стандартных MIB'ов + rrdtool. Крутится на достаточном мощном сервере с кучей всякого мониторинга (2*5660 + 96 оперативки + ssd). Но пролетает секунд за 30-40, так что можно брать проц один и в разы слабее, особенно если городить выделенный сервер.

Ну и для примера линк знакомого, по совместительству абонента. В 12 включил комп, дважды ребутал. Плюс недельный график транка, который чинили и не дочинили.

 

Вытаскивать в мониторинг саппорту данные анализа rrd файлов проще простого бо в rrdtool есть куча встроенных фишечек.

 

Кстати, может и кактус справится, только у нас весь мониторинг и автоматизация глубоко интегрируются с базой учета сети для удобства, поэтому не пробовал.

s10.253.11.48-p25-1d-load.png

s10.253.11.48-p25-1d-error.png

s10.253.11.48-p25-1d-multicast_in.png

s10.253.11.48-p25-1d-broadcast_in.png

s10.253.11.48-p25-1d-link_speed.png

s10.253.6.98-p27-7d-error.png

Изменено пользователем sexst

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

судя по пробелам, временами не собираются данные.

 

у нас все оборудование в БД, порты автоматически исследуются и уже по ним идет сбор счетчиков. около 100000 портов, раньше работало на core 2 quag и 4 гига ОЗУ. Потом переехали на новый Xeon + 12 гигов памяти. учитывая сбор других данных, диски начали проседать по IOPS - поставили SSD.

 

скрипт на python + rrdcached. параллельно собираем fdb раз в 20 минут. 3 графика: bits in/out, pkts_in unicast/non-unicast, err_in discarded/crc

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Пробелы это физическая недоступность хоста. При этом естественным образом ничего не пишется в базу.

В общем решения достаточно похожи. У нас тоже питон)

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

В итоге доделали статистику по порт-флапу.

В статистике за 3 дня более- менее попадаем в проблемных абонентов.

Минус в следующем - по заявлению длинка некоторые сетевые карты и кривые драйвера регулярно показывают link up/down без причины. По факту линк не падает. Длинк это так и не поборол.

Но в общем и целом - система работает.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

по заявлению длинка некоторые сетевые карты и кривые драйвера регулярно показывают link up/down без причины. По факту линк не падает. Длинк это так и не поборол.

Это они про чьи сетевые карты/драйвера так сказали? :)

Не побороли они этот "нюанс" где - в картах? в драйверах? в свичах?

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Может немного не по теме мониторинга, была у меня проблема с линк-даун-ап на работе, долго с ней боролся, результат оказался неожиданным рвется линк во время старта и стопа компрессора кондиционера, если смотреть осциллографом питающее напряжение то как в момент пуска так и в момент останова присутствует всплеск амплитудой свыше 20В именно в этот момент линк обрывается и затем восстанавливается.

Решил переносом кондиционера на другую фазу и отдельный автомат. Фильтры, упсы и прочее ситуации не меняло.

 

Мне вот интересно как решать подобные проблемы у абонента, у него может быть только одна фаза и может быть невозможен отдельный ввод с автоматом для кондиционера.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Длинк это так и не поборол.

Подтверждаю - на некоторых моделях длинка трапы linkchange приходят даже тогда, когда линк свой статус не менял, ИМХО - проблема именно в прошивке свитча.

Совсем недавно постил на хабре http://habrahabr.ru/post/188730/ - статуса линка делаю через snmp запрос по OID 1.3.6.1.2.1.2.2.1.8.<номер_порта>

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Пожалуй выскажусь.

Считаю излишним мониторить ошибки и падения линка на абонентских портах, особенно при большом общем количество монтированной емкости. Выявлять ситуации навроде "кошка перекусила сетевой кабель" бесполезно, ибо фиг знает, что абонент может творить у себя дома. Вот когда обратится в тех поддержку тогда и можно посмотреть/помониторить. Гораздо важнее собирать ту же самую статистику на аплинк-интерфейсах коммутаторов достпуа. Вот эти ошибки уже в свою очередь требуют немедленной реакции.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Самописка за день с использованием библиотек Netsnmp, стандартных MIB'ов + rrdtool.

Молодцы!

Выкладывайте в паблик, мне то же нужно)

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

ARtisT, как правило, собирается статистика, например 3-5 линков одновременно упало - значит кабель режут)

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.

Гость
Ответить в тему...

×   Вставлено в виде отформатированного текста.   Вставить в виде обычного текста

  Разрешено не более 75 смайлов.

×   Ваша ссылка была автоматически встроена.   Отобразить как ссылку

×   Ваш предыдущий контент был восстановлен.   Очистить редактор

×   Вы не можете вставить изображения напрямую. Загрузите или вставьте изображения по ссылке.