Fat Tony Posted March 19, 2015 · Report post Добрый день, коллеги! Нужна ваша помощь... Досталась в наследство сеть из БС на Рокет М5 Титаниум и четыре абонентских точки на Нанобридж М5. За абонентскими точками стоят управляемые коммутаторами, управление и абонентский трафик разнесены по разным вланам, при чем каждая клиентская станция в своем абонентском влане + фильтрация и сегментация трафика на портах управляемых ДЛинк, дабы избежать нагрузки радиосети широковещанием. Сеть - РРРоЕ. Клиентов-физлиц за железом всей сети около 80. Вроде все работало великолепно, пока не образовалась сильная помеха на нашей частоте. После анализа спектра Airview перешел на другую частоту, перенастроил клиентские станции. Перекос трафика пропал, модуляции восстановились, канальные скорости поднялись. Уровни станций примерно сравнял. Вопрос в том, что Рокет М5 периодически по непонятным причинам виснет наглухо, помогает только ребут по питанию (для этих целей поставил СМС-розетку на БС). Гигабитным портом Рокет включена в порт гигабитного коммутатора Джунипер, РОЕ инжектор питания включен в гарантированную розетку, на которой всегда есть 220В. Вот например за последние три дня: 17 марта в 02:44 и в 11:44 18 марта в 20:03 19 марта в 12:37 Прошивки всего оборудования 5.5.10. Всех низкокачественных клиентов пересадил на отдельные мостовые линки, прописал АСL по МАС на БС, поменял пароли (думал, кто-нибудь из старых хозяев ползает). Настроено логирование, но по логам с БС и других станций ничего криминального не видно. Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
kosmich7 Posted March 19, 2015 · Report post Вопрос в том, что Рокет М5 периодически по непонятным причинам виснет наглухо Если включить вотчдог на рокете будет ребутиться ?Для начала в 20Мгц перейти. Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
Yuraner Posted March 19, 2015 · Report post , РОЕ инжектор питания включен в гарантированную розетку, на которой всегда есть 220В. Длинна линии питания? Другой патч пробовали? Софт или кнопочный резет не помогает, или не проходит вообще? Я бы рекомендовал такое: перешить прошивку на столе, временно заменить патч на максимально короткий с новым БП. Если не помогло, то снять и проверить на отдельной линии на старой частоте, ежели всё заработает, значит скорее всего замена усилков(80%) или радиочипа(15%). Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
Fat Tony Posted March 19, 2015 · Report post Переход на 20 МГц не помогал. Проверял уже. Получил логи с джунипера, похоже BPDU прилетает откуда-то...Mar 19 12:36:29.180 2015 eswd[1017]: ESWD_STP_STATE_CHANGE_INFO: STP state for interface ge-0/0/2.0 context id 1 changed from FORWARDING to BLOCKING и рокет не виснет, а тупо лочится порт на джуне. А когда я посредством СМС розетки ребутаю рокета, порт восстанавливается снова в форвардинг... епрст... откуда что прилетает. надо разбираться! , РОЕ инжектор питания включен в гарантированную розетку, на которой всегда есть 220В. Длинна линии питания? Другой патч пробовали? Софт или кнопочный резет не помогает, или не проходит вообще? Я бы рекомендовал такое: перешить прошивку на столе, временно заменить патч на максимально короткий с новым БП. Если не помогло, то снять и проверить на отдельной линии на старой частоте, ежели всё заработает, значит скорее всего замена усилков(80%) или радиочипа(15%). Патч проверенный, длина 12 метров. БП новый. Антенна полностью в сборе есть еще для этой хренотени. Но, похоже, проблема где-то в топологии сети. Как я уже писал - BPDU похоже на гигабитник джунипера прилетает с радио Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
kosmich7 Posted March 19, 2015 · Report post и рокет не виснет, а тупо лочится порт на джуне. Семен Семеныч (с) Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
Fat Tony Posted March 23, 2015 (edited) · Report post Тема продолжается... Устранили косяки с STP. В логах на порту все чисто, но рокет продолжает периодически "виснуть". МАС-и на аплинк-порту не ходят, смотрел, хотя порт и в апе... Помогает только перезагрузка. Edited March 23, 2015 by Fat Tony Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
dronis3 Posted March 23, 2015 · Report post Если свич стоит какой до БС рокета попробовать его сменить и отключить на БС логи на время. Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
Fat Tony Posted March 23, 2015 · Report post 4 дня без проблем и замечаний все отработало и на тебе! Самое интересное в том, что ни в логах БС, ни в логах клиентских станций, ни на syslog-сервере никаких косяков не отмечается. Просто восстановление интерфейсов и ВСЕ. Уже не знаю, на что и грешить... Если свич стоит какой до БС рокета попробовать его сменить и отключить на БС логи на время. свитч не поменять, на нем трафик ЛТЕ ходит, он нормально пашет. Логи, кстати и на БС и на всех клиентских станциях включены. Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
dronis3 Posted March 23, 2015 · Report post А как там питание 220в работает? Есть блок питание с 1а еще одно запасное что бы сменить на время? И свич промежуточный для теста поставить между бс и (LTE свич). Заземляемый первый свич? Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
Fat Tony Posted March 23, 2015 · Report post Есть блок питание с 1а Вот уж не знаю, на что грешить... С питанием 220В там на базовой станции ЛТЕ/ГСМ все ОК. Гарантированное. Две ЛЭП/ДГА/АКБ. Заземление сделано по стандарту. Тут все четко. Пищеблока такого, ну то бишь инжектора питания, запасного нет. Но мне кажется, если б с питанием был косяк, рокет бы перезагружался, а в логах пусто... Просто старт системы и все. Хотя, кто ж его знает. А, может, пик нагрузки приходит и эта херомантия тупо не вытягивает нагрузку и тухнет. А перезапуск посредством СМС розетки его оживляет. Свитч попытаюсь поставить, но на объект попасть трудно. Лог после рестарта вручную посредством СМС-розетки: System Log Oct 01 21:41:14 system: Start Oct 1 21:41:14 syslogd started: BusyBox v1.11.2 Oct 1 21:41:14 FileSystem: Start check... Oct 1 21:41:14 wireless: ath0 Set Mode:Master Mar 23 14:32:44 dropbear[681]: Not backgrounding Mar 23 14:32:47 FileSystem: End check. Mar 23 14:32:48 ac-agent: Pinging 'http://111.222.333.444:9080/heartbeat/'... Mar 23 14:32:48 ac-agent: done. Mar 23 14:32:48 wireless: ath0 MLME-AUTH.indication(addr=dc:9f:db:xx:xx:xx) Mar 23 14:32:48 wireless: ath0 Registered node:DC:9F:DB:XX:XX:XX Mar 23 14:32:48 wireless: ath0 MLME-AUTH.indication(addr=dc:9f:db:xx:xx:xx) Mar 23 14:32:48 wireless: ath0 MLME-AUTH.indication(addr=dc:9f:db:xx:xx:xx) Mar 23 14:32:48 wireless: ath0 Registered node:DC:9F:DB:XX:XX:XX Mar 23 14:32:48 wireless: ath0 Registered node:DC:9F:DB:XX:XX:XX Mar 23 14:32:49 hostapd: ath0: STA dc:9f:db:xx:xx:xx IEEE 802.11: associated Mar 23 14:32:49 hostapd: ath0: STA dc:9f:db:xx:xx:xx IEEE 802.11: associated Mar 23 14:32:49 hostapd: ath0: STA dc:9f:db:xx:xx:xx IEEE 802.11: associated Mar 23 14:32:49 hostapd: ath0: STA dc:9f:db:xx:xx:xx WPA: pairwise key handshake completed (RSN) Mar 23 14:32:49 hostapd: ath0: STA dc:9f:db:xx:xx:xx WPA: pairwise key handshake completed (RSN) Mar 23 14:32:49 hostapd: ath0: STA dc:9f:db:xx:xx:xx WPA: pairwise key handshake completed (RSN) Mar 23 14:32:49 dropbear[704]: Child connection from 111.222.333.444:23277 Mar 23 14:32:50 dropbear[704]: Pubkey auth succeeded for 'mcuser' with key md5 b5:42:85:ba:61:37:ce:4f:aa:6e:f3:12:ee:99:a9:71 from 111.222.333.444:23277 Mar 23 14:32:51 dropbear[707]: Child connection from 111.222.333.444:23297 Mar 23 14:32:51 dropbear[707]: Exit before auth: Exited normally Mar 23 14:32:53 dropbear[704]: Exit (mcuser): Exited normally На сислог-сервере аналогичные сообщения. Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
[anp/hsw] Posted March 23, 2015 · Report post Замените устройство, которое виснет. Глухого виса, связаного с софтовыми проблемами, в этой серии не может быть, т.к. там - аппаратный watchdog, и он перезагрузит в случае чего устройство. Если есть глухой вис - ищите сугубо аппаратную проблему. Обычно это питание или дефект устройства. Легче заменить кабель+poe+точку доступа, чем мучаться и искать проблему по-отдельности за несколько заходов на узел. Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
Fat Tony Posted April 2, 2015 (edited) · Report post ' timestamp='1427131773' post=1103121]Глухого виса, связаного с софтовыми проблемами, в этой серии не может быть, т.к. там - аппаратный watchdog, и он перезагрузит в случае чего устройство. Добрый день! Опять подымаю тему... Пробовал поработать с включенным watchdog-ом. Результат отрицательный. В логе циски МЕ-3400, которую воткнул в разрыв между Джунипером и Рокетом ничего криминального нет, BPDU не ловлю, порт по ерродизейбл не лочится, постоянно в апе. Но вот ни одного МАСа на порту нет. Попытки пинга отрицательны. Ждал когда же вотчдог ребутнет Рокета и все заработает, но хрен там. Судя по логам и веб-морде точки, точка ребутится вотчдогом, но трафик не восстанавливается, пока СМС-розеткой по питанию не ребутнешь. Потом на веб-морде баннер висит - точка была ребутнута, вот вам саппорт-инфо. О! Кстати, кто-нить знает, чем можно саппорт-инфо посмотреть? Логи с циски МЕ-3400 *Apr 2 08:00:37.142: %LINEPROTO-5-UPDOWN: Line protocol on Interface GigabitEthernet0/2, changed state to down *Apr 2 08:00:38.149: %LINK-3-UPDOWN: Interface GigabitEthernet0/2, changed state to down *Apr 2 08:01:07.014: %LINK-3-UPDOWN: Interface GigabitEthernet0/2, changed state to up *Apr 2 08:01:08.021: %LINEPROTO-5-UPDOWN: Line protocol on Interface GigabitEthernet0/2, changed state to up *Apr 2 08:01:10.462: %LINEPROTO-5-UPDOWN: Line protocol on Interface GigabitEthernet0/2, changed state to down *Apr 2 08:01:11.468: %LINK-3-UPDOWN: Interface GigabitEthernet0/2, changed state to down *Apr 2 08:01:36.928: %LINK-3-UPDOWN: Interface GigabitEthernet0/2, changed state to up *Apr 2 08:01:37.934: %LINEPROTO-5-UPDOWN: Line protocol on Interface GigabitEthernet0/2, changed state to up логи с Рокета 02.04.2015 09:28 Apr 2 04:28:09 wpa-supplicant: CTRL-EVENT-CONNECTED - Connection to 04:18:d6:11:11:11 completed (reauth) [id=0 id_str=] 02.04.2015 09:28 Apr 2 04:28:09 wpa-supplicant: WPA: Key negotiation completed with 04:18:d6:11:11:11 [PTK=CCMP GTK=CCMP] 02.04.2015 09:28 Apr 2 04:28:09 wpa-supplicant: Associated with 04:18:d6:11:11:11 02.04.2015 09:28 Apr 2 09:28:09 hostapd: ath0: STA dc:9f:db:22:22:22 WPA: pairwise key handshake completed (RSN) 02.04.2015 09:28 Apr 2 09:28:09 hostapd: ath0: STA dc:9f:db:33:33:33 WPA: pairwise key handshake completed (RSN) 02.04.2015 09:28 Apr 2 09:28:09 hostapd: ath0: STA dc:9f:db:22:22:22 IEEE 802.11: associated 02.04.2015 09:28 Apr 2 09:28:09 hostapd: ath0: STA dc:9f:db:22:22:22 IEEE 802.11: disassociated 02.04.2015 09:28 Apr 2 09:28:09 hostapd: ath0: STA dc:9f:db:33:33:33 IEEE 802.11: associated 02.04.2015 09:28 Apr 2 09:28:09 hostapd: ath0: STA dc:9f:db:44:44:44 WPA: pairwise key handshake completed (RSN) 02.04.2015 09:28 Apr 2 09:28:09 hostapd: ath0: STA dc:9f:db:33:33:33 IEEE 802.11: disassociated 02.04.2015 09:28 Apr 2 09:28:09 hostapd: ath0: STA dc:9f:db:55:55:55 WPA: pairwise key handshake completed (RSN) 02.04.2015 09:28 Apr 2 09:28:09 hostapd: ath0: STA dc:9f:db:44:44:44 IEEE 802.11: associated 02.04.2015 09:28 Apr 2 09:28:09 hostapd: ath0: STA dc:9f:db:44:44:44 IEEE 802.11: disassociated 02.04.2015 09:28 Apr 2 09:28:09 hostapd: ath0: STA dc:9f:db:77:77:77 WPA: pairwise key handshake completed (RSN) 02.04.2015 09:28 Apr 2 09:28:09 hostapd: ath0: STA dc:9f:db:55:55:55 IEEE 802.11: associated 02.04.2015 09:28 Apr 2 09:28:09 hostapd: ath0: STA dc:9f:db:55:55:55 IEEE 802.11: disassociated 02.04.2015 09:28 Apr 2 09:28:09 hostapd: ath0: STA 00:27:22:66:66:66 WPA: pairwise key handshake completed (RSN) 02.04.2015 09:28 Apr 2 09:28:09 wireless: ath0 Registered node:DC:9F:DB:22:22:22 02.04.2015 09:28 Apr 2 09:28:09 wireless: ath0 Expired node:DC:9F:DB:22:22:22 02.04.2015 09:28 Apr 2 09:28:09 wireless: ath0 STA-TRAFFIC-STAT mac=dc:9f:db:22:22:22 rx_packets=640369 rx_bytes=59103156 tx_packets=1205460 tx_bytes=1606540900 02.04.2015 09:28 Apr 2 09:28:09 wireless: ath0 MLME-AUTH.indication(addr=dc:9f:db:22:22:22) 02.04.2015 09:28 Apr 2 09:28:09 hostapd: ath0: STA dc:9f:db:77:77:77 IEEE 802.11: associated 02.04.2015 09:28 Apr 2 09:28:09 hostapd: ath0: STA dc:9f:db:77:77:77 IEEE 802.11: disassociated 02.04.2015 09:28 Apr 2 09:28:09 hostapd: ath0: STA 00:27:22:66:66:66 IEEE 802.11: associated 02.04.2015 09:28 Apr 2 09:28:09 wireless: ath0 Registered node:DC:9F:DB:33:33:33 02.04.2015 09:28 Apr 2 09:28:09 wireless: ath0 Expired node:DC:9F:DB:33:33:33 02.04.2015 09:28 Apr 2 09:28:09 wireless: ath0 STA-TRAFFIC-STAT mac=dc:9f:db:33:33:33 rx_packets=68704 rx_bytes=5998364 tx_packets=79589 tx_bytes=16455833 02.04.2015 09:28 Apr 2 09:28:09 wireless: ath0 MLME-AUTH.indication(addr=dc:9f:db:33:33:33) 02.04.2015 09:28 Apr 2 09:28:09 wireless: ath0 Registered node:DC:9F:DB:44:44:44 02.04.2015 09:28 Apr 2 09:28:09 wireless: ath0 Expired node:DC:9F:DB:44:44:44 02.04.2015 09:28 Apr 2 09:28:09 wireless: ath0 STA-TRAFFIC-STAT mac=dc:9f:db:44:44:44 rx_packets=27180 rx_bytes=2369803 tx_packets=47646 tx_bytes=5307799 02.04.2015 09:28 Apr 2 09:28:09 wireless: ath0 MLME-AUTH.indication(addr=dc:9f:db:44:44:44) 02.04.2015 09:28 Apr 2 09:28:09 wireless: ath0 Registered node:DC:9F:DB:55:55:55 02.04.2015 09:28 Apr 2 09:28:09 wireless: ath0 Expired node:DC:9F:DB:55:55:55 02.04.2015 09:28 Apr 2 09:28:09 wireless: ath0 STA-TRAFFIC-STAT mac=dc:9f:db:55:55:55 rx_packets=460171 rx_bytes=152421436 tx_packets=497230 tx_bytes=377272561 02.04.2015 09:28 Apr 2 09:28:09 wireless: ath0 MLME-AUTH.indication(addr=dc:9f:db:55:55:55) 02.04.2015 09:28 Apr 2 09:28:09 wireless: ath0 Registered node:DC:9F:DB:77:77:77 02.04.2015 09:28 Apr 2 09:28:09 wireless: ath0 Expired node:DC:9F:DB:77:77:77 02.04.2015 09:28 Apr 2 09:28:09 wireless: ath0 STA-TRAFFIC-STAT mac=dc:9f:db:77:77:77 rx_packets=9220 rx_bytes=925890 tx_packets=32285 tx_bytes=11573320 02.04.2015 09:28 Apr 2 09:28:09 wireless: ath0 MLME-AUTH.indication(addr=dc:9f:db:77:77:77) 02.04.2015 09:28 Apr 2 09:28:09 wireless: ath0 Registered node:00:27:22:66:66:66 02.04.2015 09:28 Apr 2 09:28:09 wireless: ath0 Expired node:00:27:22:66:66:66 02.04.2015 09:28 Apr 2 09:28:09 wireless: ath0 STA-TRAFFIC-STAT mac=00:27:22:66:66:66 rx_packets=1007 rx_bytes=70884 tx_packets=24635 tx_bytes=2631118 02.04.2015 09:28 Apr 2 09:28:09 wireless: ath0 MLME-AUTH.indication(addr=00:27:22:66:66:66) 02.04.2015 09:28 Apr 2 09:28:09 hostapd: ath0: STA 00:27:22:66:66:66 IEEE 802.11: disassociated 02.04.2015 09:28 Apr 2 09:28:08 wireless: ath0 Scan request completed Инжектор питания заказали, но идти он будет долго. А постоянное дерганье Рокета меня уже задолбало до позеленения! Так на СМС разориться можно ведь! Вчера, например, в течении пяти минут два раза рушилась. Сегодня в 8 утра... А тут несколько дней вообще без косяков отработал. При чем трафиком под полку его не кладут. Проверял. Edited April 2, 2015 by Fat Tony Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
NewUse Posted April 2, 2015 · Report post лог пишется в syslogd? Если есть возможность: поставьте тупой свитч в разрыв между джунипером и рокетом. Подключитесь напрямую к этому свитчу и попробуйте по ssh достучаться до рокета... Что-то мне подсказывает, что рокет тут не при чём.... Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
Fat Tony Posted April 2, 2015 · Report post Подключитесь напрямую к этому свитчу и попробуйте по ssh достучаться до рокета... В разрыв стоит Cisco ME-3400, но там помещение не наше, там необслуживаемая БС LTE. На интерфейсе ошибок нет, вроде все ОК. GigabitEthernet0/2 is up, line protocol is up (connected) Hardware is Gigabit Ethernet, address is 001f.268a.6a02 (bia 001f.268a.6a02) Description: -- ........ -- MTU 9000 bytes, BW 1000000 Kbit/sec, DLY 10 usec, reliability 255/255, txload 1/255, rxload 1/255 Encapsulation ARPA, loopback not set Keepalive not set Full-duplex, 1000Mb/s, link type is auto, media type is 10/100/1000BaseTX SFP input flow-control is off, output flow-control is unsupported ARP type: ARPA, ARP Timeout 04:00:00 Last input 00:00:26, output 00:18:18, output hang never Last clearing of "show interface" counters never Input queue: 0/75/0/0 (size/max/drops/flushes); Total output drops: 0 Queueing strategy: fifo Output queue: 0/40 (size/max) 5 minute input rate 603000 bits/sec, 626 packets/sec 5 minute output rate 7702000 bits/sec, 916 packets/sec 86367180 packets input, 22828085606 bytes, 0 no buffer Received 80543 broadcasts (48965 multicasts) 0 runts, 0 giants, 0 throttles 0 input errors, 0 CRC, 0 frame, 0 overrun, 0 ignored 0 watchdog, 48965 multicast, 0 pause input 0 input packets with dribble condition detected 118130007 packets output, 116263522687 bytes, 0 underruns 0 output errors, 0 collisions, 1 interface resets 1399 unknown protocol drops 0 babbles, 0 late collision, 0 deferred 0 lost carrier, 0 no carrier, 0 pause output 0 output buffer failures, 0 output buffers swapped out Если ставить тупой свитч, то надо гигабитный тупой свитч. Хотя, мне иногда кажется, что Рокет иногда имеет мозг с согласованием скоростей и дуплекса... Если по телнету не достукивается и пинга нет в момент пропадания, то, думаю, пытаться по ssh подключаться тоже не вариант. лог пишется в syslogd? Да, конечно же пишется. Но в нем ничего криминального нет. Только старт инициализации, процессы хендшейка и все. То бишь ничего не говорит от том, что где-то имеется неисправность и т.п. Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
NewUse Posted April 2, 2015 · Report post Если ставить тупой свитч, то надо гигабитный тупой свитч. Хотя, мне иногда кажется, что Рокет иногда имеет мозг с согласованием скоростей и дуплекса... кстати, на циско же можно принудительно установить порт в 100Мбит? попробуйте... Да, конечно же пишется. имелось ввиду на удалённую иашину.... Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
Fat Tony Posted April 2, 2015 · Report post можно принудительно установить порт в 100Мбит? Да, конечно. Это тоже в обязку буду пробовать. Тем более, что в настройках LAN Рокета нет принудительного 1000-фулл. имелось ввиду на удалённую иашину.... Да, на сислог-сервер в офисе все пишется Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
dronis3 Posted April 2, 2015 · Report post Бывает еще пакетами проц. заваливает и она перезагружается. Зарежьте торренты всем. Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
Fat Tony Posted April 2, 2015 · Report post Бывает еще пакетами проц. заваливает Это, кстати, мысль. Спасибо! Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
Fat Tony Posted April 14, 2015 · Report post Разобрался... Проблема была в некорректной работе алгоритма autonegotiation на Ubiquiti Rocket Titanium M5. Эта хреновина была включена в гигабитный порт сначала Джунипера ЕХ2200, затем в Цискин 3400 гигабитный интерфейс. Ни автосогласование скоростей, ни принудительное включение портов в 1000 full не помогало. Вот поэтому при проявлении данной проблемы порты были в "апе", но на циске/джуне sho int всегда показывал 1000_FULL, а на рокете уже было не посмотреть. Интересно, что на Рокете нет принудительной установки порта в 1000. Только авто, 100 и 10. Помогло переключение кабелизмы с Рокета в FastEthernet порт с принудиловкой на 100_FULL с обоих сторон. Четверо суток полет нормальный. Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...