Jump to content
Калькуляторы

Самопроизвольная перезагрузка Rocket M5 Titanium GPS

Добрый день, коллеги!

Нужна ваша помощь...

Досталась в наследство сеть из БС на Рокет М5 Титаниум и четыре абонентских точки на Нанобридж М5.

За абонентскими точками стоят управляемые коммутаторами, управление и абонентский трафик разнесены по разным вланам, при чем каждая клиентская станция в своем абонентском влане + фильтрация и сегментация трафика на портах управляемых ДЛинк, дабы избежать нагрузки радиосети широковещанием. Сеть - РРРоЕ. Клиентов-физлиц за железом всей сети около 80.

 

Вроде все работало великолепно, пока не образовалась сильная помеха на нашей частоте. После анализа спектра Airview перешел на другую частоту, перенастроил клиентские станции. Перекос трафика пропал, модуляции восстановились, канальные скорости поднялись. Уровни станций примерно сравнял.

 

Вопрос в том, что Рокет М5 периодически по непонятным причинам виснет наглухо, помогает только ребут по питанию (для этих целей поставил СМС-розетку на БС). Гигабитным портом Рокет включена в порт гигабитного коммутатора Джунипер, РОЕ инжектор питания включен в гарантированную розетку, на которой всегда есть 220В.

 

Вот например за последние три дня:

 

17 марта в 02:44 и в 11:44

18 марта в 20:03

19 марта в 12:37

 

Прошивки всего оборудования 5.5.10. Всех низкокачественных клиентов пересадил на отдельные мостовые линки, прописал АСL по МАС на БС, поменял пароли (думал, кто-нибудь из старых хозяев ползает).

 

Настроено логирование, но по логам с БС и других станций ничего криминального не видно.

post-115146-033330300 1426755403_thumb.jpg

post-115146-051551200 1426755415_thumb.jpg

post-115146-075355400 1426755419_thumb.jpg

post-115146-032811400 1426755424_thumb.jpg

post-115146-011695700 1426755428_thumb.jpg

post-115146-039992800 1426755432_thumb.jpg

Share this post


Link to post
Share on other sites

Вопрос в том, что Рокет М5 периодически по непонятным причинам виснет наглухо

Если включить вотчдог на рокете будет ребутиться ?

Для начала в 20Мгц перейти.

Share this post


Link to post
Share on other sites

, РОЕ инжектор питания включен в гарантированную розетку, на которой всегда есть 220В.

Длинна линии питания? Другой патч пробовали? Софт или кнопочный резет не помогает, или не проходит вообще? Я бы рекомендовал такое: перешить прошивку на столе, временно заменить патч на максимально короткий с новым БП. Если не помогло, то снять и проверить на отдельной линии на старой частоте, ежели всё заработает, значит скорее всего замена усилков(80%) или радиочипа(15%).

Share this post


Link to post
Share on other sites

Переход на 20 МГц не помогал. Проверял уже.

Получил логи с джунипера, похоже BPDU прилетает откуда-то...Mar 19 12:36:29.180 2015 eswd[1017]: ESWD_STP_STATE_CHANGE_INFO: STP state for interface ge-0/0/2.0 context id 1 changed from FORWARDING to BLOCKING

 

и рокет не виснет, а тупо лочится порт на джуне. А когда я посредством СМС розетки ребутаю рокета, порт восстанавливается снова в форвардинг...

 

епрст... откуда что прилетает. надо разбираться!

 

, РОЕ инжектор питания включен в гарантированную розетку, на которой всегда есть 220В.

Длинна линии питания? Другой патч пробовали? Софт или кнопочный резет не помогает, или не проходит вообще? Я бы рекомендовал такое: перешить прошивку на столе, временно заменить патч на максимально короткий с новым БП. Если не помогло, то снять и проверить на отдельной линии на старой частоте, ежели всё заработает, значит скорее всего замена усилков(80%) или радиочипа(15%).

 

Патч проверенный, длина 12 метров. БП новый. Антенна полностью в сборе есть еще для этой хренотени.

 

Но, похоже, проблема где-то в топологии сети. Как я уже писал - BPDU похоже на гигабитник джунипера прилетает с радио

Share this post


Link to post
Share on other sites

и рокет не виснет, а тупо лочится порт на джуне.

Семен Семеныч (с)

Share this post


Link to post
Share on other sites

Тема продолжается...

 

Устранили косяки с STP. В логах на порту все чисто, но рокет продолжает периодически "виснуть".

МАС-и на аплинк-порту не ходят, смотрел, хотя порт и в апе...

 

Помогает только перезагрузка.

Edited by Fat Tony

Share this post


Link to post
Share on other sites

Если свич стоит какой до БС рокета попробовать его сменить и отключить на БС логи на время.

Share this post


Link to post
Share on other sites

4 дня без проблем и замечаний все отработало и на тебе!

 

Самое интересное в том, что ни в логах БС, ни в логах клиентских станций, ни на syslog-сервере никаких косяков не отмечается. Просто восстановление интерфейсов и ВСЕ. Уже не знаю, на что и грешить...

 

Если свич стоит какой до БС рокета попробовать его сменить и отключить на БС логи на время.

 

свитч не поменять, на нем трафик ЛТЕ ходит, он нормально пашет.

 

Логи, кстати и на БС и на всех клиентских станциях включены.

Share this post


Link to post
Share on other sites

А как там питание 220в работает? Есть блок питание с 1а еще одно запасное что бы сменить на время? И свич промежуточный для теста поставить между бс и (LTE свич). Заземляемый первый свич?

Share this post


Link to post
Share on other sites

Есть блок питание с 1а

 

Вот уж не знаю, на что грешить... С питанием 220В там на базовой станции ЛТЕ/ГСМ все ОК. Гарантированное. Две ЛЭП/ДГА/АКБ. Заземление сделано по стандарту. Тут все четко. Пищеблока такого, ну то бишь инжектора питания, запасного нет. Но мне кажется, если б с питанием был косяк, рокет бы перезагружался, а в логах пусто... Просто старт системы и все. Хотя, кто ж его знает.

А, может, пик нагрузки приходит и эта херомантия тупо не вытягивает нагрузку и тухнет. А перезапуск посредством СМС розетки его оживляет.

Свитч попытаюсь поставить, но на объект попасть трудно.

 

Лог после рестарта вручную посредством СМС-розетки:

 

System Log

Oct 01 21:41:14 system: Start

Oct 1 21:41:14 syslogd started: BusyBox v1.11.2

Oct 1 21:41:14 FileSystem: Start check...

Oct 1 21:41:14 wireless: ath0 Set Mode:Master

Mar 23 14:32:44 dropbear[681]: Not backgrounding

Mar 23 14:32:47 FileSystem: End check.

Mar 23 14:32:48 ac-agent: Pinging 'http://111.222.333.444:9080/heartbeat/'...

Mar 23 14:32:48 ac-agent: done.

Mar 23 14:32:48 wireless: ath0 MLME-AUTH.indication(addr=dc:9f:db:xx:xx:xx)

Mar 23 14:32:48 wireless: ath0 Registered node:DC:9F:DB:XX:XX:XX

Mar 23 14:32:48 wireless: ath0 MLME-AUTH.indication(addr=dc:9f:db:xx:xx:xx)

Mar 23 14:32:48 wireless: ath0 MLME-AUTH.indication(addr=dc:9f:db:xx:xx:xx)

Mar 23 14:32:48 wireless: ath0 Registered node:DC:9F:DB:XX:XX:XX

Mar 23 14:32:48 wireless: ath0 Registered node:DC:9F:DB:XX:XX:XX

Mar 23 14:32:49 hostapd: ath0: STA dc:9f:db:xx:xx:xx IEEE 802.11: associated

Mar 23 14:32:49 hostapd: ath0: STA dc:9f:db:xx:xx:xx IEEE 802.11: associated

Mar 23 14:32:49 hostapd: ath0: STA dc:9f:db:xx:xx:xx IEEE 802.11: associated

Mar 23 14:32:49 hostapd: ath0: STA dc:9f:db:xx:xx:xx WPA: pairwise key handshake completed (RSN)

Mar 23 14:32:49 hostapd: ath0: STA dc:9f:db:xx:xx:xx WPA: pairwise key handshake completed (RSN)

Mar 23 14:32:49 hostapd: ath0: STA dc:9f:db:xx:xx:xx WPA: pairwise key handshake completed (RSN)

Mar 23 14:32:49 dropbear[704]: Child connection from 111.222.333.444:23277

Mar 23 14:32:50 dropbear[704]: Pubkey auth succeeded for 'mcuser' with key md5 b5:42:85:ba:61:37:ce:4f:aa:6e:f3:12:ee:99:a9:71 from 111.222.333.444:23277

Mar 23 14:32:51 dropbear[707]: Child connection from 111.222.333.444:23297

Mar 23 14:32:51 dropbear[707]: Exit before auth: Exited normally

Mar 23 14:32:53 dropbear[704]: Exit (mcuser): Exited normally

 

На сислог-сервере аналогичные сообщения.

Share this post


Link to post
Share on other sites

Замените устройство, которое виснет.

Глухого виса, связаного с софтовыми проблемами, в этой серии не может быть, т.к. там - аппаратный watchdog, и он перезагрузит в случае чего устройство.

Если есть глухой вис - ищите сугубо аппаратную проблему. Обычно это питание или дефект устройства.

Легче заменить кабель+poe+точку доступа, чем мучаться и искать проблему по-отдельности за несколько заходов на узел.

Share this post


Link to post
Share on other sites
' timestamp='1427131773' post=1103121]

Глухого виса, связаного с софтовыми проблемами, в этой серии не может быть, т.к. там - аппаратный watchdog, и он перезагрузит в случае чего устройство.

 

 

Добрый день!

 

Опять подымаю тему...

 

Пробовал поработать с включенным watchdog-ом. Результат отрицательный. В логе циски МЕ-3400, которую воткнул в разрыв между Джунипером и Рокетом ничего криминального нет, BPDU не ловлю, порт по ерродизейбл не лочится, постоянно в апе. Но вот ни одного МАСа на порту нет. Попытки пинга отрицательны.

Ждал когда же вотчдог ребутнет Рокета и все заработает, но хрен там. Судя по логам и веб-морде точки, точка ребутится вотчдогом, но трафик не восстанавливается, пока СМС-розеткой по питанию не ребутнешь. Потом на веб-морде баннер висит - точка была ребутнута, вот вам саппорт-инфо.

 

О! Кстати, кто-нить знает, чем можно саппорт-инфо посмотреть?

 

Логи с циски МЕ-3400

 

*Apr 2 08:00:37.142: %LINEPROTO-5-UPDOWN: Line protocol on Interface GigabitEthernet0/2, changed state to down

*Apr 2 08:00:38.149: %LINK-3-UPDOWN: Interface GigabitEthernet0/2, changed state to down

*Apr 2 08:01:07.014: %LINK-3-UPDOWN: Interface GigabitEthernet0/2, changed state to up

*Apr 2 08:01:08.021: %LINEPROTO-5-UPDOWN: Line protocol on Interface GigabitEthernet0/2, changed state to up

*Apr 2 08:01:10.462: %LINEPROTO-5-UPDOWN: Line protocol on Interface GigabitEthernet0/2, changed state to down

*Apr 2 08:01:11.468: %LINK-3-UPDOWN: Interface GigabitEthernet0/2, changed state to down

*Apr 2 08:01:36.928: %LINK-3-UPDOWN: Interface GigabitEthernet0/2, changed state to up

*Apr 2 08:01:37.934: %LINEPROTO-5-UPDOWN: Line protocol on Interface GigabitEthernet0/2, changed state to up

 

 

логи с Рокета

 

02.04.2015 09:28 Apr 2 04:28:09 wpa-supplicant: CTRL-EVENT-CONNECTED - Connection to 04:18:d6:11:11:11 completed (reauth) [id=0 id_str=]

02.04.2015 09:28 Apr 2 04:28:09 wpa-supplicant: WPA: Key negotiation completed with 04:18:d6:11:11:11 [PTK=CCMP GTK=CCMP]

02.04.2015 09:28 Apr 2 04:28:09 wpa-supplicant: Associated with 04:18:d6:11:11:11

02.04.2015 09:28 Apr 2 09:28:09 hostapd: ath0: STA dc:9f:db:22:22:22 WPA: pairwise key handshake completed (RSN)

02.04.2015 09:28 Apr 2 09:28:09 hostapd: ath0: STA dc:9f:db:33:33:33 WPA: pairwise key handshake completed (RSN)

02.04.2015 09:28 Apr 2 09:28:09 hostapd: ath0: STA dc:9f:db:22:22:22 IEEE 802.11: associated

02.04.2015 09:28 Apr 2 09:28:09 hostapd: ath0: STA dc:9f:db:22:22:22 IEEE 802.11: disassociated

02.04.2015 09:28 Apr 2 09:28:09 hostapd: ath0: STA dc:9f:db:33:33:33 IEEE 802.11: associated

02.04.2015 09:28 Apr 2 09:28:09 hostapd: ath0: STA dc:9f:db:44:44:44 WPA: pairwise key handshake completed (RSN)

02.04.2015 09:28 Apr 2 09:28:09 hostapd: ath0: STA dc:9f:db:33:33:33 IEEE 802.11: disassociated

02.04.2015 09:28 Apr 2 09:28:09 hostapd: ath0: STA dc:9f:db:55:55:55 WPA: pairwise key handshake completed (RSN)

02.04.2015 09:28 Apr 2 09:28:09 hostapd: ath0: STA dc:9f:db:44:44:44 IEEE 802.11: associated

02.04.2015 09:28 Apr 2 09:28:09 hostapd: ath0: STA dc:9f:db:44:44:44 IEEE 802.11: disassociated

02.04.2015 09:28 Apr 2 09:28:09 hostapd: ath0: STA dc:9f:db:77:77:77 WPA: pairwise key handshake completed (RSN)

02.04.2015 09:28 Apr 2 09:28:09 hostapd: ath0: STA dc:9f:db:55:55:55 IEEE 802.11: associated

02.04.2015 09:28 Apr 2 09:28:09 hostapd: ath0: STA dc:9f:db:55:55:55 IEEE 802.11: disassociated

02.04.2015 09:28 Apr 2 09:28:09 hostapd: ath0: STA 00:27:22:66:66:66 WPA: pairwise key handshake completed (RSN)

02.04.2015 09:28 Apr 2 09:28:09 wireless: ath0 Registered node:DC:9F:DB:22:22:22

02.04.2015 09:28 Apr 2 09:28:09 wireless: ath0 Expired node:DC:9F:DB:22:22:22

02.04.2015 09:28 Apr 2 09:28:09 wireless: ath0 STA-TRAFFIC-STAT

mac=dc:9f:db:22:22:22

rx_packets=640369

rx_bytes=59103156

tx_packets=1205460

tx_bytes=1606540900

02.04.2015 09:28 Apr 2 09:28:09 wireless: ath0 MLME-AUTH.indication(addr=dc:9f:db:22:22:22)

02.04.2015 09:28 Apr 2 09:28:09 hostapd: ath0: STA dc:9f:db:77:77:77 IEEE 802.11: associated

02.04.2015 09:28 Apr 2 09:28:09 hostapd: ath0: STA dc:9f:db:77:77:77 IEEE 802.11: disassociated

02.04.2015 09:28 Apr 2 09:28:09 hostapd: ath0: STA 00:27:22:66:66:66 IEEE 802.11: associated

02.04.2015 09:28 Apr 2 09:28:09 wireless: ath0 Registered node:DC:9F:DB:33:33:33

02.04.2015 09:28 Apr 2 09:28:09 wireless: ath0 Expired node:DC:9F:DB:33:33:33

02.04.2015 09:28 Apr 2 09:28:09 wireless: ath0 STA-TRAFFIC-STAT

mac=dc:9f:db:33:33:33

rx_packets=68704

rx_bytes=5998364

tx_packets=79589

tx_bytes=16455833

02.04.2015 09:28 Apr 2 09:28:09 wireless: ath0 MLME-AUTH.indication(addr=dc:9f:db:33:33:33)

02.04.2015 09:28 Apr 2 09:28:09 wireless: ath0 Registered node:DC:9F:DB:44:44:44

02.04.2015 09:28 Apr 2 09:28:09 wireless: ath0 Expired node:DC:9F:DB:44:44:44

02.04.2015 09:28 Apr 2 09:28:09 wireless: ath0 STA-TRAFFIC-STAT

mac=dc:9f:db:44:44:44

rx_packets=27180

rx_bytes=2369803

tx_packets=47646

tx_bytes=5307799

02.04.2015 09:28 Apr 2 09:28:09 wireless: ath0 MLME-AUTH.indication(addr=dc:9f:db:44:44:44)

02.04.2015 09:28 Apr 2 09:28:09 wireless: ath0 Registered node:DC:9F:DB:55:55:55

02.04.2015 09:28 Apr 2 09:28:09 wireless: ath0 Expired node:DC:9F:DB:55:55:55

02.04.2015 09:28 Apr 2 09:28:09 wireless: ath0 STA-TRAFFIC-STAT

mac=dc:9f:db:55:55:55

rx_packets=460171

rx_bytes=152421436

tx_packets=497230

tx_bytes=377272561

02.04.2015 09:28 Apr 2 09:28:09 wireless: ath0 MLME-AUTH.indication(addr=dc:9f:db:55:55:55)

02.04.2015 09:28 Apr 2 09:28:09 wireless: ath0 Registered node:DC:9F:DB:77:77:77

02.04.2015 09:28 Apr 2 09:28:09 wireless: ath0 Expired node:DC:9F:DB:77:77:77

02.04.2015 09:28 Apr 2 09:28:09 wireless: ath0 STA-TRAFFIC-STAT

mac=dc:9f:db:77:77:77

rx_packets=9220

rx_bytes=925890

tx_packets=32285

tx_bytes=11573320

02.04.2015 09:28 Apr 2 09:28:09 wireless: ath0 MLME-AUTH.indication(addr=dc:9f:db:77:77:77)

02.04.2015 09:28 Apr 2 09:28:09 wireless: ath0 Registered node:00:27:22:66:66:66

02.04.2015 09:28 Apr 2 09:28:09 wireless: ath0 Expired node:00:27:22:66:66:66

02.04.2015 09:28 Apr 2 09:28:09 wireless: ath0 STA-TRAFFIC-STAT

mac=00:27:22:66:66:66

rx_packets=1007

rx_bytes=70884

tx_packets=24635

tx_bytes=2631118

02.04.2015 09:28 Apr 2 09:28:09 wireless: ath0 MLME-AUTH.indication(addr=00:27:22:66:66:66)

02.04.2015 09:28 Apr 2 09:28:09 hostapd: ath0: STA 00:27:22:66:66:66 IEEE 802.11: disassociated

02.04.2015 09:28 Apr 2 09:28:08 wireless: ath0 Scan request completed

 

 

Инжектор питания заказали, но идти он будет долго. А постоянное дерганье Рокета меня уже задолбало до позеленения! Так на СМС разориться можно ведь! Вчера, например, в течении пяти минут два раза рушилась. Сегодня в 8 утра... А тут несколько дней вообще без косяков отработал.

При чем трафиком под полку его не кладут. Проверял.

post-115146-086061400 1427955201_thumb.jpg

Edited by Fat Tony

Share this post


Link to post
Share on other sites

лог пишется в syslogd?

Если есть возможность: поставьте тупой свитч в разрыв между джунипером и рокетом.

Подключитесь напрямую к этому свитчу и попробуйте по ssh достучаться до рокета...

Что-то мне подсказывает, что рокет тут не при чём....

Share this post


Link to post
Share on other sites

Подключитесь напрямую к этому свитчу и попробуйте по ssh достучаться до рокета...

 

В разрыв стоит Cisco ME-3400, но там помещение не наше, там необслуживаемая БС LTE.

 

На интерфейсе ошибок нет, вроде все ОК.

 

 

GigabitEthernet0/2 is up, line protocol is up (connected)

Hardware is Gigabit Ethernet, address is 001f.268a.6a02 (bia 001f.268a.6a02)

Description: -- ........ --

MTU 9000 bytes, BW 1000000 Kbit/sec, DLY 10 usec,

reliability 255/255, txload 1/255, rxload 1/255

Encapsulation ARPA, loopback not set

Keepalive not set

Full-duplex, 1000Mb/s, link type is auto, media type is 10/100/1000BaseTX SFP

input flow-control is off, output flow-control is unsupported

ARP type: ARPA, ARP Timeout 04:00:00

Last input 00:00:26, output 00:18:18, output hang never

Last clearing of "show interface" counters never

Input queue: 0/75/0/0 (size/max/drops/flushes); Total output drops: 0

Queueing strategy: fifo

Output queue: 0/40 (size/max)

5 minute input rate 603000 bits/sec, 626 packets/sec

5 minute output rate 7702000 bits/sec, 916 packets/sec

86367180 packets input, 22828085606 bytes, 0 no buffer

Received 80543 broadcasts (48965 multicasts)

0 runts, 0 giants, 0 throttles

0 input errors, 0 CRC, 0 frame, 0 overrun, 0 ignored

0 watchdog, 48965 multicast, 0 pause input

0 input packets with dribble condition detected

118130007 packets output, 116263522687 bytes, 0 underruns

0 output errors, 0 collisions, 1 interface resets

1399 unknown protocol drops

0 babbles, 0 late collision, 0 deferred

0 lost carrier, 0 no carrier, 0 pause output

0 output buffer failures, 0 output buffers swapped out

 

 

Если ставить тупой свитч, то надо гигабитный тупой свитч. Хотя, мне иногда кажется, что Рокет иногда имеет мозг с согласованием скоростей и дуплекса...

 

Если по телнету не достукивается и пинга нет в момент пропадания, то, думаю, пытаться по ssh подключаться тоже не вариант.

 

лог пишется в syslogd?

 

Да, конечно же пишется. Но в нем ничего криминального нет. Только старт инициализации, процессы хендшейка и все. То бишь ничего не говорит от том, что где-то имеется неисправность и т.п.

Share this post


Link to post
Share on other sites
Если ставить тупой свитч, то надо гигабитный тупой свитч. Хотя, мне иногда кажется, что Рокет иногда имеет мозг с согласованием скоростей и дуплекса...

кстати, на циско же можно принудительно установить порт в 100Мбит?

попробуйте...

Да, конечно же пишется.

имелось ввиду на удалённую иашину....

Share this post


Link to post
Share on other sites

можно принудительно установить порт в 100Мбит?

 

Да, конечно. Это тоже в обязку буду пробовать. Тем более, что в настройках LAN Рокета нет принудительного 1000-фулл.

 

 

имелось ввиду на удалённую иашину....

 

Да, на сислог-сервер в офисе все пишется

Share this post


Link to post
Share on other sites

Бывает еще пакетами проц. заваливает и она перезагружается. Зарежьте торренты всем.

Share this post


Link to post
Share on other sites

Бывает еще пакетами проц. заваливает

 

Это, кстати, мысль. Спасибо!

Share this post


Link to post
Share on other sites

Разобрался...

 

Проблема была в некорректной работе алгоритма autonegotiation на Ubiquiti Rocket Titanium M5.

Эта хреновина была включена в гигабитный порт сначала Джунипера ЕХ2200, затем в Цискин 3400 гигабитный интерфейс.

Ни автосогласование скоростей, ни принудительное включение портов в 1000 full не помогало.

 

Вот поэтому при проявлении данной проблемы порты были в "апе", но на циске/джуне sho int всегда показывал 1000_FULL, а на рокете уже было не посмотреть.

 

Интересно, что на Рокете нет принудительной установки порта в 1000. Только авто, 100 и 10.

 

Помогло переключение кабелизмы с Рокета в FastEthernet порт с принудиловкой на 100_FULL с обоих сторон.

 

Четверо суток полет нормальный.

post-115146-046701600 1428984587_thumb.jpg

Share this post


Link to post
Share on other sites

Create an account or sign in to comment

You need to be a member in order to leave a comment

Create an account

Sign up for a new account in our community. It's easy!

Register a new account

Sign in

Already have an account? Sign in here.

Sign In Now
Sign in to follow this