delphivcl Опубликовано 16 июня, 2014 Коллеги, ситуация началась примерно пару дней назад и пока не могу отловить кто виноват. Суть следующая, абонент цепляется по IPOE, все у него работает, но периодически пропадает связь. линк не рвется. просто не идут никакие пакеты, ни пинги, ничего. зависание. само так же оживает и опять работает. вот со стороны cisco попытался пингануть абонента, кое как поймал такую ситуацию. начало - был затык, далее все ок. С его стороны аналогичная ситуация. Жалобы получи от десятка абонентов. всего пока около 100 одновременных сессий, только начали подключать. железо абонов подключается через длинки DES-3200-52 ISG_BRAS_1#ping vrf INET ip 46.*.*.* repeat 1000 Type escape sequence to abort. Sending 1000, 100-byte ICMP Echos to 46.*.*.*, timeout is 2 seconds: ...........!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! !!!!!!!!!!!!!!!!!!!! ISG_BRAS_1#sh ver Cisco IOS XE Software, Version 03.11.00.S - Standard Support Release Cisco IOS Software, ASR1000 Software (PPC_LINUX_IOSD-ADVENTERPRISE-M), Version 15.4(1)S, RELEASE SOFTWARE (fc2) ISG_BRAS_1 uptime is 8 weeks, 5 days, 21 hours, 44 minutes Uptime for this control processor is 8 weeks, 5 days, 21 hours, 48 minutes только-только запущено! Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
elyor Опубликовано 16 июня, 2014 (изменено) проверьте по пути все мак таблицы. либо записи пропадают, либо срок хранения маленький. у меня бывало такое, только с дсламами. это первое, что приходит в голову. Изменено 16 июня, 2014 пользователем elyor Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
delphivcl Опубликовано 16 июня, 2014 спасибо, проверю! Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
delphivcl Опубликовано 16 июня, 2014 настройка порта: interface TenGigabitEthernet0/1/0.700 description Abonents Vlan700 encapsulation dot1Q 700 ip vrf forwarding INET ip dhcp relay information trusted ip dhcp relay information policy-action keep ip unnumbered Loopback700 arp timeout 60 service-policy type control DHCP-Subscriber ip subscriber l2-connected initiator dhcp class-aware ISG_BRAS_1#sh int TenGigabitEthernet0/1/0.700 TenGigabitEthernet0/1/0.700 is up, line protocol is up Hardware is SPA-1X10GE-L-V2, address is acf2.c5a6.3e10 (bia acf2.c5a6.3e10) Description: Abonents Vlan700 Interface is unnumbered. Using address of Loopback700 (46.*.*.*) MTU 1500 bytes, BW 10000000 Kbit/sec, DLY 10 usec, reliability 255/255, txload 1/255, rxload 1/255 Encapsulation 802.1Q Virtual LAN, Vlan ID 700. ARP type: ARPA, ARP Timeout 00:01:00 Keepalive not supported Last clearing of "show interface" counters never после изменения времени надо ли сессию у абона дропать? выставил 1 час через минуту словил очередной затык ISG_BRAS_1#ping vrf INET ip 46.*.*.* repeat 1000 Type escape sequence to abort. Sending 1000, 100-byte ICMP Echos to 46.*.*.*, timeout is 2 seconds: ...........!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! !!!!!!!!!!!!!!!!!!!! Success rate is 98 percent (989/1000), round-trip min/avg/max = 1/1/12 ms Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
mightyscv Опубликовано 16 июня, 2014 elyor Глупости. Даже если вы отключите весь mac-learning на коммутаторах, это не приведёт к отсутствию связи. К флуду чудовищному приведёт, но пакеты долетать до абонента будут. delphivcl Я бы посмотрел в сторону ARP-записей в момент проблемы. Очень похоже, что она истекает, и не обновляется корректно. Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
DVM-Avgoor Опубликовано 16 июня, 2014 А зачем arp-timeout 60? Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
delphivcl Опубликовано 16 июня, 2014 К моему сожалению, для меня все ново и постигаю самоучкой. Поэтому даже на вопрос зачем ответить не могу. по дефолту на интерфейсе насколько я помню 4 часа. эту строчку подкинули при написании конфига, и сути я особо ее не понимаю при ипое. возможно вообще не нужна она. буду благодарен за любые подсказки. Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
DVM-Avgoor Опубликовано 16 июня, 2014 Ну дак уберите попробуйте. Это вообще не хорошая привычка таймауты крутить на пустом месте. Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
delphivcl Опубликовано 16 июня, 2014 убрал я этот арп таймаут совсем. пока не помогло. так и затыкается. Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
elyor Опубликовано 16 июня, 2014 elyor Глупости. Даже если вы отключите весь mac-learning на коммутаторах, это не приведёт к отсутствию связи. К флуду чудовищному приведёт, но пакеты долетать до абонента будут. delphivcl Я бы посмотрел в сторону ARP-записей в момент проблемы. Очень похоже, что она истекает, и не обновляется корректно. я же написал, что у меня такое было с дсламами. я не утверждал, что это факт, что именно из-за этого проблема. я просто подкинул идею, куда копать. Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
delphivcl Опубликовано 17 июня, 2014 что удалось выяснить: подвисает примерно на 20 сек. периодичность раз в ~1 минуту. Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
DVM-Avgoor Опубликовано 17 июня, 2014 Вы совсем траблшутить не умеете. Подключите тестовый бук/комп как клиента, проверяйте. Прокиньте до клиента статикой интерфейс и проверяйте. А то у вас проблема "где-то" и вы ее даже локализовать не хотите. Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
pliskinsad Опубликовано 17 июня, 2014 А с stp не может быть проблем? Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
NikAlexAn Опубликовано 17 июня, 2014 А в сервисах какой таймаут указан? И какой DHCP Lease Time? Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
mightyscv Опубликовано 17 июня, 2014 я же написал, что у меня такое было с дсламами. я не утверждал, что это факт, что именно из-за этого проблема. я просто подкинул идею, куда копать. Да, и я назвал эту идею глупой, потому что она глупая. Вы увидели огонь, решили что это боги вам его послали, и теперь всем кто тоже видит огонь советуете копать в сторону богов. А то, что это молния дерево подожгла вы выяснить не осилили. И при чём тут ваши дсламы если у ТС сеть ethernet судя по описанию? Никогда не перепрыгивайте от базовой диагностики сразу к решению. delphivcl Ну посмотрите вы уже ARP-записи то для клиента в момент возникновения проблемы. Хотя бы одну версию сможете локализовать/отбросить. Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
delphivcl Опубликовано 17 июня, 2014 коллеги, спасибо всем. да сетка изернет на IPOE с арпами и всем прочим все ок. причину нашли. косяки на свитче DES3200-52. даже не на абонентских портах. снимаем его для изучения. сейчас все работает. с длинкам не дружу совсем и что там не так пока прокомментировать не могу. Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
DVM-Avgoor Опубликовано 17 июня, 2014 Очень странно. На коллизии маков не похоже, не используете мак-ип-порт биндинги? Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
pliskinsad Опубликовано 18 июня, 2014 Наверное на клиентских портах включен stp. Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
Олег Кривицкий Опубликовано 18 июня, 2014 (изменено) На клиентских портах на доступе какой-нить storm-control включен??? Изменено 18 июня, 2014 пользователем Олег Кривицкий Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
delphivcl Опубликовано 18 июня, 2014 при посещении это свитча выяснили следующее, в порт воткнут кабель с другого конца обрезан и голые жилы скручены замкнуты. стормы включены, но не ловят они эту шнягу. со слов техника там порт поднимается и падает. бинды не используем. Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
delphivcl Опубликовано 18 июня, 2014 на тестовом длинке протестили такую затычку - косяк повторяется. Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
Олег Кривицкий Опубликовано 18 июня, 2014 Коммутатор должен уметь loopback-detect, включите его на абонентских портах Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
delphivcl Опубликовано 18 июня, 2014 (изменено) спасибо, проверю. но насколько я помню - технари клялись что такое включено. проверил настройки. в длинке это было включено! Loopback Detection Global Settings Loopback Detection State Enabled и так же на всех абон портах. Изменено 18 июня, 2014 пользователем delphivcl Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
DVM-Avgoor Опубликовано 18 июня, 2014 Оно обнаруживает петлю не по одному кадру, сколько-то успевает пролететь. А дальше ваше "раз в минуту" это скорее всего таймаут восстановления loopdetection. Можете таймаут поболее поставить. Я так понимаю у вас не отдельный влан на каждого пользователя? Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
delphivcl Опубликовано 18 июня, 2014 Все верно, не отдельный. пока в тестовой эксплуатации 9 длинков. один влан на всех. на счет таймаута спасибо, значение аккурат совпадает. Отпишу технарям чтоб курили. Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...