Tftpsher Posted November 30, 2017 Posted November 30, 2017 Добрый день, коллеги. Столкнулись с очень странной проблемой. Возможно, кто-то уже имел дело с этим и сможет помочь. Есть оптический 10G канал между оборудованием Cisco ASR9001 и Huawei NE40E-X16 На обеих сторонах канала порты в нормальном рабочем состоянии, счетчики ошибок на нуле, параметры вроде duplex, mtu и прочего согласованы. Обычная загрузка канала - 2.5 - 5 Gbit/s в сторону Huawei и 400-600 Mbit/s в сторону Cisco. Суть в том, что при увеличении трафика в сторону Huawei до 8 и более Gbit/s, на стороне Huawei начинает достаточно быстро расти счетчик Input CRC ошибок (примерно до 3.5 тысяч в момент времени). При этом на стороне Cisco все счетчики как и прежде на нуле. Пробовали менять оптические патч корды, модуль на стороне Cisco, протирали контакты. Ничего не помогло. Есть у кого-нибудь идеи на этот счет? Буду признателен. Вставить ник Quote
v_r Posted November 30, 2017 Posted November 30, 2017 CRC ошибки связанные с физикой растут пропорционально трафику, то есть если при 8G 3kpps ошибок то при 4G должно быть 1.5kpps. В случае роста ошибок с нуля до 3kpps начиная с какого-то уровня трафика то скорее всего это не CRC а input drops, то есть у Huawei вероятно не хватает буферов (или шины, я с Huawei не сталкивался). Проверьте выключен ли flow control control с обоих сторон на линке, перенести линк в другую карту или перегрузить ту в приходит которую линк. Но главное тут понять растут ли ошибки пропорционально трафику. Вставить ник Quote
Tftpsher Posted December 1, 2017 Author Posted December 1, 2017 На стороне Huawei в момент роста трафика можно увидеть следующую картину: Input: Unicast: 56339451111 packets, Multicast: 2435 packets Broadcast: 2 packets, JumboOctets: 0 packets CRC: 12525 packets, Symbol: 0 packets Overrun: 0 packets, InRangeLength: 0 packets LongPacket: 0 packets, Jabber: 0 packets, Alignment: 0 packets Fragment: 521 packets, Undersized Frame: 0 packets RxPause: 0 packets Вставить ник Quote
passer Posted December 1, 2017 Posted December 1, 2017 DDM на модулях что показывает? С обоих сторон, конечно Вставить ник Quote
v_r Posted December 1, 2017 Posted December 1, 2017 Tftpsher За сколько времени набежало 12525 CRC ошибок? Вы счетчики на интерфейсах сбрасывали? В системе статистики/мониторинга график ошибок рисуется? Вставить ник Quote
Tftpsher Posted December 1, 2017 Author Posted December 1, 2017 Всем спасибо за ответы. На самом деле я был не совсем внимательным и упустил очень важную деталь. При появлении трафика в сторону Huawei 8 Gbit/s и более, за один и тот же отрезок времени, на интерфейсе Huawei счетчик Input CRC увеличился на 3.6k ошибок и на интерфейсе ASR счетчик Total Output Drops увеличился на те же 3.6k ошибок. То есть теперь нужно понять что происходит на ASR в этот момент. Вставить ник Quote
Tftpsher Posted December 1, 2017 Author Posted December 1, 2017 v_r Скажите, пожалуйста, а как отключение flowcontrol может, в теории, повлиять на счетчик Input CRC на Huawei? Вставить ник Quote
v_r Posted December 1, 2017 Posted December 1, 2017 При включенном flow control наблюдал ошибки на прием на свитче (тип ошибок не помню, может и CRC), на ответной стороне (сервер с сетевой Intel) были output discards, такое было периодически в моменты большой загрузки CPU сервера, частично полечилось выключением flow control на сетевой сервера. Вставить ник Quote
Tftpsher Posted December 4, 2017 Author Posted December 4, 2017 Всем добрый день. Спасибо за советы. Решилось переключением канала в другой слот и отключением flow-control (хотя в новом порту и с flow-control ошибок не заметили) Вставить ник Quote
Recommended Posts
Join the conversation
You can post now and register later. If you have an account, sign in now to post with your account.