Tftpsher Опубликовано 30 ноября, 2017 · Жалоба Добрый день, коллеги. Столкнулись с очень странной проблемой. Возможно, кто-то уже имел дело с этим и сможет помочь. Есть оптический 10G канал между оборудованием Cisco ASR9001 и Huawei NE40E-X16 На обеих сторонах канала порты в нормальном рабочем состоянии, счетчики ошибок на нуле, параметры вроде duplex, mtu и прочего согласованы. Обычная загрузка канала - 2.5 - 5 Gbit/s в сторону Huawei и 400-600 Mbit/s в сторону Cisco. Суть в том, что при увеличении трафика в сторону Huawei до 8 и более Gbit/s, на стороне Huawei начинает достаточно быстро расти счетчик Input CRC ошибок (примерно до 3.5 тысяч в момент времени). При этом на стороне Cisco все счетчики как и прежде на нуле. Пробовали менять оптические патч корды, модуль на стороне Cisco, протирали контакты. Ничего не помогло. Есть у кого-нибудь идеи на этот счет? Буду признателен. Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
v_r Опубликовано 30 ноября, 2017 · Жалоба CRC ошибки связанные с физикой растут пропорционально трафику, то есть если при 8G 3kpps ошибок то при 4G должно быть 1.5kpps. В случае роста ошибок с нуля до 3kpps начиная с какого-то уровня трафика то скорее всего это не CRC а input drops, то есть у Huawei вероятно не хватает буферов (или шины, я с Huawei не сталкивался). Проверьте выключен ли flow control control с обоих сторон на линке, перенести линк в другую карту или перегрузить ту в приходит которую линк. Но главное тут понять растут ли ошибки пропорционально трафику. Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
Tftpsher Опубликовано 1 декабря, 2017 · Жалоба На стороне Huawei в момент роста трафика можно увидеть следующую картину: Input: Unicast: 56339451111 packets, Multicast: 2435 packets Broadcast: 2 packets, JumboOctets: 0 packets CRC: 12525 packets, Symbol: 0 packets Overrun: 0 packets, InRangeLength: 0 packets LongPacket: 0 packets, Jabber: 0 packets, Alignment: 0 packets Fragment: 521 packets, Undersized Frame: 0 packets RxPause: 0 packets Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
passer Опубликовано 1 декабря, 2017 · Жалоба DDM на модулях что показывает? С обоих сторон, конечно Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
v_r Опубликовано 1 декабря, 2017 · Жалоба Tftpsher За сколько времени набежало 12525 CRC ошибок? Вы счетчики на интерфейсах сбрасывали? В системе статистики/мониторинга график ошибок рисуется? Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
Tftpsher Опубликовано 1 декабря, 2017 · Жалоба Всем спасибо за ответы. На самом деле я был не совсем внимательным и упустил очень важную деталь. При появлении трафика в сторону Huawei 8 Gbit/s и более, за один и тот же отрезок времени, на интерфейсе Huawei счетчик Input CRC увеличился на 3.6k ошибок и на интерфейсе ASR счетчик Total Output Drops увеличился на те же 3.6k ошибок. То есть теперь нужно понять что происходит на ASR в этот момент. Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
Tftpsher Опубликовано 1 декабря, 2017 · Жалоба v_r Скажите, пожалуйста, а как отключение flowcontrol может, в теории, повлиять на счетчик Input CRC на Huawei? Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
v_r Опубликовано 1 декабря, 2017 · Жалоба При включенном flow control наблюдал ошибки на прием на свитче (тип ошибок не помню, может и CRC), на ответной стороне (сервер с сетевой Intel) были output discards, такое было периодически в моменты большой загрузки CPU сервера, частично полечилось выключением flow control на сетевой сервера. Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
Tftpsher Опубликовано 4 декабря, 2017 · Жалоба Всем добрый день. Спасибо за советы. Решилось переключением канала в другой слот и отключением flow-control (хотя в новом порту и с flow-control ошибок не заметили) Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...