Jump to content
Калькуляторы

ASR1004 периодически уходит в оффлайн ESP-20

BGP/NAT/ISG. NAT outside на портченеле из 3-х интерфейсов, третий добавил недавно. Ошибки на интерфейсах портченела есть растут немного, но NOC аплинка утверждает что так и должно быть.

На 2.6.2. работало 3 года без проблем, потом стало падать через день. От трафика не зависит, чаще по утрам.

Софт сменил на 3.11.0 тоже самое, с resdundancy sso тоже самое.

 

Есть идеи?

Edited by denis_vid

Share this post


Link to post
Share on other sites

Что-то странный какой-то ответ "Ошибки есть, но так и должно быть"

Share this post


Link to post
Share on other sites

Согласен, но из песни слов не выкинешь, NOC очень крупного в Украине ISP ответил именно так.

Лог не сохранился, был локально в буфере. Вкратце - устройство в слоту F0 offline.

Со стороны ASR периодически растут счетчики input errors

Edited by denis_vid

Share this post


Link to post
Share on other sites

Кусок лога при переинициализации esp

 

%CPPHA-7-START: F0: cpp_ha: CPP 0 preparing image /tmp/sw/fp/0/0/fp/mount/usr/cpp/bin/qfp-ucode-esp10

%CPPHA-7-START: F0: cpp_ha: CPP 0 startup init image /tmp/sw/fp/0/0/fp/mount/usr/cpp/bin/qfp-ucode-esp10

%CPPHA-7-START: F0: cpp_ha: CPP 0 running init image /tmp/sw/fp/0/0/fp/mount/usr/cpp/bin/qfp-ucode-esp10

%CPPHA-7-READY: F0: cpp_ha: CPP 0 loading and initialization complete

%IOSXE-6-PLATFORM: F0: cpp_cp: Process CPP_PFILTER_EA_EVENT__API_CALL__REGISTER

Гугл говорит что не уменя одного такая проблема, но никакой конкретики.

Аппаратная проблема, нат или баг софта? все так же хз

Share this post


Link to post
Share on other sites
*Feb 20 03:44:40: %CPPHA-3-FAULT: F0: cpp_ha: CPP:0 desc:DPE7_CPE_CPE_DPE_INT_SET_0_LEAF_INT_INT_PHY_ERROR det:DRVR(interrupt) class:OTHER sev:FATAL id:1723 cppstate:STOPPED res1

*Feb 20 03:44:40: %CPPHA-3-FAULTCRASH: F0: cpp_ha: CPP 0 unresolved fault detected, initiating crash dump.

*Feb 20 03:44:40: %CPPHA-3-FAULT: F0: cpp_ha: CPP:0 desc:DPE7_CPE_CPE_DPE_DUI_LEAF_INT_INT_DUI_CHN0_DRAM_MBE det:DRVR(interrupt) class:MBE sev:FATAL id:1752 cppstate:STOPPED res1

*Feb 20 03:44:40: %CPPHA-3-FAULTCRASH: F0: cpp_ha: CPP 0 unresolved fault detected, initiating crash dump.

*Feb 20 03:44:40: %CPPDRV-6-INTR: F0: /tmp/sw/fp/0/0/fp/mount/usr/cpp/bin/cpp_driver[5498]: CPP10(0) Interrupt : Last 16 Interrupts Since Boot

*Feb 20 03:44:40: %CPPDRV-6-INTR: F0: /tmp/sw/fp/0/0/fp/mount/usr/cpp/bin/cpp_driver[5498]: CPP10(0) Interrupt : Feb 19 23:09:29.143484: :GAL_GAL_CSR_IPM_IF_GAL_IPM_IF_LEAF_INT

*Feb 20 03:44:40: %CPPDRV-6-INTR: F0: /tmp/sw/fp/0/0/fp/mount/usr/cpp/bin/cpp_driver[5498]: CPP10(0) Interrupt : Feb 20 03:44:40.642127: :DPE7_CPE_CPE_DPE_DUI_LEAF_INT_INT_DUI_

*Feb 20 03:44:40: %CPPDRV-6-INTR: F0: /tmp/sw/fp/0/0/fp/mount/usr/cpp/bin/cpp_driver[5498]: CPP10(0) Interrupt : Feb 20 03:44:40.648378: :HOT:DPE7_CPE_CPE_DPE_DUI_LEAF_INT_INT_

*Feb 20 03:44:40: %CPPDRV-6-INTR: F0: /tmp/sw/fp/0/0/fp/mount/usr/cpp/bin/cpp_driver[5498]: CPP10(0) Interrupt : Feb 20 03:44:40.750453: :HALT:DPE7_CPE_CPE_DPE_INT_SET_0_LEAF_I

*Feb 20 03:44:40: %CPPDRV-6-INTR: F0: /tmp/sw/fp/0/0/fp/mount/usr/cpp/bin/cpp_driver[5498]: CPP10(0) Interrupt : Feb 20 03:44:40.750453: :HALT:DPE7_CPE_CPE_DPE_DUI_LEAF_INT_INT

*Feb 20 03:44:40: %CPPDRV-6-INTR: F0: /tmp/sw/fp/0/0/fp/mount/usr/cpp/bin/cpp_driver[5498]: CPP10(0) Interrupt : Feb 20 03:44:40.750453: :HEDP_HED_HALTED_IN_63_0_LEAF_INT_INT_H

*Feb 20 03:44:40: %IOSXE-3-PLATFORM: F0: cpp_cdm: CPP crashed, core file /tmp/corelink/gate_ESP_0_cpp-mcplo-ucode_022014034440.core.gz

*Feb 20 03:44:41: %ASR1000_OIR-6-OFFLINECARD: Card (fp) offline in slot F0

*Feb 20 03:44:42: %CPPDRV-3-LOCKDOWN: F0: cpp_cp: CPP10(0) CPP Driver LOCKDOWN due to fatal error.

*Feb 20 03:44:42: %CPPOSLIB-3-ERROR_NOTIFY: F0: cpp_cp: cpp_cp encountered an error -Traceback= 1#73543aee5a930535254d36b78b7ade88 errmsg:D94C000+2160 cpp_common_os:E0A2000+B90

*Feb 20 03:44:48: %CPPDRV-3-LOCKDOWN: F0: fman_fp_image: CPP10(0) CPP Driver LOCKDOWN due to fatal error.

*Feb 20 03:44:48: %CPPOSLIB-3-ERROR_NOTIFY: F0: fman_fp_image: fman-fp encountered an error -Traceback= 1#184f000dfe360101068fcbd4648bd5f0 errmsg:D6B1000+2160 cpp_common_os:BE0

*Feb 20 03:45:11: %IOSXE-6-PLATFORM: F0: cpp_cdm: Shutting down CPP MDM while client(s) still connected

*Feb 20 03:45:11: %CPPHA-3-CDMDONE: F0: cpp_ha: CPP 0 microcode crashdump creation completed.

*Feb 20 03:45:11: %IOSXE-6-PLATFORM: F0: cpp_ha: Shutting down CPP MDM while client(s) still connected

*Feb 20 03:45:11: %IOSXE-6-PLATFORM: F0: cpp_ha: Shutting down CPP CDM while client(s) still connected

*Feb 20 03:45:12: %PMAN-3-PROCHOLDDOWN: F0: pman.sh: The process cpp_ha_top_level_server has been helddown (rc 69)

*Feb 20 03:45:12: %PMAN-3-PROCHOLDDOWN: F0: pman.sh: The process cpp_cdm_svr has been helddown (rc 69)

 

Chassis type: ASR1004

 

Slot Type State Insert time (ago)

--------- ------------------- --------------------- -----------------

0 ASR1000-SIP10 ok 20:46:53

1 ASR1000-SIP10 ok 20:46:53

1/0 SPA-10X1GE-V2 ok 20:44:57

1/1 SPA-1X10GE-L-V2 ok 20:44:56

R0 ASR1000-RP1 ok, active 20:46:53

F0 ASR1000-ESP20 ok, active 20:46:53

P0 ASR1004-PWR-AC ok 20:46:03

P1 ASR1004-PWR-AC ok 20:46:03

 

Slot CPLD Version Firmware Version

--------- ------------------- ---------------------------------------

0 09111601 12.2(33r)XNC

1 09111601 12.2(33r)XNC

R0 07062111 12.2(33r)XNC

F0 08041102 12.2(33r)XNC

 

asr1000rp1-adventerprisek9.02.06.02.122-33.XNF2.bin

 

Портченел разобрал, нат на физических интерфейсах

На этом же релизе и роммоне работало месяцами.

ESP на свалку?

Edited by denis_vid

Share this post


Link to post
Share on other sites

На 3.10.1 упало через 15 дней аптайма, но пару дней назад включал netwlow, пока отключил. ХЗ что думать

Share this post


Link to post
Share on other sites

А вот тут речь идёт про память на плате или саму плату? У меня например похоже что нечто подобное было с 3CXL

 

Т.е. я к тому, что можно её заменить или же меняется только вся плата целиком?

Share this post


Link to post
Share on other sites

на есп память внешняя.. на рп тоже.

 

вопрос где купить ) могу показать фото памяти есп10ого.. хотя зачем.. в интернете полно )

 

http://foto.mercatos.net/foto.v1/tId3O27Shb5W7tg25LXVWP5iY2ttOj6-dzTOvHNqqB9pNUNsaFq2qXyvU8xtve/Cisco-ASR1000ESP10_800x600.jpg

 

вон она справа.. 2 модуля.

Edited by zhenya`

Share this post


Link to post
Share on other sites

не подскажете совместимые модули памяти для ESP-20?

у нас похожая проблема - 1-2 раза в сутки перегружается ESP. в наличчии есть такие планки 2GB 2Rx8 PC2-4200N CL4-4-4, подойдут они?

Share this post


Link to post
Share on other sites

d0f409c2484a.jpg

 

подскажите помогла ли замена памяти в вашем случае ?

Share this post


Link to post
Share on other sites

подскажите помогла ли замена памяти в вашем случае ?

мы на эти веселые грабли наступили емнип дважды, правда с esp5, в итоге замена модулей памяти с работающего esp убитый не оживила, выкинули и поставили новые esp10 :-)

Edited by White_Alex

Share this post


Link to post
Share on other sites

Create an account or sign in to comment

You need to be a member in order to leave a comment

Create an account

Sign up for a new account in our community. It's easy!

Register a new account

Sign in

Already have an account? Sign in here.

Sign In Now
Sign in to follow this