Jump to content
Калькуляторы

Extreme Stack x650+x480x-x480t перезагрузка и kernel oops

В сети используются коммутаторы Extreme, серии x480х, x480t, x650x в режиме stack.

Несколько раз самопроизвольно перезагружались, в логе только:

 

код

<Noti:EPM.UnexpctRebootDtect> Slot-2: Booting after System Failure.

<Noti:EPM.wd_warm_reset> Slot-2: Changing to watchdog warm reset mode

 

при выводе команды show debug system-dump

 

код

 

===============================================

Slot-2 system dump information

===============================================

core_dump_info storage: 8/3072 used [EMPTY]

failure: kernel oops

reason: Oops

time: Sun Aug 28 23:30:13 2011

where: Oops:0

$0 : z0=00000000 at=1000dc00 v0=00000080 v1=00000001

$4 : a0=80848014 a1=80847134 a2=00000001 a3=0001d732

$8 : t0=0001d732 t1=805cb638 t2=80890000 t3=80890000

$12: t4=80890000 t5=4c30b7f0 t6=00000000 t7=2abb8220

$16: s0=8ba80004 s1=00000000 s2=00000001 s3=8ba9921c

$20: s4=c3ec7ef0 s5=c3ec7ef0 s6=8f0e44a4 s7=00000000

$24: t8=00000000 t9=c39edbf0

$28: gp=808ce000 sp=808cfec8 s8=00000000 ra=c39edc20

Hi : 00000000

Lo : 3b9aca00

epc : c39edc24 _default_assert+0x34/0x40 [linux_bcm_diag_full] Tainted: P

Status: 1000dc02

Cause : 1080000c

808cfec8: 00000000 c3aa1464 c3aa0f70 00000498 c390d004 c390cf2c 81a061a0 00000002

808cfee8: 00313ee2 802715d0 00000013 c3c18ea0 00000200 00000000 c3ec7ef0 c3ec7ef0

808cff08: c3ec7ef0 00000001 c393a15c c3939fc8 81a067d8 8fc2ede0 00000000 c3aa48f8

808cff28: 00313ee2 390131c9 0001869f c3ec854c 00000000 00000000 8ba10600 00000000

808cff48: 00000000 00000001 00000022 80848014 80880000 80850000 80610000 c26085b0

808cff68: 00000000 00000001 805caef0 00000000 8027d0f0 8027d0f0 00000000 00000000

808cff88: 805e19c0 00000022 805e19c0 00000022 8ba10600 805e19f4 808a0000 8027d34c

808cffa8: 00000000 00000000 00000000 00000000 808cffd0 00000022 00000020 00004000

808cffc8: 80847c20 8021361c 00000000 00000000 00000000 00000000 00000000 00000000

808cffe8: 00000000 00000000 00000000 808ce000 805b5de8 80215790 1bad2bad 1bad2bad

808d0008: 1bad2bad 1bad2bad 1bad2bad 1bad2bad 1bad2bad 1bad2bad 1bad2bad 1bad2bad

808d0028: 1bad2bad 1bad2bad 1bad2bad 1bad2bad 1bad2bad 1bad2bad 1bad2bad 1bad2bad

808d0048: 1bad2bad 1bad2bad 1bad2bad 1bad2bad 1bad2bad 1bad2bad 1bad2bad 1bad2bad

808d0068: 1bad2bad 1bad2bad 1bad2bad 1bad2bad 1bad2bad 1bad2bad 1bad2bad 1bad2bad

808d0088: 1bad2bad 1bad2bad 1bad2bad 1bad2bad 1bad2bad 1bad2bad 1bad2bad 1bad2bad

808d00a8: 1bad2bad 1bad2bad 1bad2bad 1bad2bad 1bad2bad 1bad2bad 1bad2bad 1bad2bad

log: ... oc/esw/dma.c:1176

log: <1>CPU 0 Unable to handle kernel paging request at virtual address 00000000, epc == c39edc24, ra == c39edc20

Version #0 SMP Sat Mar 13 02:02:52 EST 2 by release-manager@sicily.extremen Release 2.6.28.9cougar

 

Call Trace:

@[<c39edc24>] _default_assert+0x34/0x40 [linux_bcm_diag_full]

@[<c390d004>] soc_dma_done_desc+0x1dc/0x208 [linux_bcm_diag_full]

@[<c393a15c>] soc_intr+0x1e0/0x2e4 [linux_bcm_diag_full]

@[<c26085b0>] gmodule_get+0x674/0x96c [linux_kernel_bde]

 

[<c390cf2c>] soc_dma_done_desc+0x104/0x208 [linux_bcm_diag_full]

[<802715d0>] tick_program_event+0x48/0x54

[<c3939fc8>] soc_intr+0x4c/0x2e4 [linux_bcm_diag_full]

[<8027d0f0>] handle_IRQ_event+0x78/0x124

[<8027d0f0>] handle_IRQ_event+0x78/0x124

[<8027d34c>] __do_IRQ+0x1b0/0x274

[<8021361c>] call_handle_irq+0x20/0x44

[<80215790>] do_IRQ+0x9c/0x15c

Build directory: /home/release-manager2/v12_4_1_7/summit_rmi

--------------------------------

Kernel Panic.

time: Sun Aug 28 23:30:15 2011

Reason: Fatal exception in interrupt

Caller: 0x8021a4e4 (die+0x154/0x15c)

Version #0 SMP Sat Mar 13 02:02:52 EST 2 by release-manager@sicily.extremen Release 2.6.28.9cougar

Build directory: /home/release-manager2/v12_4_1_7/summit_rmi

 

Может вылететь с ошибкой и ночью, и утром, и днем, то есть без привязки к пиковым часам...

Используется как ядро L2+L3. До этого почти год работал стабильно, новых фич не включали...

Кто-нибудь сталкивался с данной проблемой??

Share this post


Link to post
Share on other sites

Ошибка в коде, тебе прямая дорога к разработчикам. Может быть вызвано абсолютно чем угодно.

Share this post


Link to post
Share on other sites

Спасибо, понятно...

К разработчикам уже обратились, хотелось узнать- сталкивался ли кто-нибудь с подобным...

Share this post


Link to post
Share on other sites

Спасибо, понятно...

К разработчикам уже обратились, хотелось узнать- сталкивался ли кто-нибудь с подобным...

 

было такое, стек 460-48х + 450а-24х + 450-24х

раз в неделю ребут

разобрали и сделали стек на 460-48х + 460-48х

перезагрузок не наблюдаем но проблемы с обновлением ACL появились

Share this post


Link to post
Share on other sites

12.4.1.7? Ставьте 12.5 последний билд или 12.6

 

Согласен, 12.4.1.7 довольно старый. Обновите до 12.5.4 12.6.1 и проблема 100% решится.

Share this post


Link to post
Share on other sites

ОК, тогда вопрос, а стэк не развалится при обновлении прошивки? Как грамотно это провести?

Share this post


Link to post
Share on other sites

ОК, тогда вопрос, а стэк не развалится при обновлении прошивки? Как грамотно это провести?

ставте сразу 12.6.2

стек и все настройки сохраняются

Share this post


Link to post
Share on other sites

Create an account or sign in to comment

You need to be a member in order to leave a comment

Create an account

Sign up for a new account in our community. It's easy!

Register a new account

Sign in

Already have an account? Sign in here.

Sign In Now
Sign in to follow this