kernel panic в шейпере

Zaqwr

Опубликовано 27 мая, 2011 · Жалоба

будет возможность, воспользуйся CONFIG_NETCONSOLE , скорее всего не весь вывод видно на экране

Поделиться сообщением

Ссылка на сообщение

Поделиться на других сайтах

Abram

Опубликовано 27 мая, 2011 · Жалоба

будет возможность, воспользуйся CONFIG_NETCONSOLE , скорее всего не весь вывод видно на экране

Использовал console=ttyS0,38400 и сливал нуль-модемным кабелем на соседний хост.

Поделиться сообщением

Ссылка на сообщение

Поделиться на других сайтах

sfstudio

Опубликовано 27 мая, 2011 · Жалоба

Сегодня наступил на ту же граблю после замены броадкома на igb...

В skbuff.h:

-#define NET_SKB_PAD max(32, L1_CACHE_BYTES)

+#define NET_SKB_PAD 16

Уже 3й час молотит.

2Abram я помниться тебе намекал на эти чудеса.

Поделиться сообщением

Ссылка на сообщение

Поделиться на других сайтах

nuclearcat

Опубликовано 30 мая, 2011 · Жалоба

Кажется решение где-то тут

http://marc.info/?t=130368495400001&r=1&w=2

Поделиться сообщением

Ссылка на сообщение

Поделиться на других сайтах

Abram

Опубликовано 30 мая, 2011 · Жалоба

nuclearcat,

Да, я видел, но как-то экспериментировать страшно уже :). Приедут новые железяки - буду пробовать (наверное, это будет уже в 3.0).

Поделиться сообщением

Ссылка на сообщение

Поделиться на других сайтах

zakachkin

Опубликовано 1 июня, 2011 · Жалоба

Последние 4 ядра меня мягко говоря шокируют... и куда подевалась бывалая стабильность??

Поделиться сообщением

Ссылка на сообщение

Поделиться на других сайтах

nuclearcat

Опубликовано 1 июня, 2011 · Жалоба

Хотите bleeding edge - ловите баги, помогайте.

Хотите стабильность - CentOS. Хотите поддержку и поменьше думать - CentOS + $$$ = RHEL.

Поделиться сообщением

Ссылка на сообщение

Поделиться на других сайтах

NiTr0

Опубликовано 2 июня, 2011 · Жалоба

Хотите стабильность - CentOS.

Помнится, в центоси и прочих красношапочьих продуктах с год назад с февраля по эдак май заполомали kvm (при загрузке гостя с ядром 2.6.32+ у гостя в самом начале падала кернел паника), и не шибко спешили чинить, а от багрепортов - отбивались (в шапке - мол, проблемы с гостями не наши) или игнорили (багзилла центоси).

Поделиться сообщением

Ссылка на сообщение

Поделиться на других сайтах

technolab

Опубликовано 17 июня, 2011 · Жалоба

Еще подозрения: bonding.

У меня падает именно с bounding'ом, на 38 и 39 - 100%, а вообще, похоже появилась проблема начиная с 36.

Поделиться сообщением

Ссылка на сообщение

Поделиться на других сайтах

cpulink

Опубликовано 19 июля, 2011 · Жалоба

Пробую 2.6.39.3 где вроде бы должно быть исправлено.... Стоит accel-ppp и openl2tpd. Падает вообще интересно.

Если используется коннтрак то падает так:

[  164.002622] BUG: unable to handle kernel NULL pointer dereference at           (null)
[  164.006602] IP: [<ffffffffa023ae7a>] __nf_conntrack_confirm+0x2ba/0x480 [nf_conntrack]
[  164.006602] PGD 11493c067 PUD 114f00067 PMD 0
[  164.006602] Oops: 0002 [#1] SMP
[  164.006602] last sysfs file: /sys/devices/virtual/net/ppp5/flags
[  164.006602] CPU 2
[  164.006602] Modules linked in: arc4 ecb ppp_mppe act_mirred act_ipt cls_u32 sch_ingress pptp gre l2tp_ppp pppox ppp_ged
[  164.006602]
[  164.006602] Pid: 0, comm: kworker/0:1 Not tainted 2.6.39-std-def-alt3 #1 ASUS RS100-E4/PI2/P5M2-M/RS100-E4
[  164.006602] RIP: 0010:[<ffffffffa023ae7a>]  [<ffffffffa023ae7a>] __nf_conntrack_confirm+0x2ba/0x480 [nf_conntrack]
[  164.006602] RSP: 0018:ffff88011fd03a50  EFLAGS: 00010202
[  164.006602] RAX: 0000000000006ea3 RBX: ffff88011fd14620 RCX: 0000000000000000
[  164.006602] RDX: 000000000000f790 RSI: 00000000afb7c786 RDI: ffffffffa0245600
[  164.006602] RBP: ffff88011fd03a90 R08: ffff880116b40000 R09: 0000000000004000
[  164.006602] R10: ffff88011fd14688 R11: 0000000000000001 R12: 0000000000000000
[  164.006602] R13: ffff880117160dc0 R14: ffffffff81a53100 R15: 0000000000009648
[  164.006602] FS:  0000000000000000(0000) GS:ffff88011fd00000(0000) knlGS:0000000000000000
[  164.006602] CS:  0010 DS: 0000 ES: 0000 CR0: 000000008005003b
[  164.006602] CR2: 0000000000000000 CR3: 0000000114e85000 CR4: 00000000000006e0
[  164.006602] DR0: 0000000000000000 DR1: 0000000000000000 DR2: 0000000000000000
[  164.006602] DR3: 0000000000000000 DR6: 00000000ffff0ff0 DR7: 0000000000000400
[  164.006602] Process kworker/0:1 (pid: 0, threadinfo ffff880118f0e000, task ffff880118f0c3c0)
[  164.006602] Stack:
[  164.006602]  ffffffff7bc8a3e2 0000400011830380 0000000000000001 ffff880117160dc0
[  164.006602]  ffff88011fd03b98 ffff88011fd14620 0000000000000002 ffff880118a7e000
[  164.006602]  ffff88011fd03b00 ffffffffa02aade8 ffff880118a7e000 0000000000000000
[  164.006602] Call Trace:
[  164.006602]  <IRQ>
[  164.006602]  [<ffffffffa02aade8>] ipv4_confirm+0x188/0x1c0 [nf_conntrack_ipv4]
[  164.006602]  [<ffffffff81377f84>] nf_iterate+0x84/0xa0
[  164.006602]  [<ffffffff8137f7a0>] ? ip_rcv+0x2f0/0x2f0
[  164.006602]  [<ffffffff81378016>] nf_hook_slow+0x76/0x120
[  164.006602]  [<ffffffff8137f7a0>] ? ip_rcv+0x2f0/0x2f0
[  164.006602]  [<ffffffff8137fa94>] ip_local_deliver+0x64/0x80
[  164.006602]  [<ffffffff8137f0e9>] ip_rcv_finish+0x119/0x3a0
[  164.006602]  [<ffffffff8137f6cd>] ip_rcv+0x21d/0x2f0
[  164.006602]  [<ffffffff8105231e>] ? try_to_wake_up+0xbe/0x420
[  164.006602]  [<ffffffff8135043c>] __netif_receive_skb+0x1bc/0x620
[  164.006602]  [<ffffffff81134fc5>] ? __kmalloc_node_track_caller+0x45/0x50
[  164.006602]  [<ffffffff8105269b>] ? wake_up_state+0xb/0x10
[  164.006602]  [<ffffffff81350c78>] netif_receive_skb+0x78/0x80
[  164.006602]  [<ffffffff8124884c>] ? is_swiotlb_buffer+0x3c/0x50
[  164.006602]  [<ffffffff81350db8>] napi_skb_finish+0x48/0x60
[  164.006602]  [<ffffffff81351255>] napi_gro_receive+0xc5/0xd0
[  164.006602]  [<ffffffffa01acb2f>] igb_poll+0x6df/0xb60 [igb]
[  164.006602]  [<ffffffff810477f2>] ? enqueue_task_fair+0x162/0x530
[  164.006602]  [<ffffffff81080378>] ? sched_clock_cpu+0xb8/0x110
[  164.006602]  [<ffffffff8107d6c1>] ? enqueue_hrtimer+0x31/0x80
[  164.006602]  [<ffffffff8135143c>] net_rx_action+0x10c/0x2c0
[  164.006602]  [<ffffffff810600e3>] __do_softirq+0xa3/0x1f0
[  164.006602]  [<ffffffff8140899c>] call_softirq+0x1c/0x30
[  164.006602]  [<ffffffff8100d285>] do_softirq+0x65/0xa0
[  164.006602]  [<ffffffff8105ff25>] irq_exit+0xa5/0xb0
[  164.006602]  [<ffffffff8100ca51>] do_IRQ+0x61/0xe0
[  164.006602]  [<ffffffff81400193>] common_interrupt+0x13/0x13
[  164.006602]  <EOI>
[  164.006602]  [<ffffffff810135c0>] ? mwait_idle+0xa0/0x1e0
[  164.006602]  [<ffffffff81403885>] ? atomic_notifier_call_chain+0x15/0x20
[  164.006602]  [<ffffffff8100afaf>] cpu_idle+0x5f/0xb0
[  164.006602]  [<ffffffff813f92a7>] start_secondary+0x193/0x198
[  164.006602] Code: 5e 41 5f c9 c3 0f 1f 40 00 0f b6 d2 44 0f b7 24 10 41 0f b7 f4 e9 a5 fd ff ff 0f 1f 80 00 00 00 00 4
[  164.006602]  89 01 0f 84 7d 01 00 00 49 bc 00 02 20 00 00 00 ad de 48 8d
[  164.006602] RIP  [<ffffffffa023ae7a>] __nf_conntrack_confirm+0x2ba/0x480 [nf_conntrack]
[  164.006602]  RSP <ffff88011fd03a50>
[  164.006602] CR2: 0000000000000000
[  165.331916] ---[ end trace fe09762b35aeb8e6 ]---
[  165.345740] Kernel panic - not syncing: Fatal exception in interrupt
[  165.364774] Pid: 0, comm: kworker/0:1 Tainted: G      D     2.6.39-std-def-alt3 #1
[  165.387445] Call Trace:
[  165.394775]  <IRQ>  [<ffffffff813fcecb>] panic+0x8c/0x199
[  165.410974]  [<ffffffff81401102>] oops_end+0xe2/0xf0
[  165.425848]  [<ffffffff81038913>] no_context+0xf3/0x260
[  165.441499]  [<ffffffff81038ba5>] __bad_area_nosemaphore+0x125/0x1e0
[  165.460531]  [<ffffffff81038c6e>] bad_area_nosemaphore+0xe/0x10
[  165.478264]  [<ffffffff81403650>] do_page_fault+0x300/0x4a0
[  165.494955]  [<ffffffff8133d807>] ? sk_reset_timer+0x17/0x30
[  165.511908]  [<ffffffff81389e3b>] ? inet_csk_reset_keepalive_timer+0x1b/0x20
[  165.533020]  [<ffffffff8138a225>] ? inet_csk_reqsk_queue_hash_add+0xf5/0x110
[  165.554134]  [<ffffffffa01ca543>] ? ipt_do_table+0x233/0x640 [ip_tables]
[  165.574203]  [<ffffffff81400455>] page_fault+0x25/0x30
[  165.589597]  [<ffffffffa023ae7a>] ? __nf_conntrack_confirm+0x2ba/0x480 [nf_conntrack]
[  165.613048]  [<ffffffffa02aade8>] ipv4_confirm+0x188/0x1c0 [nf_conntrack_ipv4]
[  165.634680]  [<ffffffff81377f84>] nf_iterate+0x84/0xa0
[  165.650072]  [<ffffffff8137f7a0>] ? ip_rcv+0x2f0/0x2f0
[  165.665463]  [<ffffffff81378016>] nf_hook_slow+0x76/0x120
[  165.681636]  [<ffffffff8137f7a0>] ? ip_rcv+0x2f0/0x2f0
[  165.697028]  [<ffffffff8137fa94>] ip_local_deliver+0x64/0x80
[  165.713979]  [<ffffffff8137f0e9>] ip_rcv_finish+0x119/0x3a0
[  165.730671]  [<ffffffff8137f6cd>] ip_rcv+0x21d/0x2f0
[  165.745544]  [<ffffffff8105231e>] ? try_to_wake_up+0xbe/0x420
[  165.762754]  [<ffffffff8135043c>] __netif_receive_skb+0x1bc/0x620
[  165.781007]  [<ffffffff81134fc5>] ? __kmalloc_node_track_caller+0x45/0x50
[  165.801338]  [<ffffffff8105269b>] ? wake_up_state+0xb/0x10
[  165.817772]  [<ffffffff81350c78>] netif_receive_skb+0x78/0x80
[  165.834983]  [<ffffffff8124884c>] ? is_swiotlb_buffer+0x3c/0x50
[  165.852714]  [<ffffffff81350db8>] napi_skb_finish+0x48/0x60
[  165.869406]  [<ffffffff81351255>] napi_gro_receive+0xc5/0xd0
[  165.886363]  [<ffffffffa01acb2f>] igb_poll+0x6df/0xb60 [igb]
[  165.903312]  [<ffffffff810477f2>] ? enqueue_task_fair+0x162/0x530
[  165.921562]  [<ffffffff81080378>] ? sched_clock_cpu+0xb8/0x110
[  165.939036]  [<ffffffff8107d6c1>] ? enqueue_hrtimer+0x31/0x80
[  165.956247]  [<ffffffff8135143c>] net_rx_action+0x10c/0x2c0
[  165.972939]  [<ffffffff810600e3>] __do_softirq+0xa3/0x1f0
[  165.989111]  [<ffffffff8140899c>] call_softirq+0x1c/0x30
[  166.005025]  [<ffffffff8100d285>] do_softirq+0x65/0xa0
[  166.020415]  [<ffffffff8105ff25>] irq_exit+0xa5/0xb0
[  166.035287]  [<ffffffff8100ca51>] do_IRQ+0x61/0xe0
[  166.049639]  [<ffffffff81400193>] common_interrupt+0x13/0x13
[  166.066591]  <EOI>  [<ffffffff810135c0>] ? mwait_idle+0xa0/0x1e0
[  166.084636]  [<ffffffff81403885>] ? atomic_notifier_call_chain+0x15/0x20
[  166.104707]  [<ffffffff8100afaf>] cpu_idle+0x5f/0xb0
[  166.119579]  [<ffffffff813f92a7>] start_secondary+0x193/0x198
[  166.136801] Rebooting in 30 seconds

И ребутается.

Убираю коннтрак (-j NOTRACK) падает так (2 раза похоже падает):

[  112.880465] ------------[ cut here ]------------
[  112.884431] kernel BUG at mm/slab.c:511!
[  112.884431] invalid opcode: 0000 [#1] SMP
[  112.884431] last sysfs file: /sys/devices/virtual/net/ppp18/flags
[  112.884431] CPU 2
[  112.884431] Modules linked in: act_mirred act_ipt cls_u32 sch_ingress arc4 ecb ppp_mppe pptp gre l2tp_ppp pppox ppp_ged
[  112.884431]
[  112.884431] Pid: 212, comm: kworker/2:1 Not tainted 2.6.39-std-def-alt3 #1 ASUS RS100-E4/PI2/P5M2-M/RS100-E4
[  112.884431] RIP: 0010:[<ffffffff8113551b>]  [<ffffffff8113551b>] free_block+0x17b/0x190
[  112.884431] RSP: 0018:ffff8801188cbd10  EFLAGS: 00010046
[  112.884431] RAX: ffffea0003ef5c60 RBX: ffff8801170f6a80 RCX: 0200000000000400
[  112.884431] RDX: ffff88011fd14620 RSI: ffff8801168bcc18 RDI: ffff88011fd14620
[  112.884431] RBP: ffff8801188cbd50 R08: 0000000000000000 R09: 000000000000002e
[  112.884431] R10: 0000000000000000 R11: 0000000000000000 R12: 000000000000000b
[  112.884431] R13: ffff8801168bcc18 R14: 0000000000000000 R15: ffffea0000000000
[  112.884431] FS:  0000000000000000(0000) GS:ffff88011fd00000(0000) knlGS:0000000000000000
[  112.884431] CS:  0010 DS: 0000 ES: 0000 CR0: 000000008005003b
[  112.884431] CR2: 00007f95ee1a7c80 CR3: 00000001166eb000 CR4: 00000000000006e0
[  112.884431] DR0: 0000000000000000 DR1: 0000000000000000 DR2: 0000000000000000
[  112.884431] DR3: 0000000000000000 DR6: 00000000ffff0ff0 DR7: 0000000000000400
[  112.884431] Process kworker/2:1 (pid: 212, threadinfo ffff8801188ca000, task ffff8801189ae2c0)
[  112.884431] Stack:
[  112.884431]  ffff88011fd14620 000000000000004c ffff8801188cbd70 ffff8801168bcc00
[  112.884431]  ffff8801170a7d40 ffff8801170f6a80 000000000000000b ffff8801168bcc18
[  112.884431]  ffff8801188cbda0 ffffffff8113573f ffffffff00000000 0000000000000000
[  112.884431] Call Trace:
[  112.884431]  [<ffffffff8113573f>] drain_array+0xbf/0xf0
[  112.884431]  [<ffffffff81135e0e>] cache_reap+0x6e/0x220
[  112.884431]  [<ffffffff81135da0>] ? drain_freelist+0xd0/0xd0
[  112.884431]  [<ffffffff81072a4b>] process_one_work+0x11b/0x450
[  112.884431]  [<ffffffff81074d50>] worker_thread+0x170/0x410
[  112.884431]  [<ffffffff81074be0>] ? manage_workers+0x220/0x220
[  112.884431]  [<ffffffff81079bc6>] kthread+0x96/0xa0
[  112.884431]  [<ffffffff814088a4>] kernel_thread_helper+0x4/0x10
[  112.884431]  [<ffffffff81079b30>] ? kthread_worker_fn+0x190/0x190
[  112.884431]  [<ffffffff814088a0>] ? gs_change+0x13/0x13
[  112.884431] Code: 5e 41 5f c9 c3 0f 1f 00 8b 8b 18 02 00 00 48 89 df 48 29 ca 48 89 50 30 e8 13 fe ff ff e9 f1 fe ff f
[  112.884431] RIP  [<ffffffff8113551b>] free_block+0x17b/0x190
[  112.884431]  RSP <ffff8801188cbd10>
[  112.884431] ---[ end trace 4a7f036452aae3c2 ]---

или так

[  124.964149] ------------[ cut here ]------------
[  124.968118] kernel BUG at mm/slab.c:511!
[  124.968118] invalid opcode: 0000 [#1] SMP
[  124.968118] last sysfs file: /sys/devices/virtual/net/ppp15/flags
[  124.968118] CPU 2
[  124.968118] Modules linked in: arc4 ecb ppp_mppe cls_fw sch_sfq act_mirred act_ipt cls_u32 sch_ingress pptp gre l2tp_pd
[  124.968118]
[  124.968118] Pid: 1418, comm: kworker/2:2 Not tainted 2.6.39-std-def-alt3 #1 ASUS RS100-E4/PI2/P5M2-M/RS100-E4
[  124.968118] RIP: 0010:[<ffffffff8113551b>]  [<ffffffff8113551b>] free_block+0x17b/0x190
[  124.968118] RSP: 0018:ffff880117507d10  EFLAGS: 00010046
[  124.968118] RAX: ffffea0003ef5c60 RBX: ffff880117273a80 RCX: 0200000000000400
[  124.968118] RDX: ffff88011fd14620 RSI: ffff88011792ac18 RDI: ffff88011fd14620
[  124.968118] RBP: ffff880117507d50 R08: 0000000000000000 R09: 0000000000000027
[  124.968118] R10: 0000000000000000 R11: 0000000000000000 R12: 000000000000000b
[  124.968118] R13: ffff88011792ac18 R14: 0000000000000000 R15: ffffea0000000000
[  124.968118] FS:  0000000000000000(0000) GS:ffff88011fd00000(0000) knlGS:0000000000000000
[  124.968118] CS:  0010 DS: 0000 ES: 0000 CR0: 000000008005003b
[  124.968118] CR2: 000000000067b088 CR3: 0000000114e6f000 CR4: 00000000000006e0
[  124.968118] DR0: 0000000000000000 DR1: 0000000000000000 DR2: 0000000000000000
[  124.968118] DR3: 0000000000000000 DR6: 00000000ffff0ff0 DR7: 0000000000000400
[  124.968118] Process kworker/2:2 (pid: 1418, threadinfo ffff880117506000, task ffff880117736740)
[  124.968118] Stack:
[  124.968118]  ffff88011fd14620 000000000000004c ffff880117507d70 ffff88011792ac00
[  124.968118]  ffff88011720ebc0 ffff880117273a80 000000000000000b ffff88011792ac18
[  124.968118]  ffff880117507da0 ffffffff8113573f ffffffff00000000 0000000000000000
[  124.968118] Call Trace:
[  124.968118]  [<ffffffff8113573f>] drain_array+0xbf/0xf0
[  124.968118]  [<ffffffff81135e0e>] cache_reap+0x6e/0x220
[  124.968118]  [<ffffffff81135da0>] ? drain_freelist+0xd0/0xd0
[  124.968118]  [<ffffffff81072a4b>] process_one_work+0x11b/0x450
[  124.968118]  [<ffffffff81074d50>] worker_thread+0x170/0x410
[  124.968118]  [<ffffffff81074be0>] ? manage_workers+0x220/0x220
[  124.968118]  [<ffffffff81079bc6>] kthread+0x96/0xa0
[  124.968118]  [<ffffffff814088a4>] kernel_thread_helper+0x4/0x10
[  124.968118]  [<ffffffff81079b30>] ? kthread_worker_fn+0x190/0x190
[  124.968118]  [<ffffffff814088a0>] ? gs_change+0x13/0x13
[  124.968118] Code: 5e 41 5f c9 c3 0f 1f 00 8b 8b 18 02 00 00 48 89 df 48 29 ca 48 89 50 30 e8 13 fe ff ff e9 f1 fe ff f
[  124.968118] RIP  [<ffffffff8113551b>] free_block+0x17b/0x190
[  124.968118]  RSP <ffff880117507d10>
[  124.968118] ---[ end trace 0d18e95ffc307b34 ]---

И встает наглухо, не ребутается, только ресет...

Может я что-то не то делаю??

У кого было такое?

ЗЫ: сетевушки интел igb, по 4 потока на прием-передачу,gso gro - отключено.

slub_nomerge=1 - не влияет. При чем сам не могу повторить такую хрень трафиком, но только юзеры заходят - бух и упали...

Поделиться сообщением

Ссылка на сообщение

Поделиться на других сайтах

nuclearcat

Опубликовано 19 июля, 2011 · Жалоба

igb... в этом драйвере недавно были косяки. Может попробовать драйвера от интела? т.е. out of kernel.

Поделиться сообщением

Ссылка на сообщение

Поделиться на других сайтах

cpulink

Опубликовано 20 июля, 2011 · Жалоба

igb... в этом драйвере недавно были косяки. Может попробовать драйвера от интела? т.е. out of kernel.

В том то и дело что последний от интела и используется 3.0.22 вродь....

Поделиться сообщением

Ссылка на сообщение

Поделиться на других сайтах

OperationCwal

Опубликовано 9 сентября, 2011 · Жалоба

Доброго времени суток!

Наступил на те же грабли. Есть шейпер на gentoo. Несколько экзотический - на ipfw. Симптомы схожи. Падает в произвольные моменты времени, при наличии сетевой нагрузки, но нагрузка низкая. Сетевая 82576 драйвер igb интеловский 3.1.16 Пробовал ядра 2.6.38, 2.6.39 - падает. Откатился на 32-е снова упало. Все ядра из gentoo-sources. Ванильное не пробовал. bonding не используется. Есть неск. шейперов на убунте 10.10 стоят как вкопанные. Решили переходить на генту и такие вот грабли. Есть какие-ниб. решения?

Поделиться сообщением

Ссылка на сообщение

Поделиться на других сайтах

Abram

Опубликовано 10 сентября, 2011 · Жалоба

OperationCwal,

У меня решилось откатом на .35. Если у Вас не помогло - значит, это другая проблема.

Но я бы в первую очередь пробовал убрать ipfw.

Поделиться сообщением

Ссылка на сообщение

Поделиться на других сайтах

OperationCwal

Опубликовано 12 сентября, 2011 · Жалоба

OperationCwal,

У меня решилось откатом на .35. Если у Вас не помогло - значит, это другая проблема.

Но я бы в первую очередь пробовал убрать ipfw.

Просто откат до 32 (35 почему-то не стабилизировали в gentoo) проблему не решил. Пересобрал его с заменой дефайна в skbuff.h Простояло до понедельника, а потом сбойнуло питание. Короче не считается )) Наблюдаю сколько проживёт.

ipfw то конечно стоит убрать, но в данный момент не представляется возможным. Слишком много переделывать. Да и работает он на убунтах прекрасно.

Поделиться сообщением

Ссылка на сообщение

Поделиться на других сайтах

Max P

Опубликовано 12 сентября, 2011 (изменено) · Жалоба

хех, очень похоже на багу которую я у себя отловил, и даже наш8ел фиксу ;) попробуйте патчик, у меня помогло

nf-nat-patch.diff.txt

Изменено 12 сентября, 2011 пользователем Max P

Поделиться сообщением

Ссылка на сообщение

Поделиться на других сайтах

OperationCwal

Опубликовано 16 сентября, 2011 · Жалоба

Max P,

нат этой машиной не выполняется. А что делал твой сервер? Шейпинг+нат?

Поделиться сообщением

Ссылка на сообщение

Поделиться на других сайтах

OperationCwal

Опубликовано 23 сентября, 2011 · Жалоба

Не помогло

Поделиться сообщением

Ссылка на сообщение

Поделиться на других сайтах

nickD

Опубликовано 23 сентября, 2011 · Жалоба

А на шейпере какие краевые дисциплины для классов используете?

Поделиться сообщением

Ссылка на сообщение

Поделиться на других сайтах

Vovic

Опубликовано 26 сентября, 2011 · Жалоба

Подозреваю, что в проблеме виноват драйвер igb.

У нас работает 10 серверов с шейпингом, на 8-ми установлены intel 82576, периодически падают в кернел панику.

Оставшиеся два с драйвером e1000e, uptime больше года.

Недавно вышла новая версия igb (3.2.9), поставили, понаблюдаем.

Поделиться сообщением

Ссылка на сообщение

Поделиться на других сайтах

OperationCwal

Опубликовано 27 сентября, 2011 · Жалоба

Подозреваю, что в проблеме виноват драйвер igb.

У нас работает 10 серверов с шейпингом, на 8-ми установлены intel 82576, периодически падают в кернел панику.

Оставшиеся два с драйвером e1000e, uptime больше года.

Недавно вышла новая версия igb (3.2.9), поставили, понаблюдаем.

Тоже поставлю, потестирую.

Поделиться сообщением

Ссылка на сообщение

Поделиться на других сайтах

kayot

Опубликовано 27 сентября, 2011 (изменено) · Жалоба

У нас везде древний igb версии 2.3.4 стоит, проблем нет. Как вариант, попробуйте.

Изменено 27 сентября, 2011 пользователем kayot

Поделиться сообщением

Ссылка на сообщение

Поделиться на других сайтах

Max P

Опубликовано 28 сентября, 2011 · Жалоба

Я пробовал с разными драйверами, с некоторыми сразу в даун уходил, с некоторыми сутки могло работать. Насколько я понял из описания баги - там тупо косяк в коде nf_conntrack. На сервере nat + шейпер с u32 hfsc классами, после патча забыл о кернел паниках, без него приходилось пару раз за ночь бегать ребутить

Войти

Поделиться сообщением

Ссылка на сообщение

Поделиться на других сайтах

Поделиться сообщением

Ссылка на сообщение

Поделиться на других сайтах

Поделиться сообщением

Ссылка на сообщение

Поделиться на других сайтах

Поделиться сообщением

Ссылка на сообщение

Поделиться на других сайтах

Поделиться сообщением

Ссылка на сообщение

Поделиться на других сайтах

Поделиться сообщением

Ссылка на сообщение

Поделиться на других сайтах

Поделиться сообщением

Ссылка на сообщение

Поделиться на других сайтах

Поделиться сообщением

Ссылка на сообщение

Поделиться на других сайтах

Поделиться сообщением

Ссылка на сообщение

Поделиться на других сайтах

Поделиться сообщением

Ссылка на сообщение

Поделиться на других сайтах

Поделиться сообщением

Ссылка на сообщение

Поделиться на других сайтах

Поделиться сообщением

Ссылка на сообщение

Поделиться на других сайтах

Поделиться сообщением

Ссылка на сообщение

Поделиться на других сайтах

Поделиться сообщением

Ссылка на сообщение

Поделиться на других сайтах

Поделиться сообщением

Ссылка на сообщение

Поделиться на других сайтах

Поделиться сообщением

Ссылка на сообщение

Поделиться на других сайтах

Поделиться сообщением

Ссылка на сообщение

Поделиться на других сайтах

Поделиться сообщением

Ссылка на сообщение

Поделиться на других сайтах

Поделиться сообщением

Ссылка на сообщение

Поделиться на других сайтах

Поделиться сообщением

Ссылка на сообщение

Поделиться на других сайтах

Поделиться сообщением

Ссылка на сообщение

Поделиться на других сайтах

Поделиться сообщением

Ссылка на сообщение

Поделиться на других сайтах

Поделиться сообщением

Ссылка на сообщение

Поделиться на других сайтах

Join the conversation