sirmax Posted March 4, 2013 Posted March 4, 2013 Один из портов 2-х головой интеловской карты время от времени теряет линк. Карты такие в сервере: 00:19.0 Ethernet controller: Intel Corporation 82578DM Gigabit Network Connection (rev 05) 07:00.0 Ethernet controller: Intel Corporation 82574L Gigabit Network Connection 09:00.0 Ethernet controller: Intel Corporation 82571EB Gigabit Ethernet Controller (rev 06) 09:00.1 Ethernet controller: Intel Corporation 82571EB Gigabit Ethernet Controller (rev 06) Траффик суммарный примерно 600 мбит по кажой карте, одно ядро - одна сетевка. Проблема только с ОДНИМ портом 82571EB В dmesg: [45896.427218] e1000e 0000:09:00.1: eth6: Detected Hardware Unit Hang: [45896.427220] TDH <ea> [45896.427220] TDT <7a> [45896.427221] next_to_use <7a> [45896.427222] next_to_clean <8e> [45896.427222] buffer_info[next_to_clean]: [45896.427223] time_stamp <102b8c833> [45896.427224] next_to_watch <8e> [45896.427224] jiffies <102b8d958> [45896.427225] next_to_watch.status <0> [45896.427226] MAC Status <80387> [45896.427227] PHY Status <792d> [45896.427227] PHY 1000BASE-T Status <3800> [45896.427228] PHY Extended Status <3000> [45896.427229] PCI Status <10> [45899.438064] e1000e 0000:09:00.1: eth6: Reset adapter unexpectedly .... [45902.600131] e1000e: e1000e: eth6 NIC Link is Up 1000 Mbps Full Duplex, Flow Control: None Никаких мыслей нет, ничего толком не нагуглил Драйвер обновил: #modinfo e1000e filename: /lib/modules/3.0.3-sirmax1/kernel/drivers/net/e1000e/e1000e.ko version: 2.2.14-NAPI license: GPL description: Intel(R) PRO/1000 Network Driver author: Intel Corporation, <linux.nics@intel.com> srcversion: 540642738E4AE63E16037EB Ядро самосборное, gentoo Linux 3.0.3-sirmax1 #1 SMP x86_64 Intel(R) Xeon(R) CPU X3430 @ 2.40GHz GenuineIntel GNU/Linux Буду рад любым идеям. Вставить ник Quote
murzik_one Posted March 4, 2013 Posted March 4, 2013 могу предположить что это брак карты. у меня была несколько похожая история с двухпортовой 82576, то есть один порт работает идеально, а на втором линк есть, а ничего не трансферится. Вставить ник Quote
sirmax Posted March 4, 2013 Author Posted March 4, 2013 могу предположить что это брак карты. у меня была несколько похожая история с двухпортовой 82576, то есть один порт работает идеально, а на втором линк есть, а ничего не трансферится. Проблема плавающяя, проявляется не сразу и не всегда ( Т.е. иногда может день отработать до того как начнет "мигать линком", в промежутках - работает нормальньно Вставить ник Quote
nuclearcat Posted March 4, 2013 Posted March 4, 2013 По опыту - иногда помогает апдейт eeprom. Например свежий случай - сетевку валил хитрый пакет, из-за неправильной прошивки. Чуть старше - у меня не поднимался порт на супермикре, пока не запустил досовскую прогу которая патчит еепром. Вставить ник Quote
sirmax Posted March 5, 2013 Author Posted March 5, 2013 По опыту - иногда помогает апдейт eeprom. Например свежий случай - сетевку валил хитрый пакет, из-за неправильной прошивки. Чуть старше - у меня не поднимался порт на супермикре, пока не запустил досовскую прогу которая патчит еепром. Сервер удаленный, человека там нет. Попробую тупо поменять (это проще чем перешить) - отпишу результат. Спасибо. Вставить ник Quote
replicant Posted March 5, 2013 Posted March 5, 2013 Такая же ерунда с Detected Hardware Unit Hang была когда-то с встроенными Marvell и PCI D-Link DGE530T, что тоже на чипе Marvell, а еще с PCI-Ex 1х DGE-560T кажется. Но на сегодняшний день уже не использую такие сетевки, хотя для своего ценового сегмента вроде не самые плохие были когда-то. Глубоко разбираться не стал с деталями. Просто сразу менял на нормальные + менял кабель и местами порт коммутатора и все проходило. По мере накопления опыта понял, что это может быть как дефект сетевой, так и плохой линк, порт и т.п. Причины могут быть и внешними. Гугл тоже толком ничего не растолковал. Вставить ник Quote
pppoetest Posted March 5, 2013 Posted March 5, 2013 У мну вылечилось переходом на более свежую версию дров. Вставить ник Quote
sirmax Posted March 7, 2013 Author Posted March 7, 2013 карту поменяли на igb - полечилось вроде бы. У мну вылечилось переходом на более свежую версию дров. Спасибо, но это я попробовал в первую очередь - скачал с сайта и пересобрал. Такая же ерунда с Detected Hardware Unit Hang была когда-то с встроенными Marvell и PCI D-Link DGE530T, что тоже на чипе Marvell, а еще с PCI-Ex 1х DGE-560T кажется. Но на сегодняшний день уже не использую такие сетевки, хотя для своего ценового сегмента вроде не самые плохие были когда-то. Глубоко разбираться не стал с деталями. Просто сразу менял на нормальные + менял кабель и местами порт коммутатора и все проходило. По мере накопления опыта понял, что это может быть как дефект сетевой, так и плохой линк, порт и т.п. Причины могут быть и внешними. Гугл тоже толком ничего не растолковал. Да, кабель и порт поменяли - прошло на сутки, потом вернулось. подозрение на "раздолбанный" разъем в самой карте меня не оставляет. Но я "здесь" а сервер "там" =( Вставить ник Quote
replicant Posted March 8, 2013 Posted March 8, 2013 Еще можно предположить, что данный глюк может пройти от замены ядра. У Вас ядро самосборное 3.0.3, а в ветке уже 3.0.68, т.е. как бы у Вас не просто старое, а очень древнее ядро из ранних. Попробуйте заменить на 68 выпуск. Как бы разница в конфигах минимум, а проблему может устранить. Вставить ник Quote
sirmax Posted March 9, 2013 Author Posted March 9, 2013 Еще можно предположить, что данный глюк может пройти от замены ядра. У Вас ядро самосборное 3.0.3, а в ветке уже 3.0.68, т.е. как бы у Вас не просто старое, а очень древнее ядро из ранних. Попробуйте заменить на 68 выпуск. Как бы разница в конфигах минимум, а проблему может устранить. Честно сказать - побоялся. Далеко ехать если что не так ... Думал об этом, но не решился. Вставить ник Quote
Recommended Posts
Join the conversation
You can post now and register later. If you have an account, sign in now to post with your account.