sirmax Опубликовано 4 марта, 2013 · Жалоба Один из портов 2-х головой интеловской карты время от времени теряет линк. Карты такие в сервере: 00:19.0 Ethernet controller: Intel Corporation 82578DM Gigabit Network Connection (rev 05) 07:00.0 Ethernet controller: Intel Corporation 82574L Gigabit Network Connection 09:00.0 Ethernet controller: Intel Corporation 82571EB Gigabit Ethernet Controller (rev 06) 09:00.1 Ethernet controller: Intel Corporation 82571EB Gigabit Ethernet Controller (rev 06) Траффик суммарный примерно 600 мбит по кажой карте, одно ядро - одна сетевка. Проблема только с ОДНИМ портом 82571EB В dmesg: [45896.427218] e1000e 0000:09:00.1: eth6: Detected Hardware Unit Hang: [45896.427220] TDH <ea> [45896.427220] TDT <7a> [45896.427221] next_to_use <7a> [45896.427222] next_to_clean <8e> [45896.427222] buffer_info[next_to_clean]: [45896.427223] time_stamp <102b8c833> [45896.427224] next_to_watch <8e> [45896.427224] jiffies <102b8d958> [45896.427225] next_to_watch.status <0> [45896.427226] MAC Status <80387> [45896.427227] PHY Status <792d> [45896.427227] PHY 1000BASE-T Status <3800> [45896.427228] PHY Extended Status <3000> [45896.427229] PCI Status <10> [45899.438064] e1000e 0000:09:00.1: eth6: Reset adapter unexpectedly .... [45902.600131] e1000e: e1000e: eth6 NIC Link is Up 1000 Mbps Full Duplex, Flow Control: None Никаких мыслей нет, ничего толком не нагуглил Драйвер обновил: #modinfo e1000e filename: /lib/modules/3.0.3-sirmax1/kernel/drivers/net/e1000e/e1000e.ko version: 2.2.14-NAPI license: GPL description: Intel(R) PRO/1000 Network Driver author: Intel Corporation, <linux.nics@intel.com> srcversion: 540642738E4AE63E16037EB Ядро самосборное, gentoo Linux 3.0.3-sirmax1 #1 SMP x86_64 Intel(R) Xeon(R) CPU X3430 @ 2.40GHz GenuineIntel GNU/Linux Буду рад любым идеям. Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
murzik_one Опубликовано 4 марта, 2013 · Жалоба могу предположить что это брак карты. у меня была несколько похожая история с двухпортовой 82576, то есть один порт работает идеально, а на втором линк есть, а ничего не трансферится. Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
sirmax Опубликовано 4 марта, 2013 · Жалоба могу предположить что это брак карты. у меня была несколько похожая история с двухпортовой 82576, то есть один порт работает идеально, а на втором линк есть, а ничего не трансферится. Проблема плавающяя, проявляется не сразу и не всегда ( Т.е. иногда может день отработать до того как начнет "мигать линком", в промежутках - работает нормальньно Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
nuclearcat Опубликовано 4 марта, 2013 · Жалоба По опыту - иногда помогает апдейт eeprom. Например свежий случай - сетевку валил хитрый пакет, из-за неправильной прошивки. Чуть старше - у меня не поднимался порт на супермикре, пока не запустил досовскую прогу которая патчит еепром. Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
sirmax Опубликовано 5 марта, 2013 · Жалоба По опыту - иногда помогает апдейт eeprom. Например свежий случай - сетевку валил хитрый пакет, из-за неправильной прошивки. Чуть старше - у меня не поднимался порт на супермикре, пока не запустил досовскую прогу которая патчит еепром. Сервер удаленный, человека там нет. Попробую тупо поменять (это проще чем перешить) - отпишу результат. Спасибо. Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
replicant Опубликовано 5 марта, 2013 · Жалоба Такая же ерунда с Detected Hardware Unit Hang была когда-то с встроенными Marvell и PCI D-Link DGE530T, что тоже на чипе Marvell, а еще с PCI-Ex 1х DGE-560T кажется. Но на сегодняшний день уже не использую такие сетевки, хотя для своего ценового сегмента вроде не самые плохие были когда-то. Глубоко разбираться не стал с деталями. Просто сразу менял на нормальные + менял кабель и местами порт коммутатора и все проходило. По мере накопления опыта понял, что это может быть как дефект сетевой, так и плохой линк, порт и т.п. Причины могут быть и внешними. Гугл тоже толком ничего не растолковал. Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
pppoetest Опубликовано 5 марта, 2013 · Жалоба У мну вылечилось переходом на более свежую версию дров. Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
sirmax Опубликовано 7 марта, 2013 · Жалоба карту поменяли на igb - полечилось вроде бы. У мну вылечилось переходом на более свежую версию дров. Спасибо, но это я попробовал в первую очередь - скачал с сайта и пересобрал. Такая же ерунда с Detected Hardware Unit Hang была когда-то с встроенными Marvell и PCI D-Link DGE530T, что тоже на чипе Marvell, а еще с PCI-Ex 1х DGE-560T кажется. Но на сегодняшний день уже не использую такие сетевки, хотя для своего ценового сегмента вроде не самые плохие были когда-то. Глубоко разбираться не стал с деталями. Просто сразу менял на нормальные + менял кабель и местами порт коммутатора и все проходило. По мере накопления опыта понял, что это может быть как дефект сетевой, так и плохой линк, порт и т.п. Причины могут быть и внешними. Гугл тоже толком ничего не растолковал. Да, кабель и порт поменяли - прошло на сутки, потом вернулось. подозрение на "раздолбанный" разъем в самой карте меня не оставляет. Но я "здесь" а сервер "там" =( Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
replicant Опубликовано 8 марта, 2013 · Жалоба Еще можно предположить, что данный глюк может пройти от замены ядра. У Вас ядро самосборное 3.0.3, а в ветке уже 3.0.68, т.е. как бы у Вас не просто старое, а очень древнее ядро из ранних. Попробуйте заменить на 68 выпуск. Как бы разница в конфигах минимум, а проблему может устранить. Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
sirmax Опубликовано 9 марта, 2013 · Жалоба Еще можно предположить, что данный глюк может пройти от замены ядра. У Вас ядро самосборное 3.0.3, а в ветке уже 3.0.68, т.е. как бы у Вас не просто старое, а очень древнее ядро из ранних. Попробуйте заменить на 68 выпуск. Как бы разница в конфигах минимум, а проблему может устранить. Честно сказать - побоялся. Далеко ехать если что не так ... Думал об этом, но не решился. Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...