Jump to content
Калькуляторы

ESXI 6.5 и HP p420 Проблема с IOWAIT на гипервизоре

Коллеги, добрый день!

 

Нашей компанией для собственных нужд используется сервер HP ProLiant P4300 Gen2 в конфигурации 2xE5520, 24Гб ОЗУ с контроллером HP p420, на котором собран RAID5 из 4 дисков HGST 6Тб SAS, на нем развернут гипервизор ESXI 6.5 в котором этот RAID смонтирован в качестве локального датастора. На данный момент на нем работают 3 гостевые ОС CentOS и Debian, нагрузка на CPU гипервизора не превышает 10-20%, памяти 60-80%, диски загружены примерно наполовину.

 

Недавно у нас произошел инцидент: резко возросли показатели CPU iowait на виртуальных машинах гипервизора, в короткий промежуток времени машины стали недоступны (зависли), выключить/перезапустить их из гипервизора так же не удалось, в итоге сервер был перезагружен вручную. При запуске и инициализации ошибок не возникло, при анализе логов обнаружилась ошибка вида:

 

2017-05-26T03:31:27.172Z cpu7:788405)WARNING: VSCSI: 3488: handle 8228(vscsi0:1):WaitForCIF: Issuing reset; number of CIF:17 (время в UTC).

 

Свидетельствует ли это о возможном сбое контроллера/дисков?

 

Так же перед инцидентом производилась запись на одной из виртуальных машин, трафик около 50Мб/с.

 

Возможно требуется подключение какого-либо дополнительного драйвера для контроллера или тонкая настройка гипервизора? На странице поддержки HP доступны драйверы для контроллера для VSphere 6.5, а так же набор утилит HPE SSA Cli, возможно ли их установить на гипервизоре? Или проблема все-таки кроется в "железе" (без HPE SSA Cli нельзя ведь данные SMART дисков в RAID узнать)? Заранее благодарны за помощь.

Share this post


Link to post
Share on other sites

Установите кастомный образ HP ESXi, там есть полный набор драйверов и утилит, тогда и анализировать будет легче.

Share this post


Link to post
Share on other sites

Установите кастомный образ HP ESXi, там есть полный набор драйверов и утилит, тогда и анализировать будет легче.

Спасибо, о существованиии кастомного образа узнали недавно, вот только не хочется длительный перерыв устраивать, поэтому и думаем можно ли установить драйвер и SSA CLI вручную. Хотя, видимо, поступим как Вы посоветовали...

Share this post


Link to post
Share on other sites

@FATHER_FBI Благодарю за совет! Развернул кастомный образ - уже почти 2 года полет нормальный, думаю тема закрыта.

Share this post


Link to post
Share on other sites

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.

Guest
Reply to this topic...

×   Pasted as rich text.   Paste as plain text instead

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.