Victor Safronov Posted February 29, 2012 Posted February 29, 2012 Есть сервер (CentOS 5.6 на борту) с установленным сабжевым контроллером. Раньше не замечал, но недавно вдруг обнаружил, что комп почти впадает в ступор при тяжёлых дисковых операциях, таких как копирование крупных файлов, разархивирование и т.д. Юзерспейс в это время очень тяжело ворочается. Биллинг может потерять связь с базой. Веб-сервер тупит и т.д. Как можно определить уровень, на котором происходит затык? Чей это косяк: ФС, контроллера, винтов? [root@homer ~]# tw_cli /c0 show Unit UnitType Status %RCmpl %V/I/M Stripe Size(GB) Cache AVrfy ------------------------------------------------------------------------------ u0 RAID-1 OK - - - 931.312 OFF ON VPort Status Unit Size Type Phy Encl-Slot Model ------------------------------------------------------------------------------ p0 OK u0 931.51 GB SATA 0 - SAMSUNG HD103UJ p1 OK u0 931.51 GB SATA 1 - SAMSUNG HD103UJ Поверх зеркала создана LVM-группа, в ней уже разделы линукса. Буду рад любой помощи. Вставить ник Quote
vitalyb Posted February 29, 2012 Posted February 29, 2012 Кеш на запись выключен - вот и тупит. Без BBU включать довольно опасно, но если BBU есть, то надо проверить и/или поменять батарейку. Вставить ник Quote
Victor Safronov Posted February 29, 2012 Author Posted February 29, 2012 (edited) BBU нет, и оно, как я понимаю, занимает отдельный слот, а сервер 1U. А если вообще выкинуть этот контроллер и собрать обычный md-массив, производительность должна будет увеличиться? Edited February 29, 2012 by Victor Safronov Вставить ник Quote
vitalyb Posted February 29, 2012 Posted February 29, 2012 BBU не обязательно занимает один слот. Электронный модуль не выходит за рамки одного слота рейд-контролера, а батарейку можно считать "выносной" и прицепить ее куда угодно внутри корпуса, где есть хорошая вентиляция и не жарко. Но это не важно, оказывается 9650SE-2LP BBU вообще не умеет. Что именно делать - включать кеш или переходить на md советовать не берусь - и то и другое может обернуться потерей данных при пропадании питания или, в случае md, при крахе системы. Если решите перейти на md не забудьте увеличить /sys/block/mdX/md/safe_mode_delay (ессно прочитав и осознав последствия), а то самсунги сильно не любят значение по умолчанию. Вставить ник Quote
Victor Safronov Posted February 29, 2012 Author Posted February 29, 2012 (edited) Ещё парочка глупых вопросов: можно ли включать/выключать кэш контроллера нагорячую и как узнать умеет ли встроенный в материнку контроллер SATA хот-свап? Или нынче сам по себе интерфейс SATA обязан это уметь? И ещё вдруг я сейчас вычитал, что есть read cache и write cache. Включение одного только read cache может увеличить производительность на операциях чтения или я что-то не так понимаю? Edited February 29, 2012 by Victor Safronov Вставить ник Quote
vitalyb Posted February 29, 2012 Posted February 29, 2012 Обычно софт и ОС достаточно умные, чтобы на чтение самим всё кешировать. Кеш настраивается тем же tw_cli по каждому unit'у индивидуально. Вставить ник Quote
lllsergeyv Posted March 1, 2012 Posted March 1, 2012 Если решите перейти на md не забудьте увеличить /sys/block/mdX/md/safe_mode_delay (ессно прочитав и осознав последствия), а то самсунги сильно не любят значение по умолчанию. На сколько порекомендуете поднять этот параметр? Что еще лучше подтюнить при использовании програмного raid1? Вставить ник Quote
vitalyb Posted March 1, 2012 Posted March 1, 2012 Сложно сказать, секунда-две, может десять, зависит от нагрузки - если запись частая, то после какого-то предела разницы не будет и при пропадании питания или крахе будет ребилд. Покрутить можно еще параметры очереди в /queue, тоже зависит от загрузки и желаемых результатов, но чудес не ждите. Вставить ник Quote
Recommended Posts
Join the conversation
You can post now and register later. If you have an account, sign in now to post with your account.