Nikolaicheg Posted May 21, 2009 Posted May 21, 2009 Всем доброго времени суток! Столкнулся с проблемой. Есть сервер Аквариус T50 D55 (2x Xeon Quad 5440, 4GB, 3x 146Gb HDD), на него нужно поставить CentOS 5.3, чтобы затем поставить оракл. Проблема заключается в следующем. Когда система загружается, то по истечении некоторого случайного времени (10-90 минут) происходит "отвал" рейда, на экран выводится сообщение sd 0:2:0:0 rejecting I/O to offline device. Подозреваю, что проблема с ядром, т.к. ставил Убунту, всё работало хорошо.Обновил CentOS из репозиториев, вроде уже обрадовался, что работает стабильно (проработало 6 часов нормально), а потом случилась та же фигня. Никто с таким не сталкивался? Что можно сделать в данной ситуации? Вставить ник Quote
ingress Posted May 21, 2009 Posted May 21, 2009 как вариант посмотреть прошивку новую для рейд-контроллера Вставить ник Quote
martin74 Posted May 21, 2009 Posted May 21, 2009 и винты посмотреть.... Особенно на к-во ошибок на винтах... Вставить ник Quote
Nikolaicheg Posted May 22, 2009 Author Posted May 22, 2009 чем винты посмотреть? прошившку слил, как прошью - отпишусь Вставить ник Quote
Nikolaicheg Posted May 22, 2009 Author Posted May 22, 2009 даже пробовал накатить драйвер от РХЕЛ5, взятый с сайта. Слил сырцы ядра с репозиория центоса, заменил файлы драйвера на скачанные. Откомпилил ядро и модули, установил. Падает всё равно :( May 22 00:30:34 platex MR_MONITOR[3320]: <MRMON044> Controller ID: 0 Time established since power on: Time 2009-05-22,00:30:34 24000SecondsMay 22 01:00:34 platex MR_MONITOR[3320]: <MRMON044> Controller ID: 0 Time established since power on: Time 2009-05-22,01:00:34 25800Seconds May 22 01:30:34 platex MR_MONITOR[3320]: <MRMON044> Controller ID: 0 Time established since power on: Time 2009-05-22,01:30:34 27600Seconds May 22 02:00:34 platex MR_MONITOR[3320]: <MRMON044> Controller ID: 0 Time established since power on: Time 2009-05-22,02:00:34 29400Seconds May 22 02:22:56 platex kernel: sd 0:2:0:0: megasas: RESET -14646 cmd=2a retries=0 Message from syslogd@ at Fri May 22 02:25:56 2009 ... platex kernel: journal commit I/O error Вставить ник Quote
Nikolaicheg Posted May 22, 2009 Author Posted May 22, 2009 Вобщем перешил, посмотрим, что будет. Вот инфа о контроллере, может быть поможет... [root@platex 2]# /opt/MegaRAID/MegaCli/MegaCli64 -AdpAllInfo -aALL Adapter #0 ============================================================================== Versions ================ Product Name : MegaRAID SAS 8300XLP Serial No : P008251808 FW Package Build: 7.0.1-0037 Mfg. Data ================ Mfg. Date : 05/03/08 Rework Date : 00/00/00 Revision No : ( Image Versions In Flash: ================ Boot Block Version : R.2.3.13 BIOS Version : MT33 MPT Version : MPTFW-01.18.78.00-IT FW Version : 1.12.61-0366 WebBIOS Version : 1.1-33c-e_11-Rel Pending Images In Flash ================ BTBLBIOSMPT1APP BCONMPT3PCLI PCI Info ================ Vendor Id : 1000 Device Id : 0413 SubVendorId : 1000 SubDeviceId : 1005 Host Interface : PCIE Number of Frontend Port: 0 Device Interface : PCIE Number of Backend Port: 8 Port : Address 0 5000c50004ed9b75 1 5000c50004ed9aad 2 5000c50004ed90b9 3 0000000000000000 4 0000000000000000 5 0000000000000000 6 0000000000000000 7 0000000000000000 HW Configuration ================ SAS Address : 500e018071100003 BBU : Absent Alarm : Present NVRAM : Present Serial Debugger : Present Memory : Present Flash : Present Settings ================ Current Time : 10:46:36 5/22, 2009 Predictive Fail Poll Interval : 300sec Interrupt Throttle Active Count : 16 Interrupt Throttle Completion : 50us Rebuild Rate : 30% PR Rate : 30% Resynch Rate : 30% Check Consistency Rate : 30% Reconstruction Rate : 30% Cache flush interval : 4s Max drives to spinup at one time : 2 Delay among spinup groups : 12s Physical drive coercion mode : 1GB Cluster mode : Disabled Alarm : Enabled Auto Rebuild : Enabled Battery Warning : Disabled Ecc Bucket Size : 15 Ecc Bucket Leak Rate : 1440 Minutes Restore HotSpare On Insertion : Disabled Expose Enclosure Devices : Enabled Maintain PD Fail History : Disabled Host Request Reordering : Enabled Capabilities ================ RAID Level Supported : RAID0, RAID1, RAID5, RAID10, RAID50 Supported Drives : SAS, SATA Allowed Mixing: Mix In Enclosure Allowed, Mix In VD Allowed Status ================ ECC Bucket Count : 0 Limitations ================ Max Arms Per VD : 32 Max Spans Per VD : 8 Max Arrays : 128 Max Number of VDs : 64 Max Parallel Commands : 1008 Max SGE Count : 80 Max Data Transfer Size : 8192 sectors Max Strips PerIO : 42 Min Stripe Size : 8kB Max Stripe Size : 1024kB Device Present ================ Virtual Drives : 1 Degraded : 0 Offline : 0 Physical Devices : 4 Disks : 3 Critical Disks : 0 Failed Disks : 0 Supported Adapter Operations ================ Rebuild Rate : Yes CC Rate : Yes BGI Rate : Yes Reconstruct Rate : Yes Patrol Read Rate : Yes Alarm Control : Yes Cluster Support : No BBU : Yes Spanning : Yes Dedicated Hot Spare : Yes Revertible Hot Spares : No Foreign Config Import : Yes Self Diagnostic : Yes Allow Mixed Redundancy On Array : No Global Hot Spares : Yes Deny SCSI Passthrough : No Deny SMP Passthrough : No Deny STP Passthrough : No Supported VD Operations ================ Read Policy : Yes Write Policy : Yes IO Policy : Yes Access Policy : Yes Disk Cache Policy : Yes Reconstruction : Yes Deny Locate : No Deny CC : No Supported PD Operations ================ Force Online : Yes Force Offline : Yes Force Rebuild : Yes Deny Force Failed : No Deny Force Good/Bad : No Deny Missing Replace : No Deny Clear : No Deny Locate : No Error Counters ================ Memory Correctable Errors : 0 Memory Uncorrectable Errors : 0 Cluster Information ================ Cluster Permitted : No Cluster Active : No Default Settings ================ Phy Polarity : 0 Phy PolaritySplit : 0 Backgroud Rate : 30 Stripe Size : 64kB Flush Time : 4 seconds Write Policy : WB Read Policy : None Cache When BBU Bad : Disabled Cached IO : Yes SMART Mode : Mode 6 Alarm Disable : Yes Coercion Mode : 1GB ZCR Config : IDSEL Dirty LED Shows Drive Activity : No BIOS Continue On Error : No Spin Down Mode : None Allowed Device Type : SAS/SATA Mix Allow Mix In Enclosure : Yes Allow Mix In VD : Yes Allow SATA In Cluster : No Max Chained Enclosures : 3 Disable Ctrl-R : Yes Enable Web BIOS : Yes Direct PD Mapping : No BIOS Enumerate VDs : No Restore Hot Spare On Insertion : No Expose Enclosure Devices : Yes Maintain PD Fail History : No Disable Puncturing : No Zero Based Enclosure Enumeration: No PreBoot CLI Enabled : Yes LED Show Drive Activity : No Cluster Disable : Yes SAS Disable : No Вставить ник Quote
Nikolaicheg Posted May 22, 2009 Author Posted May 22, 2009 мысль возникла одна... может сервер уходит в hibernate? как это отследить? Вставить ник Quote
_dmitr_ Posted May 22, 2009 Posted May 22, 2009 Попрбуй CentOS 5.2, мне он показался постабильнее. Вставить ник Quote
Nikolaicheg Posted May 25, 2009 Author Posted May 25, 2009 вобщем в пятницу перешил в обед, пока стоит работает... Вставить ник Quote
Recommended Posts
Join the conversation
You can post now and register later. If you have an account, sign in now to post with your account.