Перейти к содержимому
Калькуляторы

блок питания к HP Proliant DL385P G8

25 minutes ago, sol said:

Если вы её форматировали, то одна из задач форматирования - это маркировка сбойных секторов и исключение их из использования Файловой Системой.

1. Для этого надо делать полное форматирование, а не быстрое.

2. Если сбойный сектор в пределах первого мегабайта, т.е. в системной области - карточка не будет отформатирована, будет выдана ошибка.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

12 минут назад, UglyAdmin сказал:

2. Если сбойный сектор в пределах первого мегабайта, т.е. в системной области - карточка не будет отформатирована, будет выдана ошибка.

Не так. Сбойным не может быть только первый сектор, первые 512 байт. Там лежит таблица разделов. Всё остальное можно пережить.

 

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

57 минут назад, sol сказал:

Дааааа... Вот и выросло поколение не видевшее и не форматировавшее дискету...

Не угадали. Мне годочков 50+, я всякие дискеты повидал, а так же перфоленты и перфокарты. :)

Суть - 100% новая живая карта стала там там Degradated через несколько минут.

 

57 минут назад, sol сказал:

Ну вы же dmesg в момент сбоя нам не показали. Зажали и себе оставили.

Если б я dmesg посмотрел, то не утаил бы. А так - видимо до следующего сбоя (тьфу*3)

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

В 25.11.2023 в 17:03, Andrei сказал:

И что это за карта - обычная SD или какая-нибудь PCMCI или микруха, напаянная на мать? В инете что-то противоречиво на этот счет.

В общем похоже, что это дохнет NAND-память на матери. Судя по всему, не сильно критично, если не нужны логи ILO.

И сервак, после того как я его вскрывал и пощщупал ему внутри шлейфы :) , пока больше не сбоил (тьфу*3).

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Quote

В общем похоже, что это дохнет NAND-память на матери.

Не все ли там как у Supermicro?

https://www.supermicro.com/manuals/other/embedded_bmc_ipmi.pdf

Изменено пользователем h3ll1

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

В 07.12.2023 в 18:37, sol сказал:

Ну вы же dmesg в момент сбоя нам не показали.

Сегодня опять контроллер сбойнул. Вот dmesg, видимо начиная с timecode 1785237.255242
sdb - это флэшка (sd-card)

dmesg.txt

В ILO диски видно, а контроллер - FAILED

image.thumb.png.dbfa6668a0445948959affc09ae3292a.png

image.thumb.png.172fd7e9fe60f495569df1450564dfd0.png

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

3 часа назад, Andrei сказал:

Вот dmesg, видимо начиная с timecode

C форума файлики более не скачиваются. "Проблема решается", когда решится не ясно.

 

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

21 минуту назад, sol сказал:

C форума файлики более не скачиваются. "Проблема решается", когда решится не ясно.

 

[1785237.255242] hpsa 0000:03:00.0: scsi 2:1:0:1: resetting logical  Direct-Access     HP       LOGICAL VOLUME   RAID-1(+0) SSDSmartPathCap- En- Exp=1
[1785306.437241] hpsa 0000:03:00.0: Controller lockup detected: 0x00140001 after 30
[1785306.437299] hpsa 0000:03:00.0: controller lockup detected: LUN:0100004000000000 CDB:01040000000000000000000000000000
[1785306.437305] hpsa 0000:03:00.0: Controller lockup detected during reset wait
[1785306.437315] hpsa 0000:03:00.0: scsi 2:1:0:1: reset logical  failed Direct-Access     HP       LOGICAL VOLUME   RAID-1(+0) SSDSmartPathCap- En- Exp=1
[1785306.437317] hpsa 0000:03:00.0: failed 20 commands in fail_all
[1785306.437330] sd 2:1:0:1: Device offlined - not ready after error recovery
[1785306.437341] sd 2:1:0:1: Device offlined - not ready after error recovery
[1785306.437348] sd 2:1:0:1: Device offlined - not ready after error recovery
[1785306.437362] sd 2:1:0:1: Device offlined - not ready after error recovery
[1785306.437365] sd 2:1:0:1: Device offlined - not ready after error recovery
[1785306.437368] sd 2:1:0:1: Device offlined - not ready after error recovery
[1785306.437371] sd 2:1:0:1: Device offlined - not ready after error recovery
[1785306.437374] sd 2:1:0:1: Device offlined - not ready after error recovery
[1785306.437377] sd 2:1:0:1: Device offlined - not ready after error recovery
[1785306.437380] sd 2:1:0:1: Device offlined - not ready after error recovery
[1785306.437383] sd 2:1:0:1: Device offlined - not ready after error recovery
[1785306.437388] sd 2:1:0:1: Device offlined - not ready after error recovery
[1785306.437397] sd 2:1:0:1: Device offlined - not ready after error recovery
[1785306.437403] sd 2:1:0:1: Device offlined - not ready after error recovery
[1785306.437411] sd 2:1:0:1: Device offlined - not ready after error recovery
[1785306.437420] sd 2:1:0:1: Device offlined - not ready after error recovery
[1785306.437427] sd 2:1:0:1: Device offlined - not ready after error recovery
[1785306.437430] sd 2:1:0:1: Device offlined - not ready after error recovery
[1785306.437433] sd 2:1:0:1: Device offlined - not ready after error recovery
[1785306.437449] sd 2:1:0:1: [sda] tag#1 FAILED Result: hostbyte=DID_NO_CONNECT driverbyte=DRIVER_OK
[1785306.437455] sd 2:1:0:1: [sda] tag#1 CDB: Write(10) 2a 00 0a 23 6a a0 00 00 20 00
[1785306.437459] blk_update_request: I/O error, dev sda, sector 170093216
[1785306.439541] sd 2:1:0:1: rejecting I/O to offline device
[1785306.441505] sd 2:1:0:1: [sda] killing request
[1785306.441521] sd 2:1:0:1: rejecting I/O to offline device
[1785306.443534] Aborting journal on device sda1-8.
[1785306.443541] sd 2:1:0:1: [sda] tag#18 FAILED Result: hostbyte=DID_NO_CONNECT driverbyte=DRIVER_OK
[1785306.443555] sd 2:1:0:1: [sda] tag#18 CDB: Write(10) 2a 00 04 f0 10 80 00 00 08 00
[1785306.443560] blk_update_request: I/O error, dev sda, sector 82841728
[1785306.443574] sd 2:1:0:1: [sda] tag#0 FAILED Result: hostbyte=DID_NO_CONNECT driverbyte=DRIVER_OK
[1785306.443579] sd 2:1:0:1: [sda] tag#0 CDB: Write(10) 2a 00 05 12 5e 50 00 00 18 00
[1785306.443581] blk_update_request: I/O error, dev sda, sector 85089872
[1785306.443595] sd 2:1:0:1: [sda] tag#8 FAILED Result: hostbyte=DID_NO_CONNECT driverbyte=DRIVER_OK
[1785306.443599] sd 2:1:0:1: [sda] tag#8 CDB: Write(10) 2a 00 05 12 5e 68 00 00 50 00
[1785306.443601] blk_update_request: I/O error, dev sda, sector 85089896
[1785306.443621] sd 2:1:0:1: [sda] tag#9 FAILED Result: hostbyte=DID_NO_CONNECT driverbyte=DRIVER_OK
[1785306.443625] sd 2:1:0:1: [sda] tag#9 CDB: Write(10) 2a 00 07 4a 44 40 00 00 20 00
[1785306.443627] blk_update_request: I/O error, dev sda, sector 122307648
[1785306.443645] sd 2:1:0:1: [sda] tag#10 FAILED Result: hostbyte=DID_NO_CONNECT driverbyte=DRIVER_OK
[1785306.443651] sd 2:1:0:1: [sda] tag#10 CDB: Write(10) 2a 00 0a 23 68 00 00 00 20 00
[1785306.443656] blk_update_request: I/O error, dev sda, sector 170092544
[1785306.443672] sd 2:1:0:1: [sda] tag#11 FAILED Result: hostbyte=DID_NO_CONNECT driverbyte=DRIVER_OK
[1785306.443676] sd 2:1:0:1: [sda] tag#11 CDB: Write(10) 2a 00 0a 23 68 a0 00 00 20 00
[1785306.443682] blk_update_request: I/O error, dev sda, sector 170092704
[1785306.443704] sd 2:1:0:1: [sda] tag#5 FAILED Result: hostbyte=DID_NO_CONNECT driverbyte=DRIVER_OK
[1785306.443708] sd 2:1:0:1: [sda] tag#5 CDB: Write(10) 2a 00 17 fa 3e 80 00 00 f8 00
[1785306.443710] blk_update_request: I/O error, dev sda, sector 402275968
[1785306.443722] sd 2:1:0:1: [sda] tag#6 FAILED Result: hostbyte=DID_NO_CONNECT driverbyte=DRIVER_OK
[1785306.443726] sd 2:1:0:1: [sda] tag#6 CDB: Write(10) 2a 00 17 fa 3f 78 00 00 88 00
[1785306.443728] blk_update_request: I/O error, dev sda, sector 402276216
[1785306.443748] sd 2:1:0:1: [sda] tag#4 FAILED Result: hostbyte=DID_NO_CONNECT driverbyte=DRIVER_OK
[1785306.443753] sd 2:1:0:1: [sda] tag#4 CDB: Write(10) 2a 00 18 1e aa e0 00 00 40 00
[1785306.443755] blk_update_request: I/O error, dev sda, sector 404663008
[1785306.444335] device eth0.5 left promiscuous mode
[1785306.444338] device eth0 left promiscuous mode
[1785306.451548] sd 2:1:0:1: rejecting I/O to offline device
[1785306.451573] sd 2:1:0:1: rejecting I/O to offline device
[1785306.451584] sd 2:1:0:1: rejecting I/O to offline device
[1785306.451594] sd 2:1:0:1: rejecting I/O to offline device
[1785306.451602] sd 2:1:0:1: rejecting I/O to offline device
[1785306.451610] sd 2:1:0:1: rejecting I/O to offline device
[1785306.451620] sd 2:1:0:1: rejecting I/O to offline device
[1785306.451629] sd 2:1:0:1: rejecting I/O to offline device
[1785306.451640] sd 2:1:0:1: rejecting I/O to offline device
[1785306.451648] sd 2:1:0:1: rejecting I/O to offline device
[1785306.451657] sd 2:1:0:1: rejecting I/O to offline device
[1785306.451687] sd 2:1:0:1: rejecting I/O to offline device
[1785306.451698] sd 2:1:0:1: rejecting I/O to offline device
[1785306.451706] sd 2:1:0:1: rejecting I/O to offline device
[1785306.451714] sd 2:1:0:1: rejecting I/O to offline device
[1785306.451722] sd 2:1:0:1: rejecting I/O to offline device
[1785306.451730] sd 2:1:0:1: rejecting I/O to offline device
[1785306.451738] sd 2:1:0:1: rejecting I/O to offline device
[1785306.451747] sd 2:1:0:1: rejecting I/O to offline device
[1785306.451756] sd 2:1:0:1: rejecting I/O to offline device
[1785306.451764] sd 2:1:0:1: rejecting I/O to offline device
[1785306.451774] sd 2:1:0:1: rejecting I/O to offline device
[1785306.451783] sd 2:1:0:1: rejecting I/O to offline device
[1785306.451791] sd 2:1:0:1: rejecting I/O to offline device
[1785306.454290] sd 2:1:0:1: rejecting I/O to offline device
[1785306.454592] sd 2:1:0:1: rejecting I/O to offline device
[1785306.462616] sd 2:1:0:1: rejecting I/O to offline device
[1785306.462624] EXT4-fs warning (device sda1): ext4_end_bio:314: I/O error -5 writing to inode 6554187 (offset 0 size 0 starting block 70720740)
[1785306.462628] Buffer I/O error on device sda1, logical block 70720483
[1785306.462643] sd 2:1:0:1: rejecting I/O to offline device
[1785306.462648] EXT4-fs warning (device sda1): ext4_end_bio:314: I/O error -5 writing to inode 6554267 (offset 0 size 0 starting block 70720755)
[1785306.462652] Buffer I/O error on device sda1, logical block 70720498
[1785306.514644] sd 2:1:0:1: rejecting I/O to offline device
[1785306.515641] JBD2: Error -5 detected when updating journal superblock for sda1-8.
[1785306.545230] sd 2:1:0:1: rejecting I/O to offline device
[1785306.546547] EXT4-fs error (device sda1): ext4_journal_check_start:56: Detected aborted journal
[1785306.547383] EXT4-fs (sda1): Remounting filesystem read-only
[1785306.548204] EXT4-fs (sda1): previous I/O error to superblock detected
[1785306.549020] sd 2:1:0:1: rejecting I/O to offline device
[1785691.095208] sd 2:1:0:1: rejecting I/O to offline device
[1785691.096383] EXT4-fs error (device sda1): ext4_find_entry:1474: inode #10354753: comm sh: reading directory lblock 0
[1785691.097530] EXT4-fs (sda1): previous I/O error to superblock detected
[1785691.098606] sd 2:1:0:1: rejecting I/O to offline device

Полная версия тут - https://disk.yandex.ru/d/eFLu8SzwurJguA

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Похоже на отъезд контроллера, но! по фразе "Controller lockup detected:" гуглится много любопытного, начиная с баги в драйвере.

 

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

14 минут назад, sol сказал:

Похоже на отъезд контроллера, но! по фразе "Controller lockup detected:" гуглится много любопытного, начиная с баги в драйвере.

 

Контроллер на замену уже купил, едет.

По "Controller lockup detected:" гуглил. Да, баги драйвера упоминаются, правда не в отношении HP 420. К тому же сервак нормально работал примерно лет 6-7, на нем в качестве хост-системы до сих пор стоИт Debian 9.13. Думаете стОит обновить ОС на хост-системе на 11й или 12й?

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Только что, Andrei сказал:

Думаете стОит обновить ОС на хост-системе на 11й или 12й?

А Б-г его знает. Я живу на роллинг релиз системе и у меня как у самурая. Нет цели, только путь. И он только вперёд. )))

 

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

2 часа назад, sol сказал:

гуглится

https://phabricator.wikimedia.org/T250869

Прям почти мой dmesg. Правда я не понял из треда чем там дело кончилось. Просто перенесли виртуалки на другой сервер и всечто ли...

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Обновили хост-систему  до 10го дебиана, драйвер raid-контроллера теперь 3.4.20-125 вместо 3.4.16-0.  Может тут баг был. Хотя вряд ли в этом причина, но попробовать стоило.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

У старых контроллеров HP бывали проблемы с работой MSI прерываний - сырая реализация. Можно попробовать выключить через опцию ядерного модуля (проверить с помощью modinfo) ну или через setpci

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

8 часов назад, jffulcrum сказал:

проверить с помощью modinfo

MSI не упоминается

 modinfo hpsa.ko
filename:       /lib/modules/4.19.0-25-amd64/kernel/drivers/scsi/hpsa.ko
alias:          cciss
license:        GPL
version:        3.4.20-125
description:    Driver for HP Smart Array Controller version 3.4.20-125
author:         Hewlett-Packard Company
srcversion:     D449EB771456DF83A0DD4EE
alias:          pci:v00000E11d*sv*sd*bc01sc04i*
alias:          pci:v0000103Cd*sv*sd*bc01sc04i*
alias:          pci:v0000103Cd0000333Fsv0000103Csd0000333Fbc*sc*i*
alias:          pci:v00001590d00000075sv00001590sd00000088bc*sc*i*
alias:          pci:v00001590d00000075sv00001590sd0000007Dbc*sc*i*
alias:          pci:v00001590d00000075sv00001590sd00000087bc*sc*i*
alias:          pci:v00001590d00000075sv00001590sd00000076bc*sc*i*
alias:          pci:v00009005d00000290sv00009005sd00000585bc*sc*i*
alias:          pci:v00009005d00000290sv00009005sd00000584bc*sc*i*
alias:          pci:v00009005d00000290sv00009005sd00000583bc*sc*i*
alias:          pci:v00009005d00000290sv00009005sd00000582bc*sc*i*
alias:          pci:v00009005d00000290sv00009005sd00000581bc*sc*i*
alias:          pci:v00009005d00000290sv00009005sd00000580bc*sc*i*
alias:          pci:v0000103Cd00003239sv0000103Csd000021CEbc*sc*i*
alias:          pci:v0000103Cd00003239sv0000103Csd000021CDbc*sc*i*
alias:          pci:v0000103Cd00003239sv0000103Csd000021CCbc*sc*i*
alias:          pci:v0000103Cd00003239sv0000103Csd000021CBbc*sc*i*
alias:          pci:v0000103Cd00003239sv0000103Csd000021CAbc*sc*i*
alias:          pci:v0000103Cd00003239sv0000103Csd000021C9bc*sc*i*
alias:          pci:v0000103Cd00003239sv0000103Csd000021C8bc*sc*i*
alias:          pci:v0000103Cd00003239sv0000103Csd000021C7bc*sc*i*
alias:          pci:v0000103Cd00003239sv0000103Csd000021C6bc*sc*i*
alias:          pci:v0000103Cd00003239sv0000103Csd000021C5bc*sc*i*
alias:          pci:v0000103Cd00003239sv0000103Csd000021C4bc*sc*i*
alias:          pci:v0000103Cd00003239sv0000103Csd000021C3bc*sc*i*
alias:          pci:v0000103Cd00003239sv0000103Csd000021C2bc*sc*i*
alias:          pci:v0000103Cd00003239sv0000103Csd000021C1bc*sc*i*
alias:          pci:v0000103Cd00003239sv0000103Csd000021C0bc*sc*i*
alias:          pci:v0000103Cd00003239sv0000103Csd000021BFbc*sc*i*
alias:          pci:v0000103Cd00003239sv0000103Csd000021BEbc*sc*i*
alias:          pci:v0000103Cd00003239sv0000103Csd000021BDbc*sc*i*
alias:          pci:v0000103Cd0000323Csv0000103Csd00001929bc*sc*i*
alias:          pci:v0000103Cd0000323Csv0000103Csd00001928bc*sc*i*
alias:          pci:v0000103Cd0000323Csv0000103Csd00001926bc*sc*i*
alias:          pci:v0000103Cd0000323Csv0000103Csd00001925bc*sc*i*
alias:          pci:v0000103Cd0000323Csv0000103Csd00001924bc*sc*i*
alias:          pci:v0000103Cd0000323Csv0000103Csd00001923bc*sc*i*
alias:          pci:v0000103Cd0000323Csv0000103Csd00001922bc*sc*i*
alias:          pci:v0000103Cd0000323Csv0000103Csd00001921bc*sc*i*
alias:          pci:v0000103Cd0000323Csv0000103Csd00001920bc*sc*i*
alias:          pci:v0000103Cd0000323Bsv0000103Csd00003356bc*sc*i*
alias:          pci:v0000103Cd0000323Bsv0000103Csd00003355bc*sc*i*
alias:          pci:v0000103Cd0000323Bsv0000103Csd00003354bc*sc*i*
alias:          pci:v0000103Cd0000323Bsv0000103Csd00003353bc*sc*i*
alias:          pci:v0000103Cd0000323Bsv0000103Csd00003352bc*sc*i*
alias:          pci:v0000103Cd0000323Bsv0000103Csd00003351bc*sc*i*
alias:          pci:v0000103Cd0000323Bsv0000103Csd00003350bc*sc*i*
alias:          pci:v0000103Cd0000323Asv0000103Csd00003233bc*sc*i*
alias:          pci:v0000103Cd0000323Asv0000103Csd0000324Bbc*sc*i*
alias:          pci:v0000103Cd0000323Asv0000103Csd0000324Abc*sc*i*
alias:          pci:v0000103Cd0000323Asv0000103Csd00003249bc*sc*i*
alias:          pci:v0000103Cd0000323Asv0000103Csd00003247bc*sc*i*
alias:          pci:v0000103Cd0000323Asv0000103Csd00003245bc*sc*i*
alias:          pci:v0000103Cd0000323Asv0000103Csd00003243bc*sc*i*
alias:          pci:v0000103Cd0000323Asv0000103Csd00003241bc*sc*i*
depends:        scsi_transport_sas,scsi_mod
retpoline:      Y
intree:         Y
name:           hpsa
vermagic:       4.19.0-25-amd64 SMP mod_unload modversions
sig_id:         PKCS#7
signer:         Debian Secure Boot CA
sig_key:        32:A0:28:7F:84:1A:03:6F:A3:93:C1:E0:65:C4:3A:E6:B2:42:26:43
sig_hashalgo:   sha256
signature:      AB:27:7E:DD:D0:9F:8E:59:7E:CE:7A:E8:B8:08:2B:36:66:D7:A1:E9:
                85:0D:C8:EC:12:0E:B2:C7:5F:D9:26:BC:7C:66:69:2B:1F:B2:AB:76:
                3F:F5:01:FD:E0:85:A8:9D:1D:96:C7:26:34:F8:73:B0:9D:47:A7:A9:
                3C:68:A2:C6:CA:CE:86:DC:1E:60:C0:77:5E:0C:60:42:7E:5E:11:19:
                7E:31:9D:B3:25:F7:54:23:CF:DD:96:5A:3E:B5:00:21:55:99:CC:77:
                5C:63:AE:42:7A:5C:CE:A3:ED:A1:AC:14:89:F6:0E:7F:EE:F3:0F:F1:
                A1:FE:B2:9D:83:9D:EB:80:BC:DE:C7:F0:8B:6A:37:1E:94:B7:86:86:
                0E:DA:A2:58:67:C3:E9:92:FE:B2:6E:5E:90:51:C8:57:F3:24:47:B2:
                1A:4A:E5:2F:B2:15:50:6C:1D:56:FB:92:A5:55:D9:66:56:CE:21:13:
                74:0E:B4:7C:9A:F0:1F:6B:FA:CF:C0:BC:A4:67:10:2D:16:45:90:54:
                D7:A6:54:84:48:13:9A:57:80:86:8C:5C:D0:F8:9A:23:68:EE:98:B7:
                00:23:9A:E1:6A:0C:76:C6:6B:1F:30:70:7D:D9:80:E0:AE:4B:BA:07:
                6C:77:47:AA:28:2B:8B:4D:6B:7D:07:EA:9C:51:21:04
parm:           hpsa_simple_mode:Use 'simple mode' rather than 'performant mode' (int)

 

И сомнительно, что дело в драйвере, т.к. до этого сервак работал стабильно лет 6 без обновлений.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

В 28.12.2023 в 07:32, Andrei сказал:

MSI не упоминается

cat /proc/interrupts

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

36 минут назад, sol сказал:

cat /proc/interrupts

Вот...

            CPU0       CPU1       CPU2       CPU3       CPU4       CPU5       CPU6       CPU7       CPU8       CPU9       CPU10      CPU11      CPU12      CPU13      CPU14      CPU15      CPU16      CPU17      CPU18      CPU19      CPU20      CPU21      CPU22      CPU23      CPU24      CPU25      CPU26      CPU27      CPU28      CPU29      CPU30      CPU31
   0:         43          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0  IR-IO-APIC    2-edge      timer
   1:          0          0          0          0          0          0          0          0          4          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0  IR-IO-APIC    1-edge      i8042
   8:          0          0          0          0          0          0          0          0          0          0          1          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0  IR-IO-APIC    8-edge      rtc0
   9:          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0  IR-IO-APIC    9-fasteoi   acpi
  12:          0          0          0          0          0          0          6          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0  IR-IO-APIC   12-edge      i8042
  14:          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0  IR-IO-APIC   14-edge      pata_atiixp
  15:          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0  IR-IO-APIC   15-edge      pata_atiixp
  16:          6          0          0          0         23          0        140          0      99250          0         81          0         73          0         77          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0  IR-IO-APIC   16-fasteoi   ahci[0000:00:11.0]
  22:          0          0          0          0         68          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0  IR-IO-APIC   22-fasteoi   ehci_hcd:usb3, ohci_hcd:usb4, ohci_hcd:usb5
  23:          0          0         60          0          0          0          0          0          0          0          0          0        355          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0  IR-IO-APIC   23-fasteoi   ehci_hcd:usb1, ohci_hcd:usb6, ohci_hcd:usb7
  25:          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0   PCI-MSI 4096-edge      AMD-Vi
  30:      60057          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0  IR-PCI-MSI 1572864-edge      hpsa2-msix0
  31:          0          0       1315          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0  IR-PCI-MSI 1572865-edge      hpsa2-msix1
  32:          0          0          0          0      70790          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0  IR-PCI-MSI 1572866-edge      hpsa2-msix2
  33:          0          0          0          0          0          0       4182          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0  IR-PCI-MSI 1572867-edge      hpsa2-msix3
  34:          0          0          0          0          0          0          0          0      76593          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0  IR-PCI-MSI 1572868-edge      hpsa2-msix4
  35:          0          0          0          0          0          0          0          0          0          0       3466          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0  IR-PCI-MSI 1572869-edge      hpsa2-msix5
  36:          0          0          0          0          0          0          0          0          0          0          0          0      79841          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0  IR-PCI-MSI 1572870-edge      hpsa2-msix6
  37:          0          0          0          0          0          0          0          0          0          0          0          0          0          0       3635          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0  IR-PCI-MSI 1572871-edge      hpsa2-msix7
  38:          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0      42526          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0  IR-PCI-MSI 1572872-edge      hpsa2-msix8
  39:          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0        332          0          0          0          0          0          0          0          0          0          0          0          0          0  IR-PCI-MSI 1572873-edge      hpsa2-msix9
  40:          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0      43330          0          0          0          0          0          0          0          0          0          0          0  IR-PCI-MSI 1572874-edge      hpsa2-msix10
  41:          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0        476          0          0          0          0          0          0          0          0          0  IR-PCI-MSI 1572875-edge      hpsa2-msix11
  42:          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0      46277          0          0          0          0          0          0          0  IR-PCI-MSI 1572876-edge      hpsa2-msix12
  43:          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0        524          0          0          0          0          0  IR-PCI-MSI 1572877-edge      hpsa2-msix13
  44:          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0      42792          0          0          0  IR-PCI-MSI 1572878-edge      hpsa2-msix14
  45:          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0        701          0  IR-PCI-MSI 1572879-edge      hpsa2-msix15
  46:          0      90732          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0  IR-PCI-MSI 1572880-edge      hpsa2-msix16
  47:          0          0          0        748          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0  IR-PCI-MSI 1572881-edge      hpsa2-msix17
  48:          0          0          0          0          0      58965          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0  IR-PCI-MSI 1572882-edge      hpsa2-msix18
  49:          0          0          0          0          0          0          0        585          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0  IR-PCI-MSI 1572883-edge      hpsa2-msix19
  50:          0          0          0          0          0          0          0          0          0      84811          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0  IR-PCI-MSI 1572884-edge      hpsa2-msix20
  51:          0          0          0          0          0          0          0          0          0          0          0        541          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0  IR-PCI-MSI 1572885-edge      hpsa2-msix21
  52:          0          0          0          0          0          0          0          0          0          0          0          0          0     115981          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0  IR-PCI-MSI 1572886-edge      hpsa2-msix22
  53:          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0       5749          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0  IR-PCI-MSI 1572887-edge      hpsa2-msix23
  54:          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0      66441          0          0          0          0          0          0          0          0          0          0          0          0          0          0  IR-PCI-MSI 1572888-edge      hpsa2-msix24
  55:          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0       2460          0          0          0          0          0          0          0          0          0          0          0          0  IR-PCI-MSI 1572889-edge      hpsa2-msix25
  56:          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0      67135          0          0          0          0          0          0          0          0          0          0  IR-PCI-MSI 1572890-edge      hpsa2-msix26
  57:          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0       3405          0          0          0          0          0          0          0          0  IR-PCI-MSI 1572891-edge      hpsa2-msix27
  58:          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0      70782          0          0          0          0          0          0  IR-PCI-MSI 1572892-edge      hpsa2-msix28
  59:          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0       2082          0          0          0          0  IR-PCI-MSI 1572893-edge      hpsa2-msix29
  60:          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0      65026          0          0  IR-PCI-MSI 1572894-edge      hpsa2-msix30
  61:          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0       4503  IR-PCI-MSI 1572895-edge      hpsa2-msix31
  62:          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0  IR-IO-APIC   20-fasteoi   uhci_hcd:usb2, hpilo
  64:          0          0          0          0        735          0          0          0         64          0          0          0    5198094          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0  IR-PCI-MSI 2097152-edge      eth0-tx-0
  65:          0          0          0          0          0          0    3069539          0          0          0         91          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0  IR-PCI-MSI 2097153-edge      eth0-rx-1
  66:          0          0          0          0    2405518          0          0          0       1931          0          0          0       3748          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0  IR-PCI-MSI 2097154-edge      eth0-rx-2
  67:    1937866          0        793          0        113          0          0          0          0          0          0          0         60          0          1          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0  IR-PCI-MSI 2097155-edge      eth0-rx-3
  68:          8          0          0          0      75933          0          0          0    3574750          0       2006          0       5830          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0  IR-PCI-MSI 2097156-edge      eth0-rx-4
 NMI:          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0   Non-maskable interrupts
 LOC:  124510236  784904631   32023198   22950864  397580825  839842415    9437915    7171961  341223955  818460427    5481637   10319579  503462936  940081940    9156672   27291962  747138269  784836062   40257458    4724273  716959573  860060308   42198753   35169283  800988486  970632425   37094065   39164066  800427699  311774363   24637742   12394369   Local timer interrupts
 SPU:          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0   Spurious interrupts
 PMI:          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0   Performance monitoring interrupts
 IWI:          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          2          0          2          0          0          0   IRQ work interrupts
 RTR:          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0   APIC ICR read retries
 RES:    7572532   20807317    1029390     618651   10243249   21818445    1703135     195258    9620159   21034625     308843     334319   14991340   23157979     453139     722367   19316762   19173694    1216846      81983   18220204   19713000    1017633     678816   20656620   22278476     920311    1015532   20386289    7573413     536951     401525   Rescheduling interrupts
 CAL:     269517    1444713     117435      94710     693953    1612074      81045      72970     634386    1471829      68352      80100     895915    1608501      78353     113318    1286460    1313876     143414      66147    1239286    1439443     132872     100893    1492543    1610984     125122     130500    1337035     627379     101106      90132   Function call interrupts
 TLB:       4901      11579       1523       3987       7328      11637       4933        813       6720      11679       1389       1403       9993      12512       1404       2086      10275      10536       1310       1207       9997      11355       1490       1184       9949      11892       1053       3052      10255       7465        864       1457   TLB shootdowns
 TRM:          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0   Thermal event interrupts
 THR:          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0   Threshold APIC interrupts
 DFR:          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0   Deferred Error APIC interrupts
 MCE:          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0   Machine check exceptions
 MCP:        531        531        531        531        531        531        531        531        531        531        531        531        531        531        531        531        531        531        531        531        531        531        531        531        531        531        531        531        531        531        531        531   Machine check polls
 ERR:          1
 MIS:          0
 PIN:          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0   Posted-interrupt notification event
 NPI:          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0   Nested posted-interrupt event
 PIW:          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0          0   Posted-interrupt wakeup event

 

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

В 27.12.2023 в 19:26, Andrei сказал:

Обновили хост-систему  до 10го дебиана, драйвер raid-контроллера теперь 3.4.20-125 вместо 3.4.16-0.  Может тут баг был. Хотя вряд ли в этом причина, но попробовать стоило.

Апрегйднули хост-систему до дебиан 11.9, версия драйвера рейд-контроллера теперь 3.4.20-200.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

В 26.12.2023 в 18:36, sol сказал:

баги в драйвере.

Переход на новый дравйер не помог, сегодня ночью система опять умерла.

В ILO вообще все ОК, никакой красноты, по ssh на сервер пустило, файлуха в read-only, dmesg забит записями вида

[585963.858982] systemd-journald[496]: Failed to write entry (22 items, 754 bytes), ignoring: Read-only file system

Вчера приехал новый рэйд-контроллер HP SmartArray 420, видимо будет ставить его и переключать диски на него.

В BIOS надо будет что-то поправить или само подхватится?

 

update: поставили новый контроллер, после танцев с бубном (не хотел грузиться с рейда на новом контроллере, хотя диски и рейд видел) запустили. Наблюдаем.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

dmesg
 

[1471764.099814] hpsa 0000:0b:00.0: scsi 2:0:2:0: removed Direct-Access     ATA      WDC WD5000LPLX-0 PHYS DRV SSDSmartPathCap- En- Exp=0
[1471767.806099] hpsa 0000:0b:00.0: scsi 2:1:0:1: resetting logical  Direct-Access     HP       LOGICAL VOLUME   RAID-1(+0) SSDSmartPathCap- En- Exp=1
[1471777.029643] hpsa 0000:0b:00.0: device is ready.
[1471777.029652] hpsa 0000:0b:00.0: scsi 2:1:0:1: reset logical  completed successfully Direct-Access     HP       LOGICAL VOLUME   RAID-1(+0) SSDSmartPathCap- En- Exp=1
[1471956.140316] hpsa 0000:0b:00.0: aborted: LUN:000000c000000601 CDB:12000000310000000000000000000000
[1471956.140335] hpsa 0000:0b:00.0: hpsa_update_device_info: inquiry failed, device will be skipped.
[1471981.404131] hpsa 0000:0b:00.0: scsi 2:1:0:1: resetting logical  Direct-Access     HP       LOGICAL VOLUME   RAID-1(+0) SSDSmartPathCap- En- Exp=1
[1471982.458746] hpsa 0000:0b:00.0: device is ready.
[1471982.458751] hpsa 0000:0b:00.0: scsi 2:1:0:1: reset logical  completed successfully Direct-Access     HP       LOGICAL VOLUME   RAID-1(+0) SSDSmartPathCap- En- Exp=1
[1472092.910909] hpsa 0000:0b:00.0: scsi 2:1:0:1: resetting logical  Direct-Access     HP       LOGICAL VOLUME   RAID-1(+0) SSDSmartPathCap- En- Exp=1
[1472105.400303] hpsa 0000:0b:00.0: aborted: LUN:000000c000000601 CDB:12000000310000000000000000000000
[1472105.400321] hpsa 0000:0b:00.0: hpsa_update_device_info: inquiry failed, device will be skipped.
[1472106.774327] hpsa 0000:0b:00.0: device is ready.
[1472106.774357] hpsa 0000:0b:00.0: scsi 2:1:0:1: reset logical  completed successfully Direct-Access     HP       LOGICAL VOLUME   RAID-1(+0) SSDSmartPathCap- En- Exp=1

 

Рейд развалился

 ssacli ctrl slot=3 pd all show
Smart Array P420 in Slot 3
   Array A
      physicaldrive 1I:2:2 (port 1I:box 2:bay 2, SATA HDD, 500 GB, OK)
      physicaldrive 1I:2:3 (port 1I:box 2:bay 3, SATA HDD, 500 GB, Failed)

И кэш на контроллере почему-то стал disable

 ssacli ctrl all show status

Smart Array P420 in Slot 3
   Controller Status: OK
   Cache Status: Temporarily Disabled
   Battery/Capacitor Status: Recharging


Просто поменять диск в 3ей корзине на живой SATA 500 и они засинхрятся в рейде?

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Похоже, сервер проклят.

 

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

2 часа назад, Andrei сказал:

Просто поменять диск в 3ей корзине на живой SATA 500 и они засинхрятся в рейде?

Да. Smartctl для помершего диска что показывает?

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

В 23.01.2024 в 14:52, Andrei сказал:

И кэш на контроллере почему-то стал disable

 ssacli ctrl all show status

Smart Array P420 in Slot 3
   Controller Status: OK
   Cache Status: Temporarily Disabled
   Battery/Capacitor Status: Recharging

На 420 мрут "опухают" супер конденсаторы - заменить.

П.С. Бу долго не живут, я покупал отдельно новые конденсаторы и колхозил.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

5 часов назад, sol сказал:

Похоже, сервер проклят.

 

Сервер из-под СОРМа. Наверное поэтому :)

 

4 часа назад, jffulcrum сказал:

Smartctl для помершего диска что показывает?

На то он и умерший, что ничего не показывает. :)

Вынул/вставил диск, ребилд прошел, smartctl его увидел

smartctl -a  -d cciss,1 /dev/sda
smartctl 7.2 2020-12-30 r5155 [x86_64-linux-5.10.0-26-amd64] (local build)
Copyright (C) 2002-20, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family:     Western Digital Black Mobile
Device Model:     WDC WD5000LPLX-00ZNTT0
Serial Number:    WD-WXE1AA9766TL
LU WWN Device Id: 5 0014ee 211effa4b
Firmware Version: 01.01A01
User Capacity:    500,107,862,016 bytes [500 GB]
Sector Sizes:     512 bytes logical, 4096 bytes physical
Rotation Rate:    7200 rpm
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   ACS-2, ACS-3 T13/2161-D revision 3b
SATA Version is:  SATA 3.1, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is:    Tue Jan 23 18:22:22 2024 +05
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART Status not supported: Incomplete response, ATA output registers missing
SMART overall-health self-assessment test result: PASSED
Warning: This result is based on an Attribute check.

General SMART Values:
Offline data collection status:  (0x00) Offline data collection activity
                                        was never started.
                                        Auto Offline Data Collection: Disabled.
Self-test execution status:      (   0) The previous self-test routine completed
                                        without error or no self-test has ever
                                        been run.
Total time to complete Offline
data collection:                ( 6780) seconds.
Offline data collection
capabilities:                    (0x7b) SMART execute Offline immediate.
                                        Auto Offline data collection on/off support.
                                        Suspend Offline collection upon new
                                        command.
                                        Offline surface scan supported.
                                        Self-test supported.
                                        Conveyance Self-test supported.
                                        Selective Self-test supported.
SMART capabilities:            (0x0003) Saves SMART data before entering
                                        power-saving mode.
                                        Supports SMART auto save timer.
Error logging capability:        (0x01) Error logging supported.
                                        General Purpose Logging supported.
Short self-test routine
recommended polling time:        (   2) minutes.
Extended self-test routine
recommended polling time:        (  80) minutes.
Conveyance self-test routine
recommended polling time:        (   5) minutes.
SCT capabilities:              (0x3035) SCT Status supported.
                                        SCT Feature Control supported.
                                        SCT Data Table supported.


SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   200   200   051    Pre-fail  Always       -       0
  3 Spin_Up_Time            0x0027   151   142   021    Pre-fail  Always       -       1433
  4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -       34
  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x002e   100   253   000    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   055   055   000    Old_age   Always       -       33349
 10 Spin_Retry_Count        0x0032   100   253   000    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0032   100   253   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       34
192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always       -       32
193 Load_Cycle_Count        0x0032   108   108   000    Old_age   Always       -       276266
194 Temperature_Celsius     0x0022   128   105   000    Old_age   Always       -       15
196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0030   100   253   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0008   100   253   000    Old_age   Offline      -       0

SMART Error Log Version: 1
ATA Error Count: 58 (device log contains only the most recent five errors)
        CR = Command Register [HEX]
        FR = Features Register [HEX]
        SC = Sector Count Register [HEX]
        SN = Sector Number Register [HEX]
        CL = Cylinder Low Register [HEX]
        CH = Cylinder High Register [HEX]
        DH = Device/Head Register [HEX]
        DC = Device Command Register [HEX]
        ER = Error register [HEX]
        ST = Status register [HEX]
Powered_Up_Time is measured from power on, and printed as
DDd+hh:mm:SS.sss where DD=days, hh=hours, mm=minutes,
SS=sec, and sss=millisec. It "wraps" after 49.710 days.

Error 58 occurred at disk power-on lifetime: 33285 hours (1386 days + 21 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  04 51 00 00 00 00 00

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  b4 00 00 00 00 00 00 00  14d+08:55:58.481  SANITIZE DEVICE
  ec 00 01 00 00 00 00 00  14d+08:55:58.466  IDENTIFY DEVICE
  ec 00 00 00 00 00 00 00  14d+08:55:58.393  IDENTIFY DEVICE
  ec 00 00 00 00 00 00 00  14d+08:55:58.392  IDENTIFY DEVICE

Error 57 occurred at disk power-on lifetime: 33285 hours (1386 days + 21 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  04 51 00 00 00 00 00

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  b4 00 00 00 00 00 00 00  14d+08:55:11.184  SANITIZE DEVICE
  ec 00 01 00 00 00 00 00  14d+08:55:11.168  IDENTIFY DEVICE
  ec 00 00 00 00 00 00 00  14d+08:55:11.095  IDENTIFY DEVICE
  ec 00 00 00 00 00 00 00  14d+08:55:11.094  IDENTIFY DEVICE

Error 56 occurred at disk power-on lifetime: 32940 hours (1372 days + 12 hours)
  When the command that caused the error occurred, the device was active or idle.


After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  04 51 00 00 00 00 00

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  b4 00 00 00 00 00 00 00      00:31:09.078  SANITIZE DEVICE
  ec 00 01 00 00 00 00 00      00:31:09.062  IDENTIFY DEVICE

Error 55 occurred at disk power-on lifetime: 32728 hours (1363 days + 16 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  04 51 00 00 00 00 00

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  b4 00 00 00 00 00 00 00   1d+06:51:25.614  SANITIZE DEVICE
  ec 00 01 00 00 00 00 00   1d+06:51:25.562  IDENTIFY DEVICE

Error 54 occurred at disk power-on lifetime: 32728 hours (1363 days + 16 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  04 51 00 00 00 00 00

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  b4 00 00 00 00 00 00 00   1d+06:51:16.131  SANITIZE DEVICE
  ec 00 01 00 00 00 00 00   1d+06:51:16.065  IDENTIFY DEVICE

SMART Self-test log structure revision number 1
No self-tests have been logged.  [To run self-tests, use: smartctl -t]

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

 

 

17 минут назад, bike сказал:

На 420 мрут "опухают" супер конденсаторы - заменить.

П.С. Бу долго не живут, я покупал отдельно новые конденсаторы и колхозил.

Да, батарейка похоже того-с... Но есть вторая, попробуем подцепить ее.

 

ssacli ctrl slot=3 show detail

Smart Array P420 in Slot 3
...

   Cache Board Present: True
   Cache Status: Temporarily Disabled
   Cache Status Details: Cache disabled; the backup power source charge is low.
   Cache Disable Reason: Temporary disable condition. The posted write cache has been disabled in a flash-backed write cache module because the backup power source charge is low.
   Drive Write Cache: Disabled

...

 

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

А не может быть, что отвалы дисков из-за переохлаждения?
 

 ssacli ctrl all show config detail | grep Current
         Current Temperature (C): 6
         Current Temperature (C): 5

 

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.

Гость
Ответить в тему...

×   Вставлено в виде отформатированного текста.   Вставить в виде обычного текста

  Разрешено не более 75 смайлов.

×   Ваша ссылка была автоматически встроена.   Отобразить как ссылку

×   Ваш предыдущий контент был восстановлен.   Очистить редактор

×   Вы не можете вставить изображения напрямую. Загрузите или вставьте изображения по ссылке.