UglyAdmin Опубликовано 7 декабря, 2023 · Жалоба 25 minutes ago, sol said: Если вы её форматировали, то одна из задач форматирования - это маркировка сбойных секторов и исключение их из использования Файловой Системой. 1. Для этого надо делать полное форматирование, а не быстрое. 2. Если сбойный сектор в пределах первого мегабайта, т.е. в системной области - карточка не будет отформатирована, будет выдана ошибка. Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
sol Опубликовано 7 декабря, 2023 · Жалоба 12 минут назад, UglyAdmin сказал: 2. Если сбойный сектор в пределах первого мегабайта, т.е. в системной области - карточка не будет отформатирована, будет выдана ошибка. Не так. Сбойным не может быть только первый сектор, первые 512 байт. Там лежит таблица разделов. Всё остальное можно пережить. Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
Andrei Опубликовано 7 декабря, 2023 · Жалоба 57 минут назад, sol сказал: Дааааа... Вот и выросло поколение не видевшее и не форматировавшее дискету... Не угадали. Мне годочков 50+, я всякие дискеты повидал, а так же перфоленты и перфокарты. :) Суть - 100% новая живая карта стала там там Degradated через несколько минут. 57 минут назад, sol сказал: Ну вы же dmesg в момент сбоя нам не показали. Зажали и себе оставили. Если б я dmesg посмотрел, то не утаил бы. А так - видимо до следующего сбоя (тьфу*3) Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
Andrei Опубликовано 17 декабря, 2023 · Жалоба В 25.11.2023 в 17:03, Andrei сказал: И что это за карта - обычная SD или какая-нибудь PCMCI или микруха, напаянная на мать? В инете что-то противоречиво на этот счет. В общем похоже, что это дохнет NAND-память на матери. Судя по всему, не сильно критично, если не нужны логи ILO. И сервак, после того как я его вскрывал и пощщупал ему внутри шлейфы :) , пока больше не сбоил (тьфу*3). Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
h3ll1 Опубликовано 18 декабря, 2023 (изменено) · Жалоба Quote В общем похоже, что это дохнет NAND-память на матери. Не все ли там как у Supermicro? https://www.supermicro.com/manuals/other/embedded_bmc_ipmi.pdf Изменено 18 декабря, 2023 пользователем h3ll1 Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
Andrei Опубликовано 26 декабря, 2023 · Жалоба В 07.12.2023 в 18:37, sol сказал: Ну вы же dmesg в момент сбоя нам не показали. Сегодня опять контроллер сбойнул. Вот dmesg, видимо начиная с timecode 1785237.255242 sdb - это флэшка (sd-card) dmesg.txt В ILO диски видно, а контроллер - FAILED Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
sol Опубликовано 26 декабря, 2023 · Жалоба 3 часа назад, Andrei сказал: Вот dmesg, видимо начиная с timecode C форума файлики более не скачиваются. "Проблема решается", когда решится не ясно. Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
Andrei Опубликовано 26 декабря, 2023 · Жалоба 21 минуту назад, sol сказал: C форума файлики более не скачиваются. "Проблема решается", когда решится не ясно. [1785237.255242] hpsa 0000:03:00.0: scsi 2:1:0:1: resetting logical Direct-Access HP LOGICAL VOLUME RAID-1(+0) SSDSmartPathCap- En- Exp=1 [1785306.437241] hpsa 0000:03:00.0: Controller lockup detected: 0x00140001 after 30 [1785306.437299] hpsa 0000:03:00.0: controller lockup detected: LUN:0100004000000000 CDB:01040000000000000000000000000000 [1785306.437305] hpsa 0000:03:00.0: Controller lockup detected during reset wait [1785306.437315] hpsa 0000:03:00.0: scsi 2:1:0:1: reset logical failed Direct-Access HP LOGICAL VOLUME RAID-1(+0) SSDSmartPathCap- En- Exp=1 [1785306.437317] hpsa 0000:03:00.0: failed 20 commands in fail_all [1785306.437330] sd 2:1:0:1: Device offlined - not ready after error recovery [1785306.437341] sd 2:1:0:1: Device offlined - not ready after error recovery [1785306.437348] sd 2:1:0:1: Device offlined - not ready after error recovery [1785306.437362] sd 2:1:0:1: Device offlined - not ready after error recovery [1785306.437365] sd 2:1:0:1: Device offlined - not ready after error recovery [1785306.437368] sd 2:1:0:1: Device offlined - not ready after error recovery [1785306.437371] sd 2:1:0:1: Device offlined - not ready after error recovery [1785306.437374] sd 2:1:0:1: Device offlined - not ready after error recovery [1785306.437377] sd 2:1:0:1: Device offlined - not ready after error recovery [1785306.437380] sd 2:1:0:1: Device offlined - not ready after error recovery [1785306.437383] sd 2:1:0:1: Device offlined - not ready after error recovery [1785306.437388] sd 2:1:0:1: Device offlined - not ready after error recovery [1785306.437397] sd 2:1:0:1: Device offlined - not ready after error recovery [1785306.437403] sd 2:1:0:1: Device offlined - not ready after error recovery [1785306.437411] sd 2:1:0:1: Device offlined - not ready after error recovery [1785306.437420] sd 2:1:0:1: Device offlined - not ready after error recovery [1785306.437427] sd 2:1:0:1: Device offlined - not ready after error recovery [1785306.437430] sd 2:1:0:1: Device offlined - not ready after error recovery [1785306.437433] sd 2:1:0:1: Device offlined - not ready after error recovery [1785306.437449] sd 2:1:0:1: [sda] tag#1 FAILED Result: hostbyte=DID_NO_CONNECT driverbyte=DRIVER_OK [1785306.437455] sd 2:1:0:1: [sda] tag#1 CDB: Write(10) 2a 00 0a 23 6a a0 00 00 20 00 [1785306.437459] blk_update_request: I/O error, dev sda, sector 170093216 [1785306.439541] sd 2:1:0:1: rejecting I/O to offline device [1785306.441505] sd 2:1:0:1: [sda] killing request [1785306.441521] sd 2:1:0:1: rejecting I/O to offline device [1785306.443534] Aborting journal on device sda1-8. [1785306.443541] sd 2:1:0:1: [sda] tag#18 FAILED Result: hostbyte=DID_NO_CONNECT driverbyte=DRIVER_OK [1785306.443555] sd 2:1:0:1: [sda] tag#18 CDB: Write(10) 2a 00 04 f0 10 80 00 00 08 00 [1785306.443560] blk_update_request: I/O error, dev sda, sector 82841728 [1785306.443574] sd 2:1:0:1: [sda] tag#0 FAILED Result: hostbyte=DID_NO_CONNECT driverbyte=DRIVER_OK [1785306.443579] sd 2:1:0:1: [sda] tag#0 CDB: Write(10) 2a 00 05 12 5e 50 00 00 18 00 [1785306.443581] blk_update_request: I/O error, dev sda, sector 85089872 [1785306.443595] sd 2:1:0:1: [sda] tag#8 FAILED Result: hostbyte=DID_NO_CONNECT driverbyte=DRIVER_OK [1785306.443599] sd 2:1:0:1: [sda] tag#8 CDB: Write(10) 2a 00 05 12 5e 68 00 00 50 00 [1785306.443601] blk_update_request: I/O error, dev sda, sector 85089896 [1785306.443621] sd 2:1:0:1: [sda] tag#9 FAILED Result: hostbyte=DID_NO_CONNECT driverbyte=DRIVER_OK [1785306.443625] sd 2:1:0:1: [sda] tag#9 CDB: Write(10) 2a 00 07 4a 44 40 00 00 20 00 [1785306.443627] blk_update_request: I/O error, dev sda, sector 122307648 [1785306.443645] sd 2:1:0:1: [sda] tag#10 FAILED Result: hostbyte=DID_NO_CONNECT driverbyte=DRIVER_OK [1785306.443651] sd 2:1:0:1: [sda] tag#10 CDB: Write(10) 2a 00 0a 23 68 00 00 00 20 00 [1785306.443656] blk_update_request: I/O error, dev sda, sector 170092544 [1785306.443672] sd 2:1:0:1: [sda] tag#11 FAILED Result: hostbyte=DID_NO_CONNECT driverbyte=DRIVER_OK [1785306.443676] sd 2:1:0:1: [sda] tag#11 CDB: Write(10) 2a 00 0a 23 68 a0 00 00 20 00 [1785306.443682] blk_update_request: I/O error, dev sda, sector 170092704 [1785306.443704] sd 2:1:0:1: [sda] tag#5 FAILED Result: hostbyte=DID_NO_CONNECT driverbyte=DRIVER_OK [1785306.443708] sd 2:1:0:1: [sda] tag#5 CDB: Write(10) 2a 00 17 fa 3e 80 00 00 f8 00 [1785306.443710] blk_update_request: I/O error, dev sda, sector 402275968 [1785306.443722] sd 2:1:0:1: [sda] tag#6 FAILED Result: hostbyte=DID_NO_CONNECT driverbyte=DRIVER_OK [1785306.443726] sd 2:1:0:1: [sda] tag#6 CDB: Write(10) 2a 00 17 fa 3f 78 00 00 88 00 [1785306.443728] blk_update_request: I/O error, dev sda, sector 402276216 [1785306.443748] sd 2:1:0:1: [sda] tag#4 FAILED Result: hostbyte=DID_NO_CONNECT driverbyte=DRIVER_OK [1785306.443753] sd 2:1:0:1: [sda] tag#4 CDB: Write(10) 2a 00 18 1e aa e0 00 00 40 00 [1785306.443755] blk_update_request: I/O error, dev sda, sector 404663008 [1785306.444335] device eth0.5 left promiscuous mode [1785306.444338] device eth0 left promiscuous mode [1785306.451548] sd 2:1:0:1: rejecting I/O to offline device [1785306.451573] sd 2:1:0:1: rejecting I/O to offline device [1785306.451584] sd 2:1:0:1: rejecting I/O to offline device [1785306.451594] sd 2:1:0:1: rejecting I/O to offline device [1785306.451602] sd 2:1:0:1: rejecting I/O to offline device [1785306.451610] sd 2:1:0:1: rejecting I/O to offline device [1785306.451620] sd 2:1:0:1: rejecting I/O to offline device [1785306.451629] sd 2:1:0:1: rejecting I/O to offline device [1785306.451640] sd 2:1:0:1: rejecting I/O to offline device [1785306.451648] sd 2:1:0:1: rejecting I/O to offline device [1785306.451657] sd 2:1:0:1: rejecting I/O to offline device [1785306.451687] sd 2:1:0:1: rejecting I/O to offline device [1785306.451698] sd 2:1:0:1: rejecting I/O to offline device [1785306.451706] sd 2:1:0:1: rejecting I/O to offline device [1785306.451714] sd 2:1:0:1: rejecting I/O to offline device [1785306.451722] sd 2:1:0:1: rejecting I/O to offline device [1785306.451730] sd 2:1:0:1: rejecting I/O to offline device [1785306.451738] sd 2:1:0:1: rejecting I/O to offline device [1785306.451747] sd 2:1:0:1: rejecting I/O to offline device [1785306.451756] sd 2:1:0:1: rejecting I/O to offline device [1785306.451764] sd 2:1:0:1: rejecting I/O to offline device [1785306.451774] sd 2:1:0:1: rejecting I/O to offline device [1785306.451783] sd 2:1:0:1: rejecting I/O to offline device [1785306.451791] sd 2:1:0:1: rejecting I/O to offline device [1785306.454290] sd 2:1:0:1: rejecting I/O to offline device [1785306.454592] sd 2:1:0:1: rejecting I/O to offline device [1785306.462616] sd 2:1:0:1: rejecting I/O to offline device [1785306.462624] EXT4-fs warning (device sda1): ext4_end_bio:314: I/O error -5 writing to inode 6554187 (offset 0 size 0 starting block 70720740) [1785306.462628] Buffer I/O error on device sda1, logical block 70720483 [1785306.462643] sd 2:1:0:1: rejecting I/O to offline device [1785306.462648] EXT4-fs warning (device sda1): ext4_end_bio:314: I/O error -5 writing to inode 6554267 (offset 0 size 0 starting block 70720755) [1785306.462652] Buffer I/O error on device sda1, logical block 70720498 [1785306.514644] sd 2:1:0:1: rejecting I/O to offline device [1785306.515641] JBD2: Error -5 detected when updating journal superblock for sda1-8. [1785306.545230] sd 2:1:0:1: rejecting I/O to offline device [1785306.546547] EXT4-fs error (device sda1): ext4_journal_check_start:56: Detected aborted journal [1785306.547383] EXT4-fs (sda1): Remounting filesystem read-only [1785306.548204] EXT4-fs (sda1): previous I/O error to superblock detected [1785306.549020] sd 2:1:0:1: rejecting I/O to offline device [1785691.095208] sd 2:1:0:1: rejecting I/O to offline device [1785691.096383] EXT4-fs error (device sda1): ext4_find_entry:1474: inode #10354753: comm sh: reading directory lblock 0 [1785691.097530] EXT4-fs (sda1): previous I/O error to superblock detected [1785691.098606] sd 2:1:0:1: rejecting I/O to offline device Полная версия тут - https://disk.yandex.ru/d/eFLu8SzwurJguA Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
sol Опубликовано 26 декабря, 2023 · Жалоба Похоже на отъезд контроллера, но! по фразе "Controller lockup detected:" гуглится много любопытного, начиная с баги в драйвере. Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
Andrei Опубликовано 26 декабря, 2023 · Жалоба 14 минут назад, sol сказал: Похоже на отъезд контроллера, но! по фразе "Controller lockup detected:" гуглится много любопытного, начиная с баги в драйвере. Контроллер на замену уже купил, едет. По "Controller lockup detected:" гуглил. Да, баги драйвера упоминаются, правда не в отношении HP 420. К тому же сервак нормально работал примерно лет 6-7, на нем в качестве хост-системы до сих пор стоИт Debian 9.13. Думаете стОит обновить ОС на хост-системе на 11й или 12й? Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
sol Опубликовано 26 декабря, 2023 · Жалоба Только что, Andrei сказал: Думаете стОит обновить ОС на хост-системе на 11й или 12й? А Б-г его знает. Я живу на роллинг релиз системе и у меня как у самурая. Нет цели, только путь. И он только вперёд. ))) Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
Andrei Опубликовано 26 декабря, 2023 · Жалоба 2 часа назад, sol сказал: гуглится https://phabricator.wikimedia.org/T250869 Прям почти мой dmesg. Правда я не понял из треда чем там дело кончилось. Просто перенесли виртуалки на другой сервер и всечто ли... Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
Andrei Опубликовано 27 декабря, 2023 · Жалоба Обновили хост-систему до 10го дебиана, драйвер raid-контроллера теперь 3.4.20-125 вместо 3.4.16-0. Может тут баг был. Хотя вряд ли в этом причина, но попробовать стоило. Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
jffulcrum Опубликовано 27 декабря, 2023 · Жалоба У старых контроллеров HP бывали проблемы с работой MSI прерываний - сырая реализация. Можно попробовать выключить через опцию ядерного модуля (проверить с помощью modinfo) ну или через setpci Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
Andrei Опубликовано 28 декабря, 2023 · Жалоба 8 часов назад, jffulcrum сказал: проверить с помощью modinfo MSI не упоминается modinfo hpsa.ko filename: /lib/modules/4.19.0-25-amd64/kernel/drivers/scsi/hpsa.ko alias: cciss license: GPL version: 3.4.20-125 description: Driver for HP Smart Array Controller version 3.4.20-125 author: Hewlett-Packard Company srcversion: D449EB771456DF83A0DD4EE alias: pci:v00000E11d*sv*sd*bc01sc04i* alias: pci:v0000103Cd*sv*sd*bc01sc04i* alias: pci:v0000103Cd0000333Fsv0000103Csd0000333Fbc*sc*i* alias: pci:v00001590d00000075sv00001590sd00000088bc*sc*i* alias: pci:v00001590d00000075sv00001590sd0000007Dbc*sc*i* alias: pci:v00001590d00000075sv00001590sd00000087bc*sc*i* alias: pci:v00001590d00000075sv00001590sd00000076bc*sc*i* alias: pci:v00009005d00000290sv00009005sd00000585bc*sc*i* alias: pci:v00009005d00000290sv00009005sd00000584bc*sc*i* alias: pci:v00009005d00000290sv00009005sd00000583bc*sc*i* alias: pci:v00009005d00000290sv00009005sd00000582bc*sc*i* alias: pci:v00009005d00000290sv00009005sd00000581bc*sc*i* alias: pci:v00009005d00000290sv00009005sd00000580bc*sc*i* alias: pci:v0000103Cd00003239sv0000103Csd000021CEbc*sc*i* alias: pci:v0000103Cd00003239sv0000103Csd000021CDbc*sc*i* alias: pci:v0000103Cd00003239sv0000103Csd000021CCbc*sc*i* alias: pci:v0000103Cd00003239sv0000103Csd000021CBbc*sc*i* alias: pci:v0000103Cd00003239sv0000103Csd000021CAbc*sc*i* alias: pci:v0000103Cd00003239sv0000103Csd000021C9bc*sc*i* alias: pci:v0000103Cd00003239sv0000103Csd000021C8bc*sc*i* alias: pci:v0000103Cd00003239sv0000103Csd000021C7bc*sc*i* alias: pci:v0000103Cd00003239sv0000103Csd000021C6bc*sc*i* alias: pci:v0000103Cd00003239sv0000103Csd000021C5bc*sc*i* alias: pci:v0000103Cd00003239sv0000103Csd000021C4bc*sc*i* alias: pci:v0000103Cd00003239sv0000103Csd000021C3bc*sc*i* alias: pci:v0000103Cd00003239sv0000103Csd000021C2bc*sc*i* alias: pci:v0000103Cd00003239sv0000103Csd000021C1bc*sc*i* alias: pci:v0000103Cd00003239sv0000103Csd000021C0bc*sc*i* alias: pci:v0000103Cd00003239sv0000103Csd000021BFbc*sc*i* alias: pci:v0000103Cd00003239sv0000103Csd000021BEbc*sc*i* alias: pci:v0000103Cd00003239sv0000103Csd000021BDbc*sc*i* alias: pci:v0000103Cd0000323Csv0000103Csd00001929bc*sc*i* alias: pci:v0000103Cd0000323Csv0000103Csd00001928bc*sc*i* alias: pci:v0000103Cd0000323Csv0000103Csd00001926bc*sc*i* alias: pci:v0000103Cd0000323Csv0000103Csd00001925bc*sc*i* alias: pci:v0000103Cd0000323Csv0000103Csd00001924bc*sc*i* alias: pci:v0000103Cd0000323Csv0000103Csd00001923bc*sc*i* alias: pci:v0000103Cd0000323Csv0000103Csd00001922bc*sc*i* alias: pci:v0000103Cd0000323Csv0000103Csd00001921bc*sc*i* alias: pci:v0000103Cd0000323Csv0000103Csd00001920bc*sc*i* alias: pci:v0000103Cd0000323Bsv0000103Csd00003356bc*sc*i* alias: pci:v0000103Cd0000323Bsv0000103Csd00003355bc*sc*i* alias: pci:v0000103Cd0000323Bsv0000103Csd00003354bc*sc*i* alias: pci:v0000103Cd0000323Bsv0000103Csd00003353bc*sc*i* alias: pci:v0000103Cd0000323Bsv0000103Csd00003352bc*sc*i* alias: pci:v0000103Cd0000323Bsv0000103Csd00003351bc*sc*i* alias: pci:v0000103Cd0000323Bsv0000103Csd00003350bc*sc*i* alias: pci:v0000103Cd0000323Asv0000103Csd00003233bc*sc*i* alias: pci:v0000103Cd0000323Asv0000103Csd0000324Bbc*sc*i* alias: pci:v0000103Cd0000323Asv0000103Csd0000324Abc*sc*i* alias: pci:v0000103Cd0000323Asv0000103Csd00003249bc*sc*i* alias: pci:v0000103Cd0000323Asv0000103Csd00003247bc*sc*i* alias: pci:v0000103Cd0000323Asv0000103Csd00003245bc*sc*i* alias: pci:v0000103Cd0000323Asv0000103Csd00003243bc*sc*i* alias: pci:v0000103Cd0000323Asv0000103Csd00003241bc*sc*i* depends: scsi_transport_sas,scsi_mod retpoline: Y intree: Y name: hpsa vermagic: 4.19.0-25-amd64 SMP mod_unload modversions sig_id: PKCS#7 signer: Debian Secure Boot CA sig_key: 32:A0:28:7F:84:1A:03:6F:A3:93:C1:E0:65:C4:3A:E6:B2:42:26:43 sig_hashalgo: sha256 signature: AB:27:7E:DD:D0:9F:8E:59:7E:CE:7A:E8:B8:08:2B:36:66:D7:A1:E9: 85:0D:C8:EC:12:0E:B2:C7:5F:D9:26:BC:7C:66:69:2B:1F:B2:AB:76: 3F:F5:01:FD:E0:85:A8:9D:1D:96:C7:26:34:F8:73:B0:9D:47:A7:A9: 3C:68:A2:C6:CA:CE:86:DC:1E:60:C0:77:5E:0C:60:42:7E:5E:11:19: 7E:31:9D:B3:25:F7:54:23:CF:DD:96:5A:3E:B5:00:21:55:99:CC:77: 5C:63:AE:42:7A:5C:CE:A3:ED:A1:AC:14:89:F6:0E:7F:EE:F3:0F:F1: A1:FE:B2:9D:83:9D:EB:80:BC:DE:C7:F0:8B:6A:37:1E:94:B7:86:86: 0E:DA:A2:58:67:C3:E9:92:FE:B2:6E:5E:90:51:C8:57:F3:24:47:B2: 1A:4A:E5:2F:B2:15:50:6C:1D:56:FB:92:A5:55:D9:66:56:CE:21:13: 74:0E:B4:7C:9A:F0:1F:6B:FA:CF:C0:BC:A4:67:10:2D:16:45:90:54: D7:A6:54:84:48:13:9A:57:80:86:8C:5C:D0:F8:9A:23:68:EE:98:B7: 00:23:9A:E1:6A:0C:76:C6:6B:1F:30:70:7D:D9:80:E0:AE:4B:BA:07: 6C:77:47:AA:28:2B:8B:4D:6B:7D:07:EA:9C:51:21:04 parm: hpsa_simple_mode:Use 'simple mode' rather than 'performant mode' (int) И сомнительно, что дело в драйвере, т.к. до этого сервак работал стабильно лет 6 без обновлений. Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
sol Опубликовано 29 декабря, 2023 · Жалоба В 28.12.2023 в 07:32, Andrei сказал: MSI не упоминается cat /proc/interrupts Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
Andrei Опубликовано 29 декабря, 2023 · Жалоба 36 минут назад, sol сказал: cat /proc/interrupts Вот... CPU0 CPU1 CPU2 CPU3 CPU4 CPU5 CPU6 CPU7 CPU8 CPU9 CPU10 CPU11 CPU12 CPU13 CPU14 CPU15 CPU16 CPU17 CPU18 CPU19 CPU20 CPU21 CPU22 CPU23 CPU24 CPU25 CPU26 CPU27 CPU28 CPU29 CPU30 CPU31 0: 43 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 IR-IO-APIC 2-edge timer 1: 0 0 0 0 0 0 0 0 4 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 IR-IO-APIC 1-edge i8042 8: 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 IR-IO-APIC 8-edge rtc0 9: 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 IR-IO-APIC 9-fasteoi acpi 12: 0 0 0 0 0 0 6 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 IR-IO-APIC 12-edge i8042 14: 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 IR-IO-APIC 14-edge pata_atiixp 15: 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 IR-IO-APIC 15-edge pata_atiixp 16: 6 0 0 0 23 0 140 0 99250 0 81 0 73 0 77 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 IR-IO-APIC 16-fasteoi ahci[0000:00:11.0] 22: 0 0 0 0 68 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 IR-IO-APIC 22-fasteoi ehci_hcd:usb3, ohci_hcd:usb4, ohci_hcd:usb5 23: 0 0 60 0 0 0 0 0 0 0 0 0 355 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 IR-IO-APIC 23-fasteoi ehci_hcd:usb1, ohci_hcd:usb6, ohci_hcd:usb7 25: 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 PCI-MSI 4096-edge AMD-Vi 30: 60057 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 IR-PCI-MSI 1572864-edge hpsa2-msix0 31: 0 0 1315 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 IR-PCI-MSI 1572865-edge hpsa2-msix1 32: 0 0 0 0 70790 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 IR-PCI-MSI 1572866-edge hpsa2-msix2 33: 0 0 0 0 0 0 4182 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 IR-PCI-MSI 1572867-edge hpsa2-msix3 34: 0 0 0 0 0 0 0 0 76593 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 IR-PCI-MSI 1572868-edge hpsa2-msix4 35: 0 0 0 0 0 0 0 0 0 0 3466 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 IR-PCI-MSI 1572869-edge hpsa2-msix5 36: 0 0 0 0 0 0 0 0 0 0 0 0 79841 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 IR-PCI-MSI 1572870-edge hpsa2-msix6 37: 0 0 0 0 0 0 0 0 0 0 0 0 0 0 3635 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 IR-PCI-MSI 1572871-edge hpsa2-msix7 38: 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 42526 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 IR-PCI-MSI 1572872-edge hpsa2-msix8 39: 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 332 0 0 0 0 0 0 0 0 0 0 0 0 0 IR-PCI-MSI 1572873-edge hpsa2-msix9 40: 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 43330 0 0 0 0 0 0 0 0 0 0 0 IR-PCI-MSI 1572874-edge hpsa2-msix10 41: 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 476 0 0 0 0 0 0 0 0 0 IR-PCI-MSI 1572875-edge hpsa2-msix11 42: 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 46277 0 0 0 0 0 0 0 IR-PCI-MSI 1572876-edge hpsa2-msix12 43: 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 524 0 0 0 0 0 IR-PCI-MSI 1572877-edge hpsa2-msix13 44: 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 42792 0 0 0 IR-PCI-MSI 1572878-edge hpsa2-msix14 45: 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 701 0 IR-PCI-MSI 1572879-edge hpsa2-msix15 46: 0 90732 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 IR-PCI-MSI 1572880-edge hpsa2-msix16 47: 0 0 0 748 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 IR-PCI-MSI 1572881-edge hpsa2-msix17 48: 0 0 0 0 0 58965 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 IR-PCI-MSI 1572882-edge hpsa2-msix18 49: 0 0 0 0 0 0 0 585 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 IR-PCI-MSI 1572883-edge hpsa2-msix19 50: 0 0 0 0 0 0 0 0 0 84811 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 IR-PCI-MSI 1572884-edge hpsa2-msix20 51: 0 0 0 0 0 0 0 0 0 0 0 541 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 IR-PCI-MSI 1572885-edge hpsa2-msix21 52: 0 0 0 0 0 0 0 0 0 0 0 0 0 115981 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 IR-PCI-MSI 1572886-edge hpsa2-msix22 53: 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 5749 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 IR-PCI-MSI 1572887-edge hpsa2-msix23 54: 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 66441 0 0 0 0 0 0 0 0 0 0 0 0 0 0 IR-PCI-MSI 1572888-edge hpsa2-msix24 55: 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 2460 0 0 0 0 0 0 0 0 0 0 0 0 IR-PCI-MSI 1572889-edge hpsa2-msix25 56: 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 67135 0 0 0 0 0 0 0 0 0 0 IR-PCI-MSI 1572890-edge hpsa2-msix26 57: 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 3405 0 0 0 0 0 0 0 0 IR-PCI-MSI 1572891-edge hpsa2-msix27 58: 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 70782 0 0 0 0 0 0 IR-PCI-MSI 1572892-edge hpsa2-msix28 59: 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 2082 0 0 0 0 IR-PCI-MSI 1572893-edge hpsa2-msix29 60: 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 65026 0 0 IR-PCI-MSI 1572894-edge hpsa2-msix30 61: 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 4503 IR-PCI-MSI 1572895-edge hpsa2-msix31 62: 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 IR-IO-APIC 20-fasteoi uhci_hcd:usb2, hpilo 64: 0 0 0 0 735 0 0 0 64 0 0 0 5198094 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 IR-PCI-MSI 2097152-edge eth0-tx-0 65: 0 0 0 0 0 0 3069539 0 0 0 91 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 IR-PCI-MSI 2097153-edge eth0-rx-1 66: 0 0 0 0 2405518 0 0 0 1931 0 0 0 3748 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 IR-PCI-MSI 2097154-edge eth0-rx-2 67: 1937866 0 793 0 113 0 0 0 0 0 0 0 60 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 IR-PCI-MSI 2097155-edge eth0-rx-3 68: 8 0 0 0 75933 0 0 0 3574750 0 2006 0 5830 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 IR-PCI-MSI 2097156-edge eth0-rx-4 NMI: 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 Non-maskable interrupts LOC: 124510236 784904631 32023198 22950864 397580825 839842415 9437915 7171961 341223955 818460427 5481637 10319579 503462936 940081940 9156672 27291962 747138269 784836062 40257458 4724273 716959573 860060308 42198753 35169283 800988486 970632425 37094065 39164066 800427699 311774363 24637742 12394369 Local timer interrupts SPU: 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 Spurious interrupts PMI: 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 Performance monitoring interrupts IWI: 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 2 0 2 0 0 0 IRQ work interrupts RTR: 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 APIC ICR read retries RES: 7572532 20807317 1029390 618651 10243249 21818445 1703135 195258 9620159 21034625 308843 334319 14991340 23157979 453139 722367 19316762 19173694 1216846 81983 18220204 19713000 1017633 678816 20656620 22278476 920311 1015532 20386289 7573413 536951 401525 Rescheduling interrupts CAL: 269517 1444713 117435 94710 693953 1612074 81045 72970 634386 1471829 68352 80100 895915 1608501 78353 113318 1286460 1313876 143414 66147 1239286 1439443 132872 100893 1492543 1610984 125122 130500 1337035 627379 101106 90132 Function call interrupts TLB: 4901 11579 1523 3987 7328 11637 4933 813 6720 11679 1389 1403 9993 12512 1404 2086 10275 10536 1310 1207 9997 11355 1490 1184 9949 11892 1053 3052 10255 7465 864 1457 TLB shootdowns TRM: 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 Thermal event interrupts THR: 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 Threshold APIC interrupts DFR: 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 Deferred Error APIC interrupts MCE: 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 Machine check exceptions MCP: 531 531 531 531 531 531 531 531 531 531 531 531 531 531 531 531 531 531 531 531 531 531 531 531 531 531 531 531 531 531 531 531 Machine check polls ERR: 1 MIS: 0 PIN: 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 Posted-interrupt notification event NPI: 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 Nested posted-interrupt event PIW: 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 Posted-interrupt wakeup event Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
Andrei Опубликовано 29 декабря, 2023 · Жалоба В 27.12.2023 в 19:26, Andrei сказал: Обновили хост-систему до 10го дебиана, драйвер raid-контроллера теперь 3.4.20-125 вместо 3.4.16-0. Может тут баг был. Хотя вряд ли в этом причина, но попробовать стоило. Апрегйднули хост-систему до дебиан 11.9, версия драйвера рейд-контроллера теперь 3.4.20-200. Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
Andrei Опубликовано 5 января · Жалоба В 26.12.2023 в 18:36, sol сказал: баги в драйвере. Переход на новый дравйер не помог, сегодня ночью система опять умерла. В ILO вообще все ОК, никакой красноты, по ssh на сервер пустило, файлуха в read-only, dmesg забит записями вида [585963.858982] systemd-journald[496]: Failed to write entry (22 items, 754 bytes), ignoring: Read-only file system Вчера приехал новый рэйд-контроллер HP SmartArray 420, видимо будет ставить его и переключать диски на него. В BIOS надо будет что-то поправить или само подхватится? update: поставили новый контроллер, после танцев с бубном (не хотел грузиться с рейда на новом контроллере, хотя диски и рейд видел) запустили. Наблюдаем. Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
Andrei Опубликовано 23 января · Жалоба dmesg [1471764.099814] hpsa 0000:0b:00.0: scsi 2:0:2:0: removed Direct-Access ATA WDC WD5000LPLX-0 PHYS DRV SSDSmartPathCap- En- Exp=0 [1471767.806099] hpsa 0000:0b:00.0: scsi 2:1:0:1: resetting logical Direct-Access HP LOGICAL VOLUME RAID-1(+0) SSDSmartPathCap- En- Exp=1 [1471777.029643] hpsa 0000:0b:00.0: device is ready. [1471777.029652] hpsa 0000:0b:00.0: scsi 2:1:0:1: reset logical completed successfully Direct-Access HP LOGICAL VOLUME RAID-1(+0) SSDSmartPathCap- En- Exp=1 [1471956.140316] hpsa 0000:0b:00.0: aborted: LUN:000000c000000601 CDB:12000000310000000000000000000000 [1471956.140335] hpsa 0000:0b:00.0: hpsa_update_device_info: inquiry failed, device will be skipped. [1471981.404131] hpsa 0000:0b:00.0: scsi 2:1:0:1: resetting logical Direct-Access HP LOGICAL VOLUME RAID-1(+0) SSDSmartPathCap- En- Exp=1 [1471982.458746] hpsa 0000:0b:00.0: device is ready. [1471982.458751] hpsa 0000:0b:00.0: scsi 2:1:0:1: reset logical completed successfully Direct-Access HP LOGICAL VOLUME RAID-1(+0) SSDSmartPathCap- En- Exp=1 [1472092.910909] hpsa 0000:0b:00.0: scsi 2:1:0:1: resetting logical Direct-Access HP LOGICAL VOLUME RAID-1(+0) SSDSmartPathCap- En- Exp=1 [1472105.400303] hpsa 0000:0b:00.0: aborted: LUN:000000c000000601 CDB:12000000310000000000000000000000 [1472105.400321] hpsa 0000:0b:00.0: hpsa_update_device_info: inquiry failed, device will be skipped. [1472106.774327] hpsa 0000:0b:00.0: device is ready. [1472106.774357] hpsa 0000:0b:00.0: scsi 2:1:0:1: reset logical completed successfully Direct-Access HP LOGICAL VOLUME RAID-1(+0) SSDSmartPathCap- En- Exp=1 Рейд развалился ssacli ctrl slot=3 pd all show Smart Array P420 in Slot 3 Array A physicaldrive 1I:2:2 (port 1I:box 2:bay 2, SATA HDD, 500 GB, OK) physicaldrive 1I:2:3 (port 1I:box 2:bay 3, SATA HDD, 500 GB, Failed) И кэш на контроллере почему-то стал disable ssacli ctrl all show status Smart Array P420 in Slot 3 Controller Status: OK Cache Status: Temporarily Disabled Battery/Capacitor Status: Recharging Просто поменять диск в 3ей корзине на живой SATA 500 и они засинхрятся в рейде? Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
sol Опубликовано 23 января · Жалоба Похоже, сервер проклят. Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
jffulcrum Опубликовано 23 января · Жалоба 2 часа назад, Andrei сказал: Просто поменять диск в 3ей корзине на живой SATA 500 и они засинхрятся в рейде? Да. Smartctl для помершего диска что показывает? Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
bike Опубликовано 23 января · Жалоба В 23.01.2024 в 14:52, Andrei сказал: И кэш на контроллере почему-то стал disable ssacli ctrl all show status Smart Array P420 in Slot 3 Controller Status: OK Cache Status: Temporarily Disabled Battery/Capacitor Status: Recharging На 420 мрут "опухают" супер конденсаторы - заменить. П.С. Бу долго не живут, я покупал отдельно новые конденсаторы и колхозил. Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
Andrei Опубликовано 23 января · Жалоба 5 часов назад, sol сказал: Похоже, сервер проклят. Сервер из-под СОРМа. Наверное поэтому :) 4 часа назад, jffulcrum сказал: Smartctl для помершего диска что показывает? На то он и умерший, что ничего не показывает. :) Вынул/вставил диск, ребилд прошел, smartctl его увидел smartctl -a -d cciss,1 /dev/sda smartctl 7.2 2020-12-30 r5155 [x86_64-linux-5.10.0-26-amd64] (local build) Copyright (C) 2002-20, Bruce Allen, Christian Franke, www.smartmontools.org === START OF INFORMATION SECTION === Model Family: Western Digital Black Mobile Device Model: WDC WD5000LPLX-00ZNTT0 Serial Number: WD-WXE1AA9766TL LU WWN Device Id: 5 0014ee 211effa4b Firmware Version: 01.01A01 User Capacity: 500,107,862,016 bytes [500 GB] Sector Sizes: 512 bytes logical, 4096 bytes physical Rotation Rate: 7200 rpm Device is: In smartctl database [for details use: -P show] ATA Version is: ACS-2, ACS-3 T13/2161-D revision 3b SATA Version is: SATA 3.1, 6.0 Gb/s (current: 6.0 Gb/s) Local Time is: Tue Jan 23 18:22:22 2024 +05 SMART support is: Available - device has SMART capability. SMART support is: Enabled === START OF READ SMART DATA SECTION === SMART Status not supported: Incomplete response, ATA output registers missing SMART overall-health self-assessment test result: PASSED Warning: This result is based on an Attribute check. General SMART Values: Offline data collection status: (0x00) Offline data collection activity was never started. Auto Offline Data Collection: Disabled. Self-test execution status: ( 0) The previous self-test routine completed without error or no self-test has ever been run. Total time to complete Offline data collection: ( 6780) seconds. Offline data collection capabilities: (0x7b) SMART execute Offline immediate. Auto Offline data collection on/off support. Suspend Offline collection upon new command. Offline surface scan supported. Self-test supported. Conveyance Self-test supported. Selective Self-test supported. SMART capabilities: (0x0003) Saves SMART data before entering power-saving mode. Supports SMART auto save timer. Error logging capability: (0x01) Error logging supported. General Purpose Logging supported. Short self-test routine recommended polling time: ( 2) minutes. Extended self-test routine recommended polling time: ( 80) minutes. Conveyance self-test routine recommended polling time: ( 5) minutes. SCT capabilities: (0x3035) SCT Status supported. SCT Feature Control supported. SCT Data Table supported. SMART Attributes Data Structure revision number: 16 Vendor Specific SMART Attributes with Thresholds: ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE 1 Raw_Read_Error_Rate 0x002f 200 200 051 Pre-fail Always - 0 3 Spin_Up_Time 0x0027 151 142 021 Pre-fail Always - 1433 4 Start_Stop_Count 0x0032 100 100 000 Old_age Always - 34 5 Reallocated_Sector_Ct 0x0033 200 200 140 Pre-fail Always - 0 7 Seek_Error_Rate 0x002e 100 253 000 Old_age Always - 0 9 Power_On_Hours 0x0032 055 055 000 Old_age Always - 33349 10 Spin_Retry_Count 0x0032 100 253 000 Old_age Always - 0 11 Calibration_Retry_Count 0x0032 100 253 000 Old_age Always - 0 12 Power_Cycle_Count 0x0032 100 100 000 Old_age Always - 34 192 Power-Off_Retract_Count 0x0032 200 200 000 Old_age Always - 32 193 Load_Cycle_Count 0x0032 108 108 000 Old_age Always - 276266 194 Temperature_Celsius 0x0022 128 105 000 Old_age Always - 15 196 Reallocated_Event_Count 0x0032 200 200 000 Old_age Always - 0 197 Current_Pending_Sector 0x0032 200 200 000 Old_age Always - 0 198 Offline_Uncorrectable 0x0030 100 253 000 Old_age Offline - 0 199 UDMA_CRC_Error_Count 0x0032 200 200 000 Old_age Always - 0 200 Multi_Zone_Error_Rate 0x0008 100 253 000 Old_age Offline - 0 SMART Error Log Version: 1 ATA Error Count: 58 (device log contains only the most recent five errors) CR = Command Register [HEX] FR = Features Register [HEX] SC = Sector Count Register [HEX] SN = Sector Number Register [HEX] CL = Cylinder Low Register [HEX] CH = Cylinder High Register [HEX] DH = Device/Head Register [HEX] DC = Device Command Register [HEX] ER = Error register [HEX] ST = Status register [HEX] Powered_Up_Time is measured from power on, and printed as DDd+hh:mm:SS.sss where DD=days, hh=hours, mm=minutes, SS=sec, and sss=millisec. It "wraps" after 49.710 days. Error 58 occurred at disk power-on lifetime: 33285 hours (1386 days + 21 hours) When the command that caused the error occurred, the device was active or idle. After command completion occurred, registers were: ER ST SC SN CL CH DH -- -- -- -- -- -- -- 04 51 00 00 00 00 00 Commands leading to the command that caused the error were: CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name -- -- -- -- -- -- -- -- ---------------- -------------------- b4 00 00 00 00 00 00 00 14d+08:55:58.481 SANITIZE DEVICE ec 00 01 00 00 00 00 00 14d+08:55:58.466 IDENTIFY DEVICE ec 00 00 00 00 00 00 00 14d+08:55:58.393 IDENTIFY DEVICE ec 00 00 00 00 00 00 00 14d+08:55:58.392 IDENTIFY DEVICE Error 57 occurred at disk power-on lifetime: 33285 hours (1386 days + 21 hours) When the command that caused the error occurred, the device was active or idle. After command completion occurred, registers were: ER ST SC SN CL CH DH -- -- -- -- -- -- -- 04 51 00 00 00 00 00 Commands leading to the command that caused the error were: CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name -- -- -- -- -- -- -- -- ---------------- -------------------- b4 00 00 00 00 00 00 00 14d+08:55:11.184 SANITIZE DEVICE ec 00 01 00 00 00 00 00 14d+08:55:11.168 IDENTIFY DEVICE ec 00 00 00 00 00 00 00 14d+08:55:11.095 IDENTIFY DEVICE ec 00 00 00 00 00 00 00 14d+08:55:11.094 IDENTIFY DEVICE Error 56 occurred at disk power-on lifetime: 32940 hours (1372 days + 12 hours) When the command that caused the error occurred, the device was active or idle. After command completion occurred, registers were: ER ST SC SN CL CH DH -- -- -- -- -- -- -- 04 51 00 00 00 00 00 Commands leading to the command that caused the error were: CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name -- -- -- -- -- -- -- -- ---------------- -------------------- b4 00 00 00 00 00 00 00 00:31:09.078 SANITIZE DEVICE ec 00 01 00 00 00 00 00 00:31:09.062 IDENTIFY DEVICE Error 55 occurred at disk power-on lifetime: 32728 hours (1363 days + 16 hours) When the command that caused the error occurred, the device was active or idle. After command completion occurred, registers were: ER ST SC SN CL CH DH -- -- -- -- -- -- -- 04 51 00 00 00 00 00 Commands leading to the command that caused the error were: CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name -- -- -- -- -- -- -- -- ---------------- -------------------- b4 00 00 00 00 00 00 00 1d+06:51:25.614 SANITIZE DEVICE ec 00 01 00 00 00 00 00 1d+06:51:25.562 IDENTIFY DEVICE Error 54 occurred at disk power-on lifetime: 32728 hours (1363 days + 16 hours) When the command that caused the error occurred, the device was active or idle. After command completion occurred, registers were: ER ST SC SN CL CH DH -- -- -- -- -- -- -- 04 51 00 00 00 00 00 Commands leading to the command that caused the error were: CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name -- -- -- -- -- -- -- -- ---------------- -------------------- b4 00 00 00 00 00 00 00 1d+06:51:16.131 SANITIZE DEVICE ec 00 01 00 00 00 00 00 1d+06:51:16.065 IDENTIFY DEVICE SMART Self-test log structure revision number 1 No self-tests have been logged. [To run self-tests, use: smartctl -t] SMART Selective self-test log data structure revision number 1 SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS 1 0 0 Not_testing 2 0 0 Not_testing 3 0 0 Not_testing 4 0 0 Not_testing 5 0 0 Not_testing Selective self-test flags (0x0): After scanning selected spans, do NOT read-scan remainder of disk. If Selective self-test is pending on power-up, resume after 0 minute delay. 17 минут назад, bike сказал: На 420 мрут "опухают" супер конденсаторы - заменить. П.С. Бу долго не живут, я покупал отдельно новые конденсаторы и колхозил. Да, батарейка похоже того-с... Но есть вторая, попробуем подцепить ее. ssacli ctrl slot=3 show detail Smart Array P420 in Slot 3 ... Cache Board Present: True Cache Status: Temporarily Disabled Cache Status Details: Cache disabled; the backup power source charge is low. Cache Disable Reason: Temporary disable condition. The posted write cache has been disabled in a flash-backed write cache module because the backup power source charge is low. Drive Write Cache: Disabled ... Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
Andrei Опубликовано 24 января · Жалоба А не может быть, что отвалы дисков из-за переохлаждения? ssacli ctrl all show config detail | grep Current Current Temperature (C): 6 Current Temperature (C): 5 Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...