Вот не надо додумывать. Там действительно было два hot-spare, но был нюанс.
Там все четко по теории пошло. Вылетел один диск, начался resilvering на spare-диск, потом посыпались ошибки еще на двух дисках. resilvering делается чуть меньше недели. Плюс нюанс, если второй диск уходит в faulted, то заполнение второе диска не начинается, пока не закончится восстановление другого ранее сбоившего диска. В ZFS за это отвечают отдельные флаги массива.
На одном из скринов именно идущий resilvering с двумя почти сразу сбойных диска. Повезло в том, что диски не умерли совсем, и ZFS продолжает с них читать, а не отстреливает их полностью, как сделал бы любой аппаратный RAID
А изначальная проблема, судя по всему бракованная партия, из 30 дисков за чуть больше чем полгода в режиме "счас усе развалится" поменяли 10 дисков.
август
сентябрь