Добрый день!
Такой темы не нашел... Может быть кто-то сталкивался на практике...
Помогите разобраться с настройкой демона watchdog в связке с аппаратным watchdog.
В качестве проверки используется пользовательский скрипт, выполняющий простую команду.
В случае корректного выполнения и кода завершения 0, watchdog "взводит" аппаратный таймер до начального значения.
Не получается сделать таким образом, чтобы было несколько попыток выполнить команду.
Сейчас при первом же "неуспехе" (имитируется переименованием скрипта) watchdog отправляет сервер в ребут. Хотя времени таймера хватает на то, чтобы сделать несколько попыток.
Конфиг watchdog:
[root@srv ipt-netflow-2.2]# cat /etc/watchdog.conf
test-binary = /root/uname.sh
test-timeout = 30
watchdog-device = /dev/watchdog
watchdog-timeout = 280
interval = 30
logtick = 1
realtime = yes
priority = 1
Centos 6.9, ядро 4.13.7-1.el6.elrepo.x86_64, watchdog 5.6-5.el6, сервер Supermicro мат. Supermicro X8DTU-F