Скучные проверки экономят вечер
Скучная не значит примитивная. Это значит: состояние можно проверить без гадания и длинных споров с самим собой.
Самые долгие отладки часто начинаются не с плохой технологии, а с неясного маршрута мысли. Никто уже не помнит, что именно меняли, где лежит рабочий конфиг и почему лог смотрели не тот.
Поэтому я люблю решения, которые оставляют мало пространства для фольклора. Сервис должен быть виден в systemd. Порт должен быть виден в списке сокетов. Проверка должна возвращать короткое «работает» или короткое «вот где больно».
Минимальный runbook
Если для восстановления нужно открыть пять вкладок, runbook еще не готов. Хороший минимум выглядит скучно:
systemctl status service-name
journalctl -u service-name -n 100 --no-pager
ss -tlnp
curl -I https://example.org/
Эти команды не заменяют понимание, но быстро убирают туман. Процесс жив? Порт слушает? Сеть отвечает? Сертификат не умер? Уже легче.
Где не экономить
Не стоит экономить на именах, резервных копиях и проверках после изменения. Плохое имя ломает голову каждый день. Отсутствие бэкапа ломает вечер. Отсутствие проверки ломает доверие.
Лучшее чувство после правки - не восторг, а спокойствие. Ситуация стала понятнее, а не загадочнее. Значит, шаг был в правильную сторону.