У меня есть приложение, развернутое в Kubernetes, которое зависит от внешнего приложения. Иногда соединение между этими двумя переходит в недопустимое состояние, и это можно исправить только путем перезапуска моего приложения.
Для автоматического перезапуска я настроил зонд живучести, который будет проверять соединение.
Это отлично работает, однако я боюсь, что если это внешнее приложение выйдет из строя (например, ошибка подключения возникнет не только из-за недопустимого состояния модуля), все мои модули немедленно перезапустятся, и мое приложение станет полностью недоступен. Я хочу, чтобы он продолжал работать, чтобы функциональность, не зависящая от плохой службы, могла продолжаться.
Мне интересно, предотвратит ли этот сценарий бюджет нарушения работы модуля, поскольку он ограничивает количество модулей из-за добровольного сбоя. Однако в документации K8s не указывается, является ли отказ датчика живучести добровольным нарушением. Они?