Я пытаюсь создать предупреждение Datadog с помощью Terraform, когда несколько хостов (1 или более) используют ›= 95% ЦП. Пока что с использованием того кода, который у меня есть, предупреждение будет срабатывать каждый раз, когда хост превышает пороговое значение, и это слишком шумно. Не знаете ли вы, как создать логику для удовлетворения обоих условий до того, как сработает предупреждение? (Предупреждение, когда несколько хостов имеют 95% ЦП или выше)
resource "datadog_monitor" "worker_high_disk_usage" {
type = "metric alert"
name = "worker high disk usage"
message = <<-EOT
{{#is_alert}}
@slack_channel {{system}} {{env}} host {{host.name}} device {{device}} has had disk usage
enter code hereover {{threshold}} of availible disk space for the last 30m
{{/is_alert}}
{{#is_recovery}}
@pagerduty
{{system}} {{env}} host {{host.name}} device {{device}} high disk usage resolved.
{{/is_recovery}}
EOT
query = "min(last_30m):avg:system.disk.in_use{env:prod,system:worker,team:team} by
{host,device} > 0.95"
thresholds = {
critical = 0.95
timeout_h = 1
require_full_window = false
lifecycle {
ignore_changes = [silenced]
}
tags = ["disk"]
}