アラート・ルールのセットアップ

クリティカル・イベントおよび警告イベントに対してアラートを有効にして、特定のアラートをユーザーに転送するタイミングを定義できます。 イベントが持続するときに、ユーザーに大量のアラートが送信されないように、スロットル時間を設定できます。 デフォルトのアラート・ルールを変更するには、Alerting API を使用する必要があります。

詳しくは、アラート・ルールの構成を参照してください。

このタスクについて

デフォルトのアラート・ルールは、以下のように設定されます。

  • 重大イベントの場合、最後の 3 回のモニター実行中に 3 つの重大イベントが記録された場合にアラートが出されます。 アラートが出された後、アラートは 12 時間スヌーズされます。
  • 警告イベントの場合、最後の 20 回のモニター実行中に 5 個の警告イベントが記録された場合にアラートが出されます。 アラートが出された後、アラートは 24 時間スヌーズされます。

以下のパラメーターを設定できます。

パラメーター 説明
severity 設定する重大度。

以下のいずれかのオプションを設定できます。

  • 重大
  • 警告

情報アラートに対してアラート・ルールを構成することはできません。

trigger_type

アラートをトリガーする方法を決定します。

以下のいずれかのオプションを設定できます。
  • 即値
  • custom: この custom オプションは、alert_count および alert_over_countに関連付けられています。
alert_count 重大度タイプがあるイベントの数。
alert_over_count 参照される合計イベントの数。
snooze_time イベントが発生した後に次にアラートを送信するまでに待機する時間数。
notify_when_condition_clears 条件のクリア時にアラートを送信するかどうかを決定します。 このアラートは、alert_typeinfo の場合に送信されます。

手順

アラート拡張を定義して、Kubernetes・リソースをモニターします。 アラート・ルールは、zen_alert_type 拡張機能を使用して定義されます。

各アラート・タイプは、criticalwarninginfo の各イベント重大度のルールを定義します。 例えば、以下のアラート拡張は、Kubernetes リソースを毎日モニターするアラートを定義します。

  extensions: |
    [
      {
        "extension_point_id": "zen_alert_type",
        "extension_name": "zen_alert_type_platform",
        "display_name": "Platform alert type",
        "details": {
          "name": "platform",
          "description": "defines rules for alerting on diagnostics monitors",
          "rules": {
            "critical": { 
              "trigger_type": "custom",
              "alert_count": 3,
              "alert_over_count": 3,
              "snooze_time": 12,
              "notify_when_condition_clears": true
            }, 
            "warning": { 
              "trigger_type": "custom",
              "alert_count": 5,
              "alert_over_count": 20,
              "snooze_time": 24
            }
          }
        }
      }
    ]