スマートアラートの適応しきい値
適応しきい値は、 Instana のアラートシステムにおける強力な機能であり、メトリクスの変化するパターンに自動的に調整します。 静的しきい値はアプリケーションの動作に関わらず固定されたままですが、適応しきい値はデータと共に継続的に変化するため、動的な環境に最適です。

適応しきい値(赤線)はメトリックデータ(青線)の自然なパターンに従い、メトリックの挙動が変化するにつれて自動的に調整される。
適応しきい値を使用するタイミング
適応しきい値は以下のシナリオで最も効果を発揮します:
- 漸進的な変化を伴う指標 :基礎となる指標が時間の経過とともに徐々に変化することが予想されるが、この傾向からの急激な逸脱が望ましくない場合。
- 季節的メトリクス :メトリクスが日次または週次パターンに従い、1日または1週間の異なる時間帯ごとに異なる閾値が必要な場合。
- 時間の経過とともに変化する指標 :アプリケーションの成長や利用パターンの変化に伴い、基準となる動作が変化する場合。
適応閾値の仕組み
予測アルゴリズム
適応しきい値は、データ内のトレンドと季節パターンの両方を捉えることに優れた高度な時系列予測アルゴリズムを採用しています。 システムは以下の手順を実行します:
- 過去のデータを分析してパターンを特定する。
- これらのパターンに基づいて将来の値を予測します。
- これらの予測値の信頼区間を計算します。
- これらの間隔を用いて適切な閾値を決定する。
研修期間
システムは信頼できるパターンを確立するために履歴データが必要である。 必要な訓練期間はアラートタイプによって異なります:
- アプリケーション スマート アラート : 少なくとも14日間の連続したメトリックデータが必要です。
- ウェブサイトスマートアラート :少なくとも5日間の連続したメトリックデータ。
適応しきい値を設定すると、システムは次の処理を行います:
- 既存の履歴メトリックデータを分析します。
- ベースライン行動を特定する。
- 季節性のパターン(存在する場合)を検出します。
- 初期しきい値を設定する。
十分な履歴データが利用可能な場合、適応しきい値は設定後すぐに動作を開始します。 初期化されると、システムは新しいデータが到着するたびに継続的に更新され、アプリケーションの動作の変化に徐々に適応していきます。
モデル再学習
システムは定期的に再学習を行い、進化するメトリクスの性質に遅れを取らないよう最新の状態を維持します。 この再訓練は、以下の場合に重要です:
- 指標の季節性パターンは、例えば非季節性から日次季節性へと変化する。
- 利用パターンは事業の変化によって変化する。
- アプリケーションの動作は、デプロイや設定変更後に変化する。
この自動再トレーニングにより、メトリクスの基本特性が時間の経過とともに変化しても、手動介入なしに閾値が適切に維持されます。 現在、システムはモデルを1日1回保持します。
主要なパラメーター
重要度
感度パラメータは、閾値がメトリックデータにどれだけ厳密に適合するかを制御します:
- 範囲 :1~16。
- 機能 :しきい値の計算に使用する標準偏差(シグマ)の数を制御します。
- 効果 :
- 低い値は高い感度に対応し、より小さな変化を検出する厳密な閾値を設定します。
- 値が高いほど感度が低く、より大きな変化のみを検出する広い閾値が生成されます。

高感度設定(低い値)は指標(青線)の周囲に厳密なしきい値を設定し、より小さな偏差を検出します。

感度設定を低く(値を高く)すると、指標(青線)の周囲に広い閾値が設定され、大きな偏差のみを検出します。
オペレーター > を使用するアラート条件(例:応答遅延がしきい値を超えた場合)では、しきい値は予測値に一定の余裕を加えて計算されます。 感度設定は、このマージンを計算された偏差と乗算することで決定します。
オペレータ < を使用するアラート条件(例:可用性がしきい値を下回った場合)では、しきい値は予測値から一定の余裕を差し引くことで算出されます。 感度設定は、このマージンを計算された偏差と乗算することで決定します。
システムが外れ値をどのように処理するか
極端な値がしきい値を歪めるのを防ぐため、システムはクリッピング機構を採用しています:
- 初期化時 :極端値は、履歴データのパーセンタイルに基づいてクリップされます。
- 初期化後 :値はシステムの予測と信頼区間に基づいてクリップされます。
このメカニズムにより、一時的な急上昇や急落がしきい値の計算に影響を与えないようにしつつ、メトリックの挙動における真の変化にはシステムが適応できるようになっています。
ベスト・プラクティス
適切な感度を選択してください
- 高感度 (1-2):わずかな偏差が問題となる重要な指標に使用します。
- 中程度の感度 (2-4):ほとんどの指標のデフォルトとして使用します。
- 感度を低く設定 (4-16):ノイズの多い指標や、重大な逸脱のみを通知したい場合に使用します。
- Lower adaptability (0.0-0.1): Use when threshold stability is more important over responsiveness to metric fluctuations.
- Medium adaptability (0.1-0.5): Provides an optimal balance between threshold stability and responsiveness.
- Higher adaptability (0.5-1.0): Appropriate when thresholds must rapidly adjust to changing metric patterns.
Draft comment:
Seasonality selection (private preview)
Seasonality selection (private preview)
- Start with Auto detection.
- Switch to No seasonality if your metric does not follow regular patterns.
- Select Daily or Weekly if you know that your metric follows these specific patterns.
既知の制限
適応しきい値は動的なアラート機能に強力な能力を提供しますが、以下の制限が適用されます:
- タグフィルタリングの制限事項 :一部のタグは適応しきい値によるフィルタリングに使用できない場合があります。 システムは、適応しきい値設定と組み合わせ可能なタグを制限します。
- アプリケーション スマート アラートのグループ化 : 適応しきい値を使用する場合、アプリケーション スマート アラートはエンドポイントごとのグループ化をサポートしません。 エンドポイントレベルのグループ化が必要な場合は、静的しきい値を使用してください。
おわりに
適応しきい値は、アプリケーションの進化に合わせて動的に自己調整するアラートを作成する強力な手段を提供します。 感度、適応性、季節性の設定がどのように連携するかを理解することで、アラートを微調整し、実際の問題を捕捉しつつ誤検知の数を最小限に抑えることができます。
適応しきい値は、信頼できるパターンを確立するために十分な履歴データが必要である。 具体的な訓練期間は、アラートの種類によって異なります(詳細は前の「訓練期間」セクションを参照)。 十分なデータが利用可能になると、設定直後にしきい値が有効になります。 適切な設定により、適応しきい値はアラートのノイズを大幅に削減し、真に重要な事項に集中できるよう支援します。
Choosing the right adaptability (private preview)