サービス・レベル目標

ナビゲーションサイドバーにある「サービスレベル目標(SLO)」セクションでは、サービスパフォーマンスを監視するための、目的を明確にした操作環境と有益なデータを提供します。 アプリケーション、ウェブサイト、合成テスト、インフラストラクチャエンティティを、固定期間とローリング期間の両方で追跡できます。

注: SLOと SLOウィジェット(レガシー) は、別々の機能です。 SLO用の対応するウィジェットは別途ご用意しています。

概要ダッシュボードでは、すべてのSLOとそのステータスを確認できます。詳細ページでは、指標、エラー予算、および時間枠ごとのトラフィックを確認できます。

注: SLOは、セルフホスト型Classic Edition( Docker ) ではサポートされていません。

サービスレベルに関する権限およびアクセス要件については、 「ユーザーアクセスの管理 - サービスレベル」 を参照してください。

ダッシュボードの概要

Instana のUIで、ナビゲーションサイドバーにカーソルを合わせ、 「サービスレベル」 を選択します。 「サービスレベル」ページには、以下のタブが含まれています:
  • サービスレベル目標 - SLO の表示と管理。
  • Apdex - Apdexの設定を表示および管理します。 詳細については、 Apdexを参照してください。
  • 修正ウィンドウ - SLOの修正ウィンドウを管理します。
「SLO」タブには、すべてのSLOの概要とステータスがアルファベット順に表示されます。 この表は、名前、エンティティ、ブループリント、またはステータスで並べ替えることができます。 SLO名で検索したり、フィルターパネルを使って表示結果を絞り込んだりすることもできます。

Instana のUIで、ナビゲーションサイドバーにカーソルを合わせ、 「サービスレベル」 を選択します。 「サービスレベル」ページには、すべてのSLOの概要とステータスがアルファベット順に表示されます。 テーブルを名前で並べ替えたり、SLO名で検索したり、フィルターパネルを使用して表示範囲を絞り込むことができます。

SLOのフィルタリング

  1. フィルターアイコンをクリックするとフィルターパネルが開き、SLOを以下の条件で絞り込めます:
    • ステータス : SLOパフォーマンスステータスでフィルタリング
      • すべて : すべてのSLOを表示
      • 目標達成時 :目標を達成したSLOのみを表示する
      • 目標未達 : 目標を達成していないSLOのみを表示
    • タグ : SLOを割り当てられたタグでフィルタリングするには、1つ以上のタグを選択してください
    • ブループリント :指標タイプでフィルタリング
      • すべて : すべての設計図タイプを表示
      • 可用性 : 表示のみ可用性SLO
      • カスタム : カスタムSLOのみを表示
      • レイテンシ : 表示のみレイテンシSLO
      • 飽和度 : 飽和度SLOのみを表示
      • トラフィック : トラフィックのSLOのみを表示
    • エンティティタイプ : 監視対象エンティティのタイプでフィルタリング
      • アプリケーション
      • Web サイト
      • シンセティック・テスト
      • インフラストラクチャー
  2. フィルター条件を選択したら、 フィルター をクリックしてフィルターを適用してください。 クリアをクリックすると、すべてのフィルターがリセットされ、フィルターなしの表示に戻ります。

SLOテーブル

この表には以下の情報が表示されています:

  • 名称: SLOの名称。 左側の枠線の色は、サービスレベルインジケーター(SLI)の現在の状態を示しています。

  • エンティティタイプ: 監視対象のエンティティの種類。アプリケーション、ウェブサイト、合成テスト、ホスト、または Kubernetes クラスターなど。

  • エンティティ名: このSLOに関連付けられている特定のアプリケーション、ウェブサイト、または合成テストの名前。 インフラストラクチャのSLOについては、エンティティが動的であるため、値は「集計済み」として表示されます。

注: 関連エンティティが削除された場合、または表示されなくなった場合、この列には「不明なエンティティ」と表示されます。 SLOの定義は維持されますが、削除されたエンティティのデータは収集されなくなります。
  • ブループリント: 測定対象の指標タイプ。

    • レイテンシー: 設定された閾値に対するサービスの応答速度を測定します。
    • 可用性: サービスがエラーなく応答する頻度を測定します。
    • トラフィック: サービスが受け取っているトラフィックの量を測定します。
    • 飽和度: 設定されたしきい値に対するリソース利用率を測定します。
    • カスタム: ユーザー定義のフィルターを使用して、良好または不良なイベントの発生回数を計測します。
  • エラー予算の残量: エラー予算のうち、まだ使用可能な量を示します。 値は、選択されたエンティティタイプとインジケータタイプに応じて、分、コール、ビーコン、結果、またはメトリクススナップショットで表されます。 SLOの時間枠設定に関する詳細も表示されます。

  • ステータス/目標値: SLOの現在のステータスをパーセンテージで表示し、併せて目標値も表示します。 ステータスが目標値を満たしている場合、エラー許容範囲が尽きるまで緑色で表示され、その後は赤色で表示されます。

  • タグ: SLOに関連付けられているタグを表示します。関連するSLOのビューをフィルタリングするために使用できます。

  • チーム : SLOに関連付けられたチームを一覧表示します。これによりアクセス権限が決定されます。
  • 操作: 編集、コピー、削除ボタンが含まれます。

SLOの詳細

ダッシュボードのデータテーブルからSLOを選択すると、その詳細が表示されます。 このページには、SLOステータス、エラー予算、トラフィックの概要が表示され、指標、エラー予算、トラフィックの経時的な詳細なグラフが掲載されています。 UI上で、設定済みのSLO時間枠と指定した時間範囲の間で、データの表示期間を切り替えることができます。

このページには以下の情報が表示されます:

  • SLO名: SLOの名前。

  • 分析: アナリティクスページでエンティティデータをレビューするメニューを開きます。 このオプションは、アプリケーションおよび * Webサイトエンティティタイプでのみ利用可能です。 アプリケーションでは、 「通話 」または「 誤った通話」 を選択できます。 ウェブサイトの場合、 HTTP リクエストまたは Bad HTTP リクエストを選択できます。

  • インフラストラクチャの分析: インフラストラクチャの分析ビューを開きます。 このオプションは、インフラストラクチャエンティティタイプでのみ利用可能です。

  • 補正ウィンドウの表示: SLOステータスとエラー予算に対する補正ウィンドウの切り替え効果を一時的に表示するダイアログを開きます。 このSLOに適用されるアクティブな補正ウィンドウのみが表示されます。 変更内容はページを更新するとリセットされます。

  • エンティティ: このSLOに関連付けられているアプリケーション、ウェブサイト、合成テスト、またはインフラストラクチャエンティティの名前。 宣言されたスコープ設定も表示されます。

注: 関連エンティティが削除された場合、またはユーザーが閲覧できなくなった場合、この列には「不明なエンティティ」と表示されます。 SLOの定義は維持されますが、削除されたエンティティのSLOデータは収集されなくなります。
  • タグ: SLOに関連付けられているタグを表示します。関連するSLOのビューをフィルタリングするために使用できます。
  • チーム : SLOに関連付けられたチームを一覧表示します。これによりアクセス権限が決定されます。

概要タブには、選択した期間におけるSLOの集計情報が表示され、SLOのパフォーマンスに関するKPIのカードとチャートが提供されます。

  • 時間コンテンツ切替器: SLO設定の時間帯と選択された時間範囲を切り替えます。

  • 設定済みSLO時間枠: エラー予算を決定するSLOに対して設定された時間枠と、設定済みのタイムゾーンを表示します。

    注: SLOの設定タイムゾーンが、お使いのブラウザの現在のタイムゾーンと異なる場合、ページ上部に通知バナーが表示されます。 バナーには次のように表示されます:「このSLOは[SLOタイムゾーン]で作成されました。」 現在のタイムゾーンは[お使いのタイムゾーン]に設定されています バナーの 「SLOのタイムゾーンを編集」 をクリックして、SLOのタイムゾーン設定を変更します。
  • SLO時間の一致 Windows : 選択した時間を跨ぐ設定済みの時間枠を表示します。 選択した期間が複数のウィンドウにまたがる場合、それらは対応するチャート内で固有の色で表示されます。

  • ステータス: SLOの現在のステータスをパーセンテージ値で表示し、設定された目標値と共に表示します。

  • エラー予算残量: 残りのエラー予算と総エラー予算を表示します。 値は、選択されたエンティティタイプとインジケータタイプに応じて、分、コール、ビーコン、結果、またはメトリクススナップショットで表されます。

  • バーンレート: エラー予算のバーンレートを表示します。

  • トラフィック: 設定されたアプリケーションまたはWebサイトへのアクセス数、あるいは設定された合成テストの合計結果を表示します。

以下のチャートは、選択された時間枠における推移を示しています:

  • インジケーター: 設定されたしきい値に対するインジケーター指標を表示します。 このグラフのデータは、より長い時間枠で集計されています。 より詳細なデータを確認するには、より短い時間枠を選択してください。
注: インジケーターチャートを時間単位で表示する場合、各データポイントは当該時間内の分単位集計値の最大値を表します。 このチャートの値は、集計方法とデータ粒度の両方の違いにより、他のエンティティレベルのチャートと異なる場合があります。
  • エラー予算: 残りのエラー予算を表示します。
  • バーンレート: SLOの時間枠におけるバーンレートを表示します。
  • トラフィック: 設定されたアプリケーションまたはWebサイトへのアクセス数、あるいは設定された合成テストの合計結果を表示します。

SLOの概要と設定ビュー

アプリケーションのパースペクティブページの以下の例画像に示すように、修正マーカーは環境内のすべてのグラフ上に注釈として表示されます。 このマーカーは、アプリケーションのパフォーマンスにおける後退や改善など、変更点を迅速に特定するための基準点として機能します。

図 1. SLOダッシュボードのチャート上の修正マーカー
SLOダッシュボードのチャート上の修正マーカー

アプリケーションのパースペクティブページの前述の画像に示すように、修正マーカーには以下の情報が含まれています:

  • 名前 : 補正のユーザー定義名
  • 修正時刻 :修正が行われた時点。

マーカーが読みやすく重ならないようにするため、修正は同じチャートバケット内に収まる場合にクラスターにグループ化されます。 対応する修正アイコンにカーソルを合わせると、クラスター内のすべてのバケットがハイライト表示されます。 バケットの容量が大きい場合、そのバケットの時間枠内で発生した修正はクラスタリングされる。

設定タブには、SLOの設定情報が表示されます。 SLOを編集、コピー、または削除するオプションがあります。

[ スマートアラート] タブには、この SLO に対して設定されたスマートアラートに関する情報が表示されます。

補正ウィンドウタブには、このSLOに関連付けられた補正ウィンドウが表示されます。

AIを活用したSLO分析

Instana AIを活用した要約および解説機能を提供し、SLOのパフォーマンスを迅速に把握し、具体的なアクションにつながる洞察を見出すお手伝いをします。

AIによる要約の作成

SLOの詳細ページでは、AIを活用した要約を生成し、SLOのパフォーマンスを分析することができます。

概要を生成するには、以下の手順に従ってください:

  1. 「サービスレベル」ダッシュボードから、SLOを選択します。
  2. SLOの詳細ページで 「AI要約を生成」 をクリックします。

    AI要約ダイアログが開き、SLOに関する詳細な分析結果が表示されます。

AI要約ダイアログ

AI要約ダイアログには、2つの表示モードがあります:

概要表示(デフォルト)

サマリービューには、SLO名、目標値、エンティティ名、現在のSLI値、エラー許容範囲の状況、およびコンプライアンス状況(目標達成または未達)を含む、簡潔な1段落のエグゼクティブサマリーが表示されます。 SLOの状態を一目で素早く把握できます。

図 2. SLO AI サマリー ダイアログ ビュー

SLO AI サマリー ダイアログ ビュー

詳細を表示

「詳細を表示」 をクリックしてダイアログを展開すると、以下のセクションで構成された詳細な分析にアクセスできます:

  • SLOの概要 :名前、目標値(パーセンテージ)、指標の種類(可用性、遅延、トラフィック、飽和度、またはカスタム)、時間枠、およびタイムゾーンを含む、設定の詳細をすべて確認できます。
  • エンティティのコンテキスト :タイプ(アプリケーション、Webサイト、合成テスト、またはインフラストラクチャ)、名前、識別子、ラベル、およびスコープ設定を含む、エンティティに関する完全な情報。
  • パフォーマンス状況 :現在のSLI割合とステータスインジケーター、残りのエラー許容範囲(負の値は許容範囲が枯渇していることを示す)、総許容範囲に対する使用済みエラー許容範囲、および目標に対するエラー消費率。
  • 主な分析ポイント :継続的なエラー蓄積パターン、バーンレートの推移、慢性的な過剰消費の兆候、データ品質の問題(エラーゼロ、システム停止、データ欠落)、予算変更に伴うエラーの急増、および継続的な違反状況などを網羅した詳細な分析。
  • 推奨事項 :根本原因の調査に関する指針、アラート閾値の調整、冗長性とフェイルオーバーの改善、エラー定義の精緻化、監視機能の強化、SLO目標値の調整など、優先順位付けされた詳細なアクション。
図 3. SLO AIの詳細表示

SLO AIの詳細表示

ダイアログの操作

  • 閉じる :ダイアログを閉じ、SLOの詳細ページに戻ります。
  • コピーアイコン :要約テキストをクリップボードにコピーし、レポートやその他の連絡に使用できます。
  • 「 PDF 」としてダウンロード :AI分析結果全体を、共有や保存用に PDF ドキュメントとしてエクスポートします(詳細表示画面で利用可能です)。

ユース・ケース

AIを活用したSLO分析は、次のような場合に役立ちます:

  • ステータスの迅速な確認 :チャートを手動で分析することなく、SLOの健全性を即座に把握できます。
  • インシデント対応 :システム停止時に、根本原因を迅速に特定し、推奨される対応策を提示します。
  • 報告 :ステークホルダー向けにエグゼクティブサマリーを作成する。
  • 傾向分析 :SLO違反の経時的な傾向を把握する。
  • 最適化 :サービスの信頼性を向上させるための、データに基づいた提案を受け取ることができます。

ノート

  • AIによる要約は、現在選択されている時間枠(設定済みのSLO時間枠、またはUIで選択された時間範囲)に基づいて生成されます。
  • この分析では、時間ベースおよびイベントベースの両方のSLO設定について検討しています。
  • 推奨事項は、特定の指標タイプ(可用性、遅延、トラフィック、飽和度、またはカスタム)に合わせて調整されます。
  • すべてのエンティティタイプ(アプリケーション、Webサイト、合成テスト、インフラストラクチャ)に対応しています。
  • イベントベースのSLOの場合、エラー許容範囲は動的であり、トラフィック量の変動に応じて変化します。

SLOの作成

SLOを作成するには、 「サービスレベル目標を作成」 をクリックします。 これにより、以下の手順に従って新しいSLOを作成できるウィンドウが開きます:

エンティティー・タイプの選択

SLOを測定するためのエンティティー・タイプを選択します。 以下のエンティティタイプに対して、パフォーマンス目標を定義および測定できます:

  • アプリケーション : アプリケーションの観点から通話のパフォーマンスを測定する。
  • ウェブサイト : ウェブサイト内のビーコンとトレースのパフォーマンスを測定する。
  • 合成テスト :1つ以上の合成テストの結果のパフォーマンスを測定します。
  • インフラストラクチャ :ホスト、コンテナ、その他のインフラストラクチャコンポーネントなどのインフラストラクチャエンティティのパフォーマンスを測定します。

エンティティーの選択

エンティティの種類を選択した後、監視対象の特定のエンティティを選択してください。

アプリケーション

環境内で利用可能なアプリケーション・パースペクティブの検索可能なリストから、アプリケーション・パースペクティブを選択してください。

ウェブサイト向け

環境内で利用可能なウェブサイトの検索可能なリストからウェブサイトを選択してください。

合成テスト用
  • 個々の合成テストに基づいて :[ 合成テストを追加] をクリックするとダイアログが開き、環境内で利用可能なテストから1つ以上の合成テストを検索して選択できます。 場所や種類などの属性でテストを絞り込み、検索結果から複数のテストを選択することができます。 選択されたテストは固定リストを構成するため、SLOの評価には選択されたテストのみが含まれます。

    • 合成テストの結果 :SLOの計算にオンデマンドの合成テストの結果を含めるには、このトグルをオンに設定してください。 デフォルトでは、このオプションは無効になっており、すべてのオンデマンドテストの結果は除外されます。
  • フィルタに基づく :タグフィルタ式を使用して、SLOの範囲を定義することもできます。 このオプションでは、合成テスト名、ロケーションID、アプリケーションID、またはその他のサポートされている属性などのフィルターを指定します。 フィルターには、「等しい」、「先頭が一致する」などの演算子や、その他のサポートされている一致ルールが含まれており、使用する演算子に応じてワイルドカード形式の一致にも対応しています。 指定されたフィルタに一致するすべての合成テストは、自動的にSLOの計算に組み込まれます。 個々のテストを選択する場合とは異なり、このアプローチでは動的なスコープが作成されます。つまり、フィルタ条件に一致する新しい合成テストが作成されると、それらが自動的にSLOに組み込まれることになります。

インフラストラクチャ向け

インフラストラクチャのタイプ選択は、次のステップにおけるスコープ設定の一部です。

スコープの設定

スコープを設定して、測定するデータを指定します。 スコープの設定はエンティティタイプによって異なります。

アプリケーション

スコープ内の通話において、サービスおよびエンドポイントの可用性を判断するために含める通話を選択します:

  • スコープ内の呼び出し

    • 着信コール: アプリケーション外部から発信されたコールを含み、宛先サービスが選択されたアプリケーションのビューの一部であるもの。
    • すべての呼び出し: アプリケーション外部からの着信呼び出しと、アプリケーション内視点で発生する呼び出しの両方を含みます。
  • 非表示の呼び出しを含める (オプション)

    • 内部呼び出し: サービス内部で実行される作業を表す呼び出し。 これらはカスタムトレースを通じて送信される中間スパンから作成できます。
    • 合成コール: ヘルスチェックエンドポイントへのコールなど、合成エンドポイントを宛先とするコール。
  • サービスとエンドポイントスコープの定義方法を選択してください:

    • 選択 : 利用可能なサービスとエンドポイントから選択するには、ドロップダウンメニューを使用してください
      • アプリケーション内の特定のサービスを選択するか、デフォルトの「 すべてのサービス 」を使用してアプリケーション全体を含めます。
      • 指定されたサービスからエンドポイントを選択するか、デフォルトの「 すべてのエンドポイント 」を使用してサービス全体に適用します。
    • フィルター : 利用可能なタグを使用してカスタムフィルターを指定し、アプリケーションの測定対象となるコールの範囲を定義します。 これらのフィルターは必要に応じて組み合わせて複合クエリを作成できます。

Web サイト

  • ビーコン : 監視するビーコンの種類を選択してください。 現在、 HTTP リクエストのみがサポートされています。 この制限事項は情報バナーに表示されます。
  • カスタムフィルター (オプション):選択したビーコンタイプの範囲を絞り込むカスタムフィルターを追加します。 複数のフィルターを組み合わせて、地理的位置、ブラウザ、ユーザーなどの属性に基づく複合クエリを作成できます。

インフラストラクチャー

  • インフラストラクチャの種類 : 監視対象とするインフラストラクチャエンティティの種類を、環境内で利用可能な種類(例: ホスト、コンテナ、 Kubernetes クラスタ、その他のインフラストラクチャコンポーネント)から選択します。
  • カスタムフィルター (任意):インフラストラクチャの範囲を絞り込むカスタムフィルターを追加します。 複数のフィルターを組み合わせて、複合照会を作成できます。 これらのフィルターでは、論理演算子(AND、OR、NOT)および比較演算子(等しい、等しくない、存在)を用いたタグフィルター式が使用されます。

インジケーターの設定

そのエンティティに対して測定するSLIを定義します。

ブループリントを選択して、インジケーターのタイプを定義できます。 利用可能な設計図はエンティティの種類によって異なります:

  • アプリケーションおよび Web サイトエンティティ向け: レイテンシ可用性トラフィックカスタム
  • 合成テスト対象エンティティ: レイテンシー可用性トラフィック
  • インフラストラクチャエンティティ向け: 飽和状態カスタム

このインジケーターは、SLOステータスとエラー予算の計算に使用されるメトリックと測定タイプを指定するために使用されます。

  • レイテンシ :コール、ビーコン、またはテスト結果の応答時間を、指定されたしきい値に対して測定します。 しきい値はミリ秒(ms)単位で指定されます。 レイテンシブループリントは、2種類の測定をサポートします:
    • 時間ベース :すべてのコール、ビーコン、またはテスト結果の応答時間は、1分単位のバケットに集計されます。 エラー予算は分単位で測定され、SLO目標とSLO時間枠の期間から導出される静的値である。 各分ごとの集計結果が指定された閾値を超えた場合、その分は不良分とみなされ、エラー予算が減少する。 また、以下のオプションから使用する集計の種類を指定することもできます:
      • 平均値
      • 最小
      • 最大
      • パーセンタイル(25、50、75、90、95、98、99)
    • イベントベース : 各コール、ビーコン、またはテスト結果の応答時間が指定されたしきい値と比較され、正常または異常イベントとして判定される。 エラー予算は、呼び出し、ビーコン、または結果で測定され、SLO目標とSLO時間枠内のイベント総数から導出されます。 SLOの時間枠の期間中、イベントの総数は変化するため、総誤差予算は動的な値である。
  • 可用性 :定義された期間におけるコール、ビーコン、またはテスト結果の成功率を測定します。 しきい値はパーセンテージ(%)で設定されます。可用性ブループリントは2種類の測定値をサポートします:
    • 時間ベース :すべてのコール、ビーコン、またはテスト結果の成功率は、1分単位のバケットに集計されます。 エラー予算は分単位で測定され、SLO目標とSLO時間枠の期間から導出される静的値である。 各分ごとの集計結果が指定された閾値を下回る場合、その分は不良分とみなされ、エラー予算が削減される。 現在、可用性ブループリントでは平均集計のみがサポートされています。
    • イベントベース : SLO期間全体におけるコール、ビーコン、またはテスト結果の総合的な成功率が算出されます。 エラー予算は、コール、ビーコン、または結果で測定され、SLO目標とSLO時間枠内のイベント総数から導出されます。 SLOの時間枠の期間中、イベントの総数は変化するため、総誤差予算は動的な値である。
  • トラフィック :システムが時間経過とともに遭遇する負荷(呼び出し、ビーコン、またはテスト結果)を測定します。 これは時間ベースの測定であり、1分あたりのイベント数が定義されたしきい値と比較されます。 しきい値が満たされない場合、その分は不良とみなされ、エラー予算が減少する。 また、カウントするイベントの種類を指定することもできます:
    • 全ビーコンカウント (ウェブサイト向け)、 全コール (アプリケーション向け)、 または全結果 (合成テスト向け):指定されたエンティティのシステム全体のトラフィックを測定するために使用できます。
    • ビーコンエラー数 (ウェブサイト向け)、 不正な呼び出し (アプリケーション向け)、 または不正な結果 (合成テスト向け):これにより、測定対象を不正なトラフィックのみに絞り込むことができます。
  • 飽和度 :リソース利用率を指定された閾値に対して測定します。 サチュレーション設計図は、インフラストラクチャエンティティタイプでのみ利用可能です。 サチュレーションブループリントの測定には2種類あります:
    • 時間ベース : インフラストラクチャのメトリック値は1分単位のバケットに集計されます。 エラー予算は分単位で測定され、SLO目標とSLO時間枠の期間から導出される静的値である。 各分ごとの集計結果が指定された閾値を超えた場合、その分は不良分とみなされ、エラー予算が減少する。 以下を指定する必要があります。

      • メトリック :測定対象のインフラストラクチャ指標
      • 集計 : 集計の種類(平均、最小値、最大値、またはパーセンタイル:25、50、75、90、95、98、99)
      • 演算子 : 比較演算子 (>, >=, <, <=)
      • しきい値 :比較のための閾値
    • イベントベース : インフラストラクチャのメトリック値は10秒間隔で取得されます。 エラー予算はメトリックスナップショットで測定され、SLO目標とSLO時間枠の期間から導出される静的値である。 メトリクススナップショットは10秒間隔で一定に取得されるため、スナップショットの総数は事前に決定されており、SLOの時間枠の期間中変化しません。 以下を指定する必要があります。

      • メトリック :測定対象のインフラストラクチャ指標
      • 演算子 : 比較演算子 (>, >=, <, <=)
      • しきい値 :比較のための閾値

      集計タイプはしきい値演算子に基づいて自動的に選択されます:

      • MAX集計は >=> 、10秒間のウィンドウ内でしきい値を超えるスパイクが潜在的な侵害として確実に捕捉されるように使用されます。
      • MIN集計は <=< 、10秒間のウィンドウ内でしきい値を下回る低下を潜在的な侵害として確実に捕捉するために使用されます。
  • カスタム : カスタムフィルターを使用して、良好なイベントと不良なイベントの定義を指定します。 これはイベントベースの測定です。
    • アプリケーションおよびWebサイトエンティティタイプの場合:正常な呼び出しと異常な呼び出し、またはビーコンに対するフィルターを定義できます:

      • 成功したイベント :成功したビーコンまたは呼び出しを特定するためのフィルターを指定します。 これらのフィルターは必要に応じて組み合わせて複合クエリを作成できます。 成功したイベントのみが定義されている場合、フィルタに一致しないイベントは失敗したとみなされます。
      • 失敗したイベント (オプション):失敗したビーコンまたは呼び出しに対するフィルターを任意で指定します。 失敗したイベントフィルターが定義されている場合、成功したイベントフィルターと失敗したイベントフィルターのいずれにも一致しないイベントは計測対象から除外されます。
    • インフラストラクチャエンティティタイプの場合:正常イベントと異常イベントに対して、メトリックに基づく条件を定義できます。 以下を指定する必要があります。

      • 良好なイベント :良好なイベントの指標、演算子、しきい値を定義する
      • 不良イベント :不良イベントのメトリック、演算子、しきい値を定義する

      良いイベントと悪いイベントを定義する指標は、同じでも異なっていてもよい。 飽和度ベース(時間ベースまたはイベントベース)の指標とは異なり、このアプローチではインフラ監視のニーズに基づいて柔軟なカスタムSLO定義が可能です。

目標の設定

SLOの全体的な目標値と、SLOの時間枠に関する詳細を定義します。

  • SLO目標値 :エンティティが正常に動作している場合に達成すべき目標パーセンテージを指定します。
注: 現在サポートされている最大精度は9が4つ( 99.99 %)です。
  • 時間ウィンドウ : SLOの時間ウィンドウの種類を指定します。
    • 固定 :明確な開始時刻と継続時間を伴う時間枠。 たとえば、2020年1月1日から始まる固定の1週間の期間を設定できます。 週が終了すると、時間枠は自動的に翌週(2020-01-08)にリセットされます。
    • ローリング :固定されたウィンドウサイズを持つ動的な時間ウィンドウであり、その終了点はグローバルタイムピッカーの終了日時選択によって定義される。 例えば、ローリング時間ウィンドウにより、常に過去1週間を表示することが可能になります。
  • 長さ :SLOの時間枠の期間。日数、週数、または暦月で指定されます。
    • カレンダー月選択について:固定時間枠でのみ利用可能です。 時間枠は暦月の境界(各月の初日から最終日まで)に一致します。 SLOが月の途中で作成された場合、最初の測定期間は作成日からその月末まで(部分期間)となり、以降の期間は完全な暦月に従って設定されます。
  • タイムゾーンのバインド : SLOタイムウィンドウへのタイムゾーンのバインドを有効または無効にします。 タイムゾーンに紐付けられていない場合、デフォルト UTC で選択されます。
  • タイムゾーン : SLOの時間枠のタイムゾーンを指定します。 参考までに、有効なタイムゾーンIDの完全なリストは こちら で確認できます。
注: サポートされるSLOの最大期間は4週間です。
  • 開始 : 固定時間枠の場合、SLO計算を開始する日時。

SLO目標と時間ウィンドウの値を入力すると、エラー予算が表示されます。

  • 時間ベースのブループリントでは、これは時間枠の長さとSLO目標によって決定される、分単位での真のエラー予算である。
  • イベントベースのブループリントの場合、これは前回のSLO期間中に発生した呼び出しまたはビーコン、指定された時間窓の長さ、およびSLO目標に基づいて推定されたエラー予算です。

詳細の入力

  • 名前 : SLOの名前を指定してください。
  • タグ (任意):SLOを分類またはソートするために使用できるタグのセットを指定します。
  • チーム (任意):このSLOのアクセス権限を管理するチームを割り当てます。
  • SLO構成を作成するには、 [作成] をクリックします。