オブザーバビリティー(可観測性)とは、システムから外部に出力されるデータから、複雑化したシステムの内部の状態または状況を理解および把握する能力を指します。「Observe(観察する)」と「ability(能力)」を組み合わせた言葉の通りにシステムを観察する能力を発揮することで、さまざまなパフォーマンス上の問題の根本的な原因の究明が、追加のテストやコーディングを行うことなく迅速かつ正確に把握できます。
オブザーバビリティーは比較的新たなトピックであることから、過剰なバズワードと見なされることがあります。また、アプリケーション・パフォーマンス管理(APM)やネットワーク・パフォーマンス管理(NPM)のリブランディングと誤解される場合もあります。実際のところ、オブザーバビリティーはAPMおよびNPMにおけるデータ収集方法が進化したものであり、迅速化、分散化、ダイナミック化するクラウドネイティブ・アプリケーションの展開に適切に対応します。オブザーバビリティーは監視に取って代わるものではなく、優れた監視と、優れたAPMおよびNPMを実現するものです。
(「オブザーバビリティー」という言葉は制御理論に由来しています。制御理論とは、例えば、システムからのフィードバックに基づいて自動的に実行される「パイプを流れる水流の制御」や「上り坂や下り坂を走行時の車両の制御」のような動的なシステムにおける自動的な調整に関する工学分野の理論のことです。 )
IBM Cloud Pak for AIOps-AIOpsプラットフォームの概要
IBM Turbonomic Application Resource Management
IBM Instana Observability-アプリケーション・パフォーマンスの監視
IBM SevOne Network Performance Management
過去20年近く、ITチームはアプリケーションの監視とトラブルシューティングを主にAPMに依存してきました。 APMは、アプリケーションのパフォーマンスの問題に関連することで知られている「テレメトリー(アプリケーションとシステムのデータ)」を定期的にサンプリングして集約します。 そして、APMは、重要業績評価指標(KPI)に関連するテレメトリーを分析し、結果をダッシュボードにまとめて、問題を解決または防止するために対処する必要のある異常な状態を運用チームやサポートチームに警告します。
新しいコードが定期的にリリースされ、アプリケーション・コンポーネントとサーバーおよび関連リソースとの間のワークフローと依存関係が、既知であるか追跡が容易になっている場合、APMは、モノリシック・アプリケーションや従来型の分散アプリケーションの監視とトラブルシューティングに十分な効果を発揮します。
しかし、今日、企業や組織は、急速に、現代の開発プラクティス(アジャイル開発、継続的インテグレーション/継続的デプロイメント(CI / CD)、DevOps、複数のプログラミング言語)と、クラウド・ネイティブ技術(例えば、マイクロサービス、Dockerコンテナ、Kubernetesやサーバーレス機能)を採用しています。 その結果、企業や組織は、これまで以上に迅速に、多くのサービスを市場に投入しています。 しかし、その過程で、企業や組織は、新たなアプリケーション・コンポーネントを、非常に頻繁に、多くの場所で、多言語で、(サーバーレス機能の場合)数秒または数分の1秒ごとに展開しているため、APMにおける1分ごとのデータサンプリングでは、テレメトリーとしては十分ではなくなっています。
必要なのは高品質のテレメトリーであり、高品質のテレメトリーがあれば、すべてのアプリケーション利用者のリクエストやトランザクションについて、忠実でコンテキストに富む、完全に相関する記録を作成できます。これこそが、オブザーバビリティーが必要となる理由です。
IBM Data Observability by Databand
クラウド監視とは
オブザーバビリティー・プラットフォームは、アプリケーションとインフラストラクチャーのコンポーネントに組み込まれている既存の計測機器と統合し、これらのコンポーネントに計測機能を追加するツールを提供することで、パフォーマンス・テレメトリーを継続的に検出および収集します。 オブザーバビリティーは、主に4つのテレメトリー・タイプに焦点を当てています。
ログ ログは、タイム・スタンプが付与されたアプリケーション・イベントの詳細で完全かつ不変のレコードです。 特に、ログを使用して、忠実度の高い、ミリ秒ごとのすべてのイベントのレコードを作成し、周囲のコンテキストを含めて、開発者が、トラブルシューティングやデバッグの目的で「再生」させられます。
メトリック メトリック(時系列メトリックと呼ばれることもあります)は、例えば、アプリケーションが5分間にどれだけのメモリーやCPUを使用したか、使用量が急増している間どれだけの遅延が発生したかなど、特定の期間におけるアプリケーションやシステムの健全性を図る基本的な尺度です。
トレース トレースは、UIまたはモバイルアプリから分散アーキテクチャ全体を経由してユーザーに戻るまで、全てのユーザー・リクエストにおけるエンド・ツー・エンドの「ジャーニー」を記録します。
依存関係(依存関係マップとも呼ばれます)は、各アプリケーション・コンポーネントが、他のコンポーネント、アプリケーション、ITリソースにどのように依存しているかを明らかにするものです。
このテレメトリを収集した後、プラットフォームはそれをリアルタイムで関連付けます。そして、DevOpsチーム、サイト信頼性エンジニアリング(SRE)チーム、ITスタッフに、アプリケーションのパフォーマンスの問題を示唆、原因、対処に利用できる可能性があるイベントの内容、場所、理由を網羅したコンテキスト情報を提供します。
多くのオブザーバビリティー・プラットフォームは、システム内に出現する可能性のあるテレメトリの新しいソース(別のソフトウェア・アプリケーションへの新しいAPI呼び出しなど)を自動的に検出します。 また、標準のAPMソリューションよりもはるかに多くのデータを処理するため、多くのプラットフォームは、ノイズ(問題に関係のないデータ)からシグナル(実際の問題の兆候)をふるいにかけるAIOps(AIを活用したIT運用)機能が搭載されています。
サイト信頼性エンジニアリングとは
AIOpsとは
オブザーバビリティーの包括的なメリットは、他のすべての条件が同じであれば、オブザーバビリティーの高いシステムの方がオブザーバビリティーの低いシステムに比べて、一般的にも細部においても理解しやすく、監視しやすく、新しいコードでの更新が容易であり、より安全で修復しやすいことです。 より具体的には、オブザーバビリティーは、企業や組織が以下を行えるようにすることで、より高品質なソフトウェアを、より迅速に提供するというアジャイル/DevOps/SREの目標を直接サポートします。
IBMは、お客様のビジネス・ワークフローからIT運用まで、AIを活用した自動化を提供いたします。
ハイブリッドクラウド用の優れたエンタープライズ向けオブザーバビリティー・プラットフォームをご覧ください。
IBM Cloud Pak® for AIOpsは、IT運用担当者のために、AIを中核としたIT運用ツールチェーンを実現する、IT運用管理ソリューションです。
監視と可観測性は、問題の根本的な原因を特定する2つの方法です。この2つの類似点と相違点は何でしょうか。
IBMの解説書で、可観測性を採用する理由とその方法をご覧ください。
この電子書籍は、新しい 世界を検証するものです。 監視にまつわる不安を取り除き、 可観測性の世界へ 最初の一歩を踏み出しましょう、これは 開発者にとってますます重要になっています。
AIOpsドメインにおけるIBMの3つの相乗的ソリューション:IBM Observability by Instana APM、Turbonomic Application Resource Management for IBM Cloud Paks、IBM Cloud Pak® for Watson AIOps。