過去20年近く、ITチームはアプリケーションの監視とトラブルシューティングを主にAPMに依存してきました。 APMは、アプリケーションのパフォーマンスの問題に関連することで知られている「テレメトリー(アプリケーションとシステムのデータ)」を定期的にサンプリングして集約します。 そして、APMは、重要業績評価指標(KPI)に関連するテレメトリーを分析し、結果をダッシュボードにまとめて、問題を解決または防止するために対処する必要のある異常な状態を運用チームやサポートチームに警告します。
新しいコードが定期的にリリースされ、アプリケーション・コンポーネントとサーバーおよび関連リソースとの間のワークフローと依存関係が、既知であるか追跡が容易になっている場合、APMは、モノリシック・アプリケーションや従来型の分散アプリケーションの監視とトラブルシューティングに十分な効果を発揮します。
しかし、今日、企業や組織は、急速に、現代の開発プラクティス(アジャイル開発、継続的インテグレーション/継続的デプロイメント(CI / CD)、DevOps、複数のプログラミング言語)と、クラウド・ネイティブ技術(例えば、マイクロサービス、Dockerコンテナ、Kubernetesやサーバーレス機能)を採用しています。 その結果、企業や組織は、これまで以上に迅速に、多くのサービスを市場に投入しています。 しかし、その過程で、企業や組織は、新たなアプリケーション・コンポーネントを、非常に頻繁に、多くの場所で、多言語で、(サーバーレス機能の場合)数秒または数分の1秒ごとに展開しているため、APMにおける1分ごとのデータサンプリングでは、テレメトリーとしては十分ではなくなっています。
必要なのは高品質のテレメトリーであり、高品質のテレメトリーがあれば、すべてのアプリケーション利用者のリクエストやトランザクションについて、忠実でコンテキストに富む、完全に相関する記録を作成できます。これこそが、オブザーバビリティーが必要となる理由です。
IBM Data Observability by Databand
クラウド監視の詳細はこちら
オブザーバビリティー・プラットフォームは、アプリケーションとインフラストラクチャーのコンポーネントに組み込まれている既存の計測機器と統合し、これらのコンポーネントに計測機能を追加するツールを提供することで、パフォーマンス・テレメトリーを継続的に検出および収集します。 オブザーバビリティーは、主に4つのテレメトリー・タイプに焦点を当てています。
ログ ログは、タイム・スタンプが付与されたアプリケーション・イベントの詳細で完全かつ不変のレコードです。 特に、ログを使用して、忠実度の高い、ミリ秒ごとのすべてのイベントのレコードを作成し、周囲のコンテキストを含めて、開発者が、トラブルシューティングやデバッグの目的で「再生」させられます。
メトリック メトリック(時系列メトリックと呼ばれることもあります)は、例えば、アプリケーションが5分間にどれだけのメモリーやCPUを使用したか、使用量が急増している間どれだけの遅延が発生したかなど、特定の期間におけるアプリケーションやシステムの健全性を図る基本的な尺度です。
トレース トレースは、UIまたはモバイルアプリから分散アーキテクチャ全体を経由してユーザーに戻るまで、全てのユーザー・リクエストにおけるエンド・ツー・エンドの「ジャーニー」を記録します。
依存関係(依存関係マップとも呼ばれます)は、各アプリケーション・コンポーネントが、他のコンポーネント、アプリケーション、ITリソースにどのように依存しているかを明らかにするものです。
このテレメトリを収集した後、プラットフォームはそれをリアルタイムで関連付けます。そして、DevOpsチーム、サイト信頼性エンジニアリング(SRE)チーム、ITスタッフに、アプリケーションのパフォーマンスの問題を示唆、原因、対処に利用できる可能性があるイベントの内容、場所、理由を網羅したコンテキスト情報を提供します。
多くのオブザーバビリティー・プラットフォームは、システム内に出現する可能性のあるテレメトリの新しいソース(別のソフトウェア・アプリケーションへの新しいAPI呼び出しなど)を自動的に検出します。 また、標準のAPMソリューションよりもはるかに多くのデータを処理するため、多くのプラットフォームは、ノイズ(問題に関係のないデータ)からシグナル(実際の問題の兆候)をふるいにかけるAIOps(AIを活用したIT運用)機能が搭載されています。
サイト信頼性エンジニアリング
AIOps
オブザーバビリティーの包括的なメリットは、他のすべての条件が同じであれば、オブザーバビリティーの高いシステムの方がオブザーバビリティーの低いシステムに比べて、一般的にも細部においても理解しやすく、監視しやすく、新しいコードでの更新が容易であり、より安全で修復しやすいことです。 より具体的には、オブザーバビリティーは、企業や組織が以下を行えるようにすることで、より高品質なソフトウェアを、より迅速に提供するというアジャイル/DevOps/SREの目標を直接サポートします。
IBMは、お客様のビジネス・ワークフローからIT運用まで、AIを活用した自動化を提供いたします。
ハイブリッドクラウド用の優れたエンタープライズ向けオブザーバビリティー・プラットフォームをご覧ください。
IBM Cloud Pak® for AIOpsは、IT運用担当者のために、AIを中核としたIT運用ツールチェーンを実現する、IT運用管理ソリューションです。