クラウドネイティブ・オブザーバビリティーとは

サーバー・ルーム内にいるIT作業員

クラウドネイティブ・オブザーバビリティー、定義

クラウドネイティブ オブザーバビリティーは、非常に複雑なクラウド・アプリケーションとシステム(典型的にはマイクロサービス ベースで、しばしばサーバーレス)を、そのアウトプットとテレメトリー・データに基づいて理解する能力です。

クラウドネイティブ・オブザーバビリティーは、クラウド・システムがもたらす課題に特化している点で、従来のオブザーバビリティーとは異なります。このようなシステムでは、コンテナ、仮想マシン、その他のリソースを瞬時にプロビジョニングや削除でき、大量の、時には一時的なデータを作成できます。

クラウドネイティブ・オブザーバビリティー・ソリューションは、組織がこの変更可能なシステムの主要なデータポイントを追跡するのに役立ち、さらにはDevOpsプロセスと、その小規模かつ頻繁で自動的されることの多い更新のサポートに役立ちます。

クラウドネイティブ・オブザーバビリティー・プラットフォームは、組織のハイブリッドクラウド環境全体からデータを収集します。これには、複数のプロバイダー(Microsoft AzureやAmazon Web Servicesなど)からのサービス、オンサイト・サーバー、およびそれらがサポートする多くのツールやリソース(マイクロサービスやKubernetesのようなコンテナ・オーケストレーション・ツールなど)が含まれます。ネットワーク・トラフィックやレイテンシーなどのメトリクスや、プラットフォーム全体のそれらのメトリクス間の相関関係についての実用的な洞察を提供し、多くの場合、必要な修復や収集データの視覚化を自動化します。

例えば、クラウドベース・オブザーバビリティー・プラットフォームでは、クラウド・サーバーでホストされている仮想マシンからレイテンシー・メトリクスや、その仮想マシンのKubernetesでオーケストレーションされたコンテナからAPI呼び出しを記述したログ、および新しいアプリケーションのデプロイメントなどのネットワーク・イベントに関する情報を、収集できます。そして、収集したデータをチャートまたはグラフとして表示し、根本原因分析を実行することで、管理者にダウンタイムの原因について具体的な洞察を提供できます。

最新のプラットフォームの多くは、人工知能(AI)や機械学習(ML)を使って、こうした自動化機能を支えています。451 Researchの2025年レポートによると、オブザーバビリティー・ソリューションを使用する組織の71%がAI機能を使用しており、2024年の26%から増加しています。1

OpenTelemetry、Jaeger、Prometheusなど、多くの人気のクラウドネイティブ・オブザーバビリティー・ツールはオープンソースです。開発者コミュニティが問題発生時にプラットフォームやアプリケーション固有の修正プログラムを作成できるようにすることで、オープンソース・ツールは、時に予測不可能なクラウドネイティブ環境において組織に柔軟性を与え、ツールをさまざまなシステムやアプリケーション・プログラミング・インターフェース(API)と接続する能力を高めています。

The DX Leaders

AI活用のグローバル・トレンドや日本の市場動向を踏まえたDX、生成AIの最新情報を毎月お届けします。登録の際はIBMプライバシー・ステートメントをご覧ください。

ご登録いただきありがとうございます。

ニュースレターは日本語で配信されます。すべてのニュースレターに登録解除リンクがあります。サブスクリプションの管理や解除はこちらから。詳しくはIBMプライバシー・ステートメントをご覧ください。

クラウドネイティブ・オブザーバビリティーの仕組み

クラウドネイティブ・オブザーバビリティー・ツールは、クラウド・エコシステム全体からログ、トレース、メトリクスを収集します。多くの場合、ダッシュボードを通じて未加工データ、分析、可視化を提示し、ユーザーがアプリケーションの健全性とビジネス目標を監視できるようにします。

データ収集

大部分がマイクロサービスで構成されるクラウド環境では、新しいコンテナや仮想マシンが瞬時に消えたり現れたりするため、膨大な量のテレメトリー・データが作成されます。これにより、クラウドネイティブ・オブザーバビリティー・プラットフォームが取り組まなければならない新たな問題が生じます。それは、絶えず変化するネットワーク内のすべてを確認し、ビジネス・ニーズに合わせてネットワークが自動的に拡大・縮小するにつれて、もはや存在しない可能性のあるソースからのデータを追跡することです。

オブザーバビリティー・ツールは、これらの複雑なネットワーク内のCPUメモリ-・データ、アプリ・ログ、可用性情報、平均レイテンシー、およびその他のデータポイントの収集と集約を容易にします。

クラウドネイティブ・オブザーバビリティー・プラットフォームは、ログ、トレース、メトリクスというオブザーバビリティーの3つの柱を基盤としています。

ログ

ログは、アプリケーション・イベントに関する詳細な、タイムスタンプ付きの完全かつ不変の記録です。ログを使用することで、周囲のコンテキストを含む、あらゆるイベントのミリ秒単位の高忠実度の記録を作成できます。 開発者は、トラブルシューティングやデバッグのためにログを使用します。

トレース

トレースは、ユーザー・インターフェースからアーキテクチャー全体を通ってユーザーに戻るまで、すべてのユーザー・リクエストのエンドツーエンドの「過程」を記録します。

メトリクス

メトリクスは、アプリケーションやシステムの健全性を経時的に測定する基本的な尺度です。例えば、メトリクスは、アプリケーションが5分間にどれだけのメモリーまたはCPU容量を使用するか、または使用量の急増時にアプリケーションでどれだけのレイテンシーが発生するかを測定するために使用されます。

監視

可視性は、クラウドネイティブ・オブザーバビリティー・プラットフォームの中核機能です。コンテナ、仮想マシン、サーバー、およびマイクロサービスベースのネットワークのその他の要素を監視する機能は、分散トレースと依存関係マップが複雑でほとんど解読できない可能性がある、これらのアーキテクチャーにとって重要な機能です。

オブザーバビリティー・ダッシュボードを使用すると、ユーザーは、可用性やリソースの使用状況などのアプリケーションの健全性測定値と、コンバージョン率やアクティブ・ユーザーなどの関連するビジネス目標を監視できます。主要な機能の監視は、(依存関係グラフなどのツールを使用して)サービスが相互にどのように連携し、全体的なアーキテクチャーにどのように適合するかを明確にするのにも役立ちます。

分析

従来の監視は、最新のオブザーバビリティー・ソフトウェアの監視機能とは異なり、各データ・ソースから収集されたデータを集約して、わかりやすいレポートやダッシュボード、視覚化を作成するアプリケーション・パフォーマンス管理(APM)ツールを使用して行われていました。

最新のクラウド・コンピューティング環境では、オブザーバビリティー・ツールは基本的な遠隔測定をKubernetesレイヤーにオフロードすることが多く、コンテナ・オーケストレーション・ソフトウェアはプラットフォーム内でネイティブ・ツールを使用してオブザーバビリティーを実行します。Kubernetesがこのアクティビティを自動化できるようにすることで、ITチームはサービスレベル目標(SLO)とサービスレベル指標(SLI)のデータ分析に集中できるようになります。

最新のオブザーバビリティー・ソフトウェアのオートメーションは、収集、監視、分析だけにとどまりません。オブザーバビリティー・ツールは、新しいサービスがネットワークに追加されるときに、デバッグ・プロセス、インストルメンテーション、監視用ダッシュボードの更新の自動化をサポートすることもできます。また、エージェントの処理も管理できます。エージェントとは、エコシステム全体に展開され、テレメトリ-・データを継続的に収集する小さなソフトウェア・コンポーネントです。

クラウドネイティブ・オブザーバビリティーのメリット

クラウドネイティブ・オブザーバビリティーを実践することで、組織は複雑なシステムのより包括的な視点を得られ、平均修復時間(MTTR)を短縮し、オートメーション ツールをDevOpsのワークフローにさらに統合できます。

システムの透明性

高度に分散されたシステムでは、重複する膨大な数のサーバーやクラウドネイティブ・アプリケーションがシグナルやメトリクス、ログ、トレースを発信するだけで、データを常にクリーンに共有するとは限りません。クラウドネイティブ・オブザーバビリティー・ツールは、エコシステムからオブザーバビリティー・データを収集し、管理者がリアルタイムでトラブルシューティングを行い、データ駆動型の意思決定を行えるようにすることで、これらのボトルネックを克服するのに役立ちます。

より迅速な復旧

管理者(またはオブザーバビリティー・プラットフォーム内の自動化ツール)がクラウド内の問題間の相関関係を特定すると、根本原因分析を実行できます。例えば、あるプラットフォームは、特定の地域で高遅延が発生しているグローバルなアプリケーションの応答の遅さにフラグを立て、分析を実行して、問題の原因となっているサーバーの設定ミスや誤動作を特定するといったことが考えられます。

この分析によって、インシデントのトリアージに何時間も費やすことになるか、差し迫った問題を発生前に解決するかの違いが生まれ、これによりダウンタイムが削減され、DevOpsチームが他のタスクに専念できるようになります。

オートメーションの強化

人工知能ツールと機械学習ツールは、多くの最新オブザーバビリティー・プラットフォームの中核をなしており、ユーザーの介入なしに異常を検出し、根本原因分析を実行し、データの可視化に生成AIを使用します。

クラウド環境で生成される膨大な量のテレメトリー・データにより、AIとMLはクラウドベースのオブザーバビリティーにとって非常に重要になります。オブザーバビリティーを大規模に自動化すると、組織が他のビジネス機能も自動化できる洞察が得られます。例えば、予測分析により、企業は大量のトラフィックが発生する前に新しいサーバー・インフラストラクチャーをプロビジョニングできます。

クラウドネイティブ・オブザーバビリティーにおける課題

クラウドネイティブ・オブザーバビリティーは、このような膨大で多様なデータを収集および合成するため、拡張性と複雑さ、複数のオブザーバビリティー・ツールの使用、データ・プライバシーとコンプライアンスに関して課題をもたらす可能性があります。

拡張性と複雑さ

組織は、複雑なクラウド環境全体の可視性と、ストレージ・コスト、クエリー性能、データ保持に関する実務上の制約とのバランスを取る必要があります。適切なサンプリング戦略とデータの優先順位付けがなければ、収集されたデータ量がオブザーバビリティー・プラットフォームを圧倒する可能性があります。

コンテナ化されたマイクロサービスの無秩序な増加と急速な変化は、監視をアプリケーション・レベルだけでなく、Kubernetesのようなオーケストレーション・ツールのクラスターやノードにまで拡張しなければならない可能性も意味します。

複数のツールの使用

ほとんどの組織は、長年にわたって蓄積された数十種類の監視ツールを運用しており、それぞれが特定のチームや技術向けに使用されています。技術スタックは通常、複数のプログラミング言語、レガシー・システム、マルチクラウド環境、マイクロサービス、インフラストラクチャーの構成要素、各種フレームワークにまたがっており、相互運用性の確保が難しく、データが断片化しやすくなっています。これにより、オブザーバビリティーの本来の目的である「システムの健全性を統合的に把握する」ことを妨げてしまいます。

プライバシーとコンプライアンス

クラウドネイティブ・オブザーバビリティーは、企業全体の機密データをプラットフォームに集約することで、コンプライアンス上の課題を生み出します。テレメトリー・データには、個人情報(PII)、クレジットカード情報、保護された医療情報などが含まれることがよくあります。これらの種類のデータは、一般データ保護規則(GDPR)、医療保険の相互運用性と説明責任に関する法律(HIPAA)、California Consumer Privacy Act(CCPA)などの規制の管轄下に置かれることがあります。

データのマスキング、トークン化、地理的制限、役割ベースのアクセス制御がなければ、組織は機密データを不正ユーザーにさらしたり、規制要件に違反したりするリスクがあります。例えば、ヨーロッパの顧客の取引問題を解決するには、個人情報を含むログにアクセスする必要がある場合があります。米国に拠点を置く従業員がそのデータを閲覧した場合、GDPRの規制に違反する可能性があります。

オフィスでミーティングをするビジネスチーム

IBMお客様事例

お客様のビジネス課題(顧客満足度の向上、営業力強化、コスト削減、業務改善、セキュリティー強化、システム運用管理の改善、グローバル展開、社会貢献など)を解決した多岐にわたる事例のご紹介です。

クラウドネイティブ・オブザーバビリティーとAIOps

クラウドネイティブ・オブザーバビリティーの実装は、ITサービス管理と運用ワークフローを自動化、合理化、最適化するAI機能のアプリケーションであるAIOpsへの移行の柱です。

組織がクラウド内のデータの可視性を高めると、多くの場合広大で無秩序に広がる、予測不可能なクラウド環境においても、プロビジョニングやトラブルシューティングに関する意思決定を自動化できるようになります。つまり、オブザーバビリティーにより、組織はAIツールとMLツールの意思決定に対する信頼性を高めることで、AIOpsを実現できます。

クラウドネイティブ・オブザーバビリティーにおける主なAI機能は次のとおりです。

  • 異常検知:アルゴリズムがデータを大規模に分析し、システムの基本性能を決定し、逸脱を迅速に特定できます。

  • 根本原因分析:相関関係を超えて、エラーを直接修正するために実行できるアクションを特定します。

  • 予測分析:これによりAIモデルが将来のワークロードを予測し、それに応じてネットワークを拡張または縮小します。

クラウドネイティブ・オブザーバビリティーとフルスタック・オブザーバビリティーの比較

この2つは重要な類似点がありますが、クラウドネイティブ・オブザーバビリティーはフルスタック・オブザーバビリティーの実践とは異なります。クラウドネイティブ・オブザーバビリティーは、同じツールと手法をクラウドネイティブ環境に適応させたフルスタック・オブザーバビリティーの進化と考えることができます。

フルスタック・オブザーバビリティーでは、技術スタックのすべてのレイヤーにわたってテレメトリーを相関させます。フルスタック・オブザーバビリティー・プラットフォームは、複数のシステムからリアルタイムでデータを収集し、AIとMLを使用して異常を検知し、障害を予測し、管理者向けの洞察を生成します。

クラウドネイティブ・オブザーバビリティーはその進化形であり、フルスタック・オブザーバビリティーで使用されるデータ収集および分析ツールはクラウドネイティブ・テクノロジー専用に開発されており、複雑でコンテナ化されたマイクロサービスとシームレスに統合されています。

つまり、フルスタック・オブザーバビリティーはIT環境全体にわたる包括的なテレメトリー・データを提供しますが、クラウドネイティブ・オブザーバビリティーは、多くの場合サーバーレスなクラウド環境に特に焦点を当てています。

共同執筆者

Derek Robertson

Staff Writer

IBM Think

Matthew Kosinski

Staff Editor

IBM Think

関連ソリューション
フルスタック・オブザーバビリティーの自動化

問題の原因を迅速に特定し、修正します。 リアルタイムの高精度データにより、動的なアプリケーションおよびインフラストラクチャーの環境を完全に可視化できます。

フルスタック・オブザーバビリティーの詳細はこちら
クラウド・リソースの自動最適化

オブザーバビリティーを活用して、クラウドのリソースをプロアクティブに最適化し、パフォーマンスを確保し、コストを節約します。

クラウド・コスト最適化の詳細はこちら
アプリケーション管理の合理化

異種の環境、アプリケーション、ツールセットからのデータを利用して依存関係と関連性を分析し、アプリケーション環境の全体にわたる可視性を提供します。

アプリケーション管理の合理化の詳細はこちら
次のステップ

AIを活用したオブザーバビリティー・ツールが、クラウドネイティブなアプリケーションの健全性を支援、運用のレジリエンスを最大化します。

 

オブザーバビリティー・ソリューションを見る 無料相談・デモ体験はこちら
脚注

1.「Use of observability tools rises alongside AI integration – Highlights from VotE: Cloud Native」、451 Research社、2025年8月14日。