IBMニュースレター
The DX Leaders
AI活用のグローバル・トレンドや日本の市場動向を踏まえたDX、生成AIの最新情報を毎月お届けします。登録の際はIBMプライバシー・ステートメントをご覧ください。
ニュースレターは日本語で配信されます。すべてのニュースレターに登録解除リンクがあります。サブスクリプションの管理や解除はこちらから。詳しくはIBMプライバシー・ステートメントをご覧ください。
LLMのオブザーバビリティーとは、LLMモデルまたはアプリから、その動作、性能、アウトプット特性に関するリアルタイムのデータを収集するプロセスのことです。LLMは複雑であるため、LLMが出力するパターンに基づいてLLMを観察することができます。1
優れたオブザーバビリティー・ソリューションは、LLMアプリケーション、アプリケーション・プログラミング・インターフェース(API) 、ワークフローから関連するメトリクス、トレース、ログの収集で構成されています。これにより、開発者はアプリケーションを効率的かつ積極的に、大規模に監視、デバッグ、最適化することができます。
大規模言語モデル(LLM)と生成AI(Gen AI)プラットフォームのIBM watsonx.ai®そして、オープンソースのバリエーションが業種・業務で定着しつつあります。この増加により、採用後もモデルやアプリケーションの信頼性、安全性、効率を維持することがこれまで以上に重要になっています。この領域では、LLMのオブザーバビリティーが不可欠になります。
IBMニュースレター
AI活用のグローバル・トレンドや日本の市場動向を踏まえたDX、生成AIの最新情報を毎月お届けします。登録の際はIBMプライバシー・ステートメントをご覧ください。
ニュースレターは日本語で配信されます。すべてのニュースレターに登録解除リンクがあります。サブスクリプションの管理や解除はこちらから。詳しくはIBMプライバシー・ステートメントをご覧ください。
LLMの可観測性メトリックは、主に3つの側面に分類できます。
大規模言語モデル(LLM)のオブザーバビリティーは、システムの性能、参考情報、メトリクスを追跡するメトリクスを追跡して初めて実現できる4
システム性能メトリクス:
リソース使用率メトリクス:
モデル行動メトリクス:
大量のデータ、複雑なシステム・アーキテクチャー、リアルタイム追跡の必要性から、LLMを手動でモニタリングすることは困難です。ログとメトリクスが豊富なため、問題を迅速に特定することが困難になっています。さらに、手動観測は参考情報の負担が多く、エラーが発生しやすく、システムの拡張に合わせて効果的に拡張できないため、問題検知が遅くなり、トラブルシューティングが非効率的になります。
これらの制限は、LLMにおいてオブザーバビリティーを手動で維持することの困難さを示しており、エンタープライズ環境向けのより洗練された自律的なソリューションの必要性を浮き彫りにしています。6
自律型トラブルシューティングとは、エージェント・ベースのシステムを使用した高度な監視方法により、人間の介入を必要とせずに問題を独自に特定、診断、解決できるシステムを指します。エージェントは性能を監視し、異常を特定し、リアルタイム診断を実行するため、システムを人間の介入なしで無人で稼働させることができます。 7
エージェント・ベースの自律的なトラブルシューティングは、次の場合に役立ちます。
大規模に設計されたIBM® Instana®は、今日の複雑なエンタープライズ・オブザーバビリティーにリアルタイムの可視性と自律的なトラブルシューティングをもたらします。
検知、AI駆動型診断、自律的な修復という3段階のプロセスにより、Instanaはエンドツーエンドの自律的なトラブルシューティングを実現し、性能に影響が及ぶ前に問題を確実に検知して修復します 8。
この機能の詳細については、Instana エージェント型AI ウェイティングリストにご登録ください。
生成AIのスケーリングには、インテリジェントなインストルメンテーション、リアルタイムのLLMモニタリング、効果的なオーケストレーションによる自律的なトラブルシューティングが必要です。データセット、アウトプット、LLM応答の最適化に加え、最適化されたパイプラインとリアルタイムLLMテストによる堅牢なモデル性能の保守は、ユースケースなどのさまざまなユースケースでスムーズなエクスペリエンスを実現するために不可欠です。オープンソースLLMと機械学習ワークフローの使用が拡大しており、埋め込み技術を活用して、さまざまなツールを使用してLLM呼び出しを監視しています。洗練されたLLMオブザーバビリティー観測ツールを統合されたオブザーバビリティー観測プラットフォームとダッシュボードに組み込むOpenTelemetryなどのツールは、最適なモデル性能を提供するスケーラブルで安定したAIシステムを構築するために不可欠である9, 10
オンプレミス、クラウド、またはメインフレームのあらゆるアプリケーションのソフトウェア配信を自動化します。
DevOpsソフトウェアとツールを使用して、複数のデバイスや環境でクラウドネイティブ・アプリケーションを構築、デプロイ、管理します。
IBMのクラウド・コンサルティング・サービスで新しい機能にアクセスし、ビジネスの俊敏性を高めましょう。ハイブリッドクラウド戦略や専門家とのパートナーシップを通じて、ソリューションを共創し、デジタル・トランスフォーメーションを加速させ、パフォーマンスを最適化する方法をご覧ください。
1 Kumar, S., & Singh, R. (2024).「Don't blame the user: Toward means for usable and practical authentication」Communications of the ACM、67(4)、78–85。https://dl.acm.org/doi/10.1145/3706599.3719914。
2 Datadog.(n.d.)。LLMのオブザーバビリティーとモニタリングとは何か?2025年5月19日、https://www.datadoghq.com/knowledge center/llm-observability/より取得。
3 「LLM-observability」、GitHub社、検索日:2025年5月19日、 https://github.com/DataDog/llm-observability、Datadog、(n.d.)。
4 Dong, L., Lu, Q., & Zhu, L. (2024年)。「AgentOps: Enabling Observability of LLM Agents」arXiv:https://arxiv.org/abs/2411.05285
5LangChain。(n.d.)。「Datadog LLM Observability - LangChain, Langsmith .js」2025年5月19日にhttps://js.langchain.com/docs/integrations/callbacks/datadog_tracer/ から取得。
6 「Optimizing LLM Accuracy」2025年5月19日に https://platform.openai.com/docs/guides/optimizing-llm-accuracy から取得
7「IBM Instana Observability」2025年5月19日にhttps://www.ibm.com/jp-ja/products/instana から取得
8 「AIエージェントの監視」IBM資料、検索日:2025年5月19日、 https://www.ibm.com/docs/en/instana-observability/1.0.290?topic=applications-monitoring-ai-agentsから取得
9 Zhou, Y., Yang, Y., & Zhu, Q. (2023年)。「LLMGuard: Preventing Prompt Injection Attacks on LLMs via Runtime Detection」arXiv preprint arXiv:2307.15043。https://arxiv.org/abs/2307.15043
10 Vesely, K., & Lewis, M. (2024)。「Real-Time Monitoring and Diagnostics of Machine Learning Pipelines」Journal of Systems and Software、185、111136。