カラフルな薄い3D円が重なり合うデジタル・イラスト

可視性から理解へ:AIエージェントとLLMオブザーバビリティーによるAIオペレーションの高度化

IBM Think 2026で、IBMはInstanaの生成AIオブザーバビリティー機能の次の進化である、AIエージェントとLLMオブザーバビリティーを発表します。

IBM Think 2026で、IBMはInstanaの生成AIオブザーバビリティー機能の次の進化である、AIエージェントとLLMオブザーバビリティーを発表します。生成AIのオブザーバビリティーを基盤として、より深いインテリジェンス、オートメーション、ビジネス・コンテキストを提供し、チームが事後対応型のトラブルシューティングから事前対応型の管理されたAI運用へと移行できるようにします。

AIシステムが本番環境でどのように動作するかを理解する

組織が生成AIの実験からミッションクリティカルなアプリケーション内のデプロイへと移行するにつれて、これらのシステムが本番環境で実際にどのように動作するかを理解するという、新たな課題が浮上しています。

生成AIはもはや単独で使用されることはありません。エージェントがAPI、データ・パイプライン、エンタープライズ・サービスと連携して実際のビジネス成果を推進するエージェント型ワークフロー内に組み込まれるケースが増えています。問題が発生すると、根本原因分析は従来のシステムとAI駆動型の意思決定層の両方にまたがり、はるかに複雑になります。

これらのシステムは動的で適応性があります。モデル、プロンプト、ワークフローは継続的に進化し、従来の監視アプローチでは対処できるように設計されていなかった、新たなレベルの運用の複雑さ、リスク、不確実性をもたらしています。だからこそ、オブザーバビリティーは進化し続ける必要があるのです。

生成AIの可視性からAIシステムの理解へ

2025年10月、IBM Instanaは生成AIオブザーバビリティーを導入し、AIアプリケーションの基盤となる可視性を提供しました。

チームはこれを使用して、生成AIのパフォーマンスを監視し、AIと従来のサービス全体でリクエストを追跡し、モデル全体のトークンとコストを追跡しています。

しかし、組織がエージェントベースのシステムを大規模にデプロイするにつれて、オブザーバビリティーの課題の性質は変化しています。チームは、個々のモデルの監視から、実際のビジネス・プロセスに組み込まれた動的で多段階のAIワークフローの管理へと移行します。この変化により、次の必要性を含む新しい要件が導入されます。

  • 動的なAIシステム全体で常に変化するエージェント、モデル、依存関係を自動的に検出して対応する
  • AIのアウトプットを大規模に継続的に評価し、品質、一貫性、ビジネス目的との整合性を確保する
  • AIの動作のベースラインを確立し、システムの進化に伴う性能、コスト、成果の逸脱を検知する
  • 複数ステップのワークフロー全体でエージェントがどのように意思決定を行うのか(何が起こったかだけでなく、なぜ起こったのか)を理解する

可視性は依然として不可欠です。しかし、AIシステムがより自律的で相互に接続されるようになるにつれて、組織はその基盤の上に構築し、理解と制御を深める必要があります。

IBM Instana AIエージェントとLLM Observabilityが提供するもの

1. AIシステムを自動的に検出・理解する

AIシステムは動的です。新しいエージェント、モデル、依存関係は常に進化しています。手動で追跡すると時間がかかり、エラーが発生しやすくなります。

AIエージェントとLLMオブザーバビリティーは、AIコンポーネントを継続的に識別し、アプリケーション全体での相互作用をマッピングする自動検出を導入します。これにより、エージェントとワークフロー、基盤となるLLM、サービスおよびインフラストラクチャー全体の依存関係のリアルタイムのエンドツーエンド・ビューが作成されるため、チームは手作業なしでAIが本番システムにどのように適合するかをすぐに理解できます。

2. AIの品質を評価する

AIの場合、成功は稼働時間だけではなく、アウトプットの質も重要です。組み込みの評価機能により、チームはモデルやエージェントが意図した目的に対してどのように機能するかを評価できるようになりました。LLM-as-a-judgeなどの手法を使用すると、チームは精度、関連性、一貫性、その他のユーザー定義の基準を測定できます。

評価は定期的に、またはモデルやプロンプトの更新後などの主要なマイルストーンで実行できるため、ドリフト、ハルシネーション、劣化を早期に検知するための構造化された方法が提供されます。これにより、手作業のスポット・チェックがスケーラブルな品質管理に置き換えられます。

3. ビジネスに影響が出る前に問題を検知する

AIの動作は時間の経過とともに変化するため、「正常」がどのようなものかを定義することが困難になります。適応型ベースラインにより、Instanaは性能、動作、コストにわたるパターンを学習し、意味のある逸脱を自動的に検知します。

レイテンシーの急増、コストの異常、予期しない動作など、チームは問題を早期に特定し、ユーザーに影響を与える前に対処できます。

4. システムだけでなく、意思決定を理解する

AIシステムでは、何が起こったかを知るだけでは十分ではありません。その理由を理解する必要があります。

AIエージェントとLLMオブザーバビリティーは、タスクレベルの可視性を導入し、エージェントがどのように推論し、意思決定を行うかを示します。チームはエンドツーエンドのワークフローを追跡し、LLM呼び出し、ツールのやり取り、成果につながった一連のアクションを確認できます。

これにより、複雑な問題を診断し、AI駆動型の意思決定に説明責任をもたらすことができます。

AIオペレーションの次の段階

AIがビジネス・プロセスに組み込まれるようになるにつれて、組織に必要なのはAIの監視だけではなく、自信、コントロール、説明責任も必要になります。

AIエージェントとLLMオブザーバビリティーにより、IBM Instanaはチームの次のことを支援します。

  • AIシステムをエンドツーエンドで理解する
  • 品質と性能を定期的に評価する
  • 問題が大きくなる前に検知する
  • AIの行動をビジネスの成果に結びつける

AIエージェントとLLMのオブザーバビリティーがパブリック・プレビューで利用可能になりました。

AIエージェントとLLMオブザーバビリティーの詳細をご覧ください

 

Stephen Hussey

Instana Group Product Manager

IBM