生成AIの可観測性

既存のアプリケーションやサービスと連動したコンテキストで、LLM、AIエージェント、ベクトルデータベースを包括的に監視し、生成AIアプリケーションのトラブルシューティングを実施します。

生成AIの可観測性が重要な理由

本番環境向けの生成AIアプリケーションを構築する際には、特有の課題が生じる。 AIアプリケーションには、以下の目的で専門的な監視が必要です:

  • コスト管理:複数のLLMプロバイダーにおけるトークン使用量と API のコストをリアルタイムで追跡
  • パフォーマンスを確保:AIスタックの各レイヤーにおけるレイテンシ、スループット、応答品質を監視する
  • 複雑なワークフローのデバッグ:複数ステップのエージェントワークフロー、RAGパイプライン、およびツール呼び出しを通じたリクエストの追跡
  • 信頼性を維持する:エラー、レート制限、品質低下をユーザーに影響を与える前に検出する

監視可能な項目

Instana 統合された可観測性とリアルタイムコスト追跡から、エージェント型ワークフローのトレース、AIテクノロジースタック全体にわたるゴールデンシグナルのインテリジェントなアラートまで、幅広い機能を提供します。

LLMプロバイダー

主要なAIプロバイダーとの連携を監視: IBMwatsonx.aiOpenAI, Amazon BedrockAnthropic Claude Google GeminiGroq DeepSeek, その他多数 API の呼び出しをすべて追跡し、レイテンシ、トークン消費量、コストに関する詳細なメトリクスを取得します。

AIエージェントフレームワーク

LangChain, で構築された複雑なエージェントワークフローの可視性を獲得 LangGraph,CrewAI,OpenAI エージェント、Langflow、および Google ADK エージェントが意思決定を行い、ツールを活用し、多段階タスクを調整する方法を理解する。

ベクトルデータベース

RAG(検索強化生成)アプリケーションを支えるベクターデータベース操作、埋め込み生成、類似性検索を監視します。

インフラストラクチャとホスティング

GPU使用率、 vLLM のパフォーマンス、およびコンテナ化されたAIワークロードを追跡し、リソースの割り当てとスケーリングを最適化します。

参照

  • はじめに :アプリケーション向けの生成AI可観測性を設定する
  • 特徴 :製品の能力と機能性
  • サポート対象技術 :サポートされているすべてのAIフレームワーク、モデルプロバイダー、インフラストラクチャを表示