エージェントのデバッグ

プレビュー版のチャットにあるデバッグモードを使用すると、エージェントがどのように思考し、情報を処理し、応答を生成しているかを理解するのに役立ちます。 出力結果がなぜそのようになっているのかを推測する代わりに、デバッガーはエージェントの内部実行状況を、段階を追って明確に可視化します。 新しい動作の検証であれ、予期せぬ結果のトラブルシューティングであれ、デバッガーを使えば、迅速かつ的確な問題解決が可能です。 このデバッガーを使えば、エージェントの動作を最適化し、信頼性が高く質の高い体験を構築するために必要な明確さと制御力を得ることができます。

デバッガーを使用すると、次のことができます:

  • エージェントがユーザー入力をどのように解釈しているかを理解する

  • 情報がツール、記憶、そして協力者を通じてどのように伝播していくかを見てみましょう

  • 特定の回答の根拠を特定する

  • 設定やロジックに関する問題を迅速に特定し、解決する

デバッガーの使い方

エージェントのデバッグを開始するには:

  1. プレビューチャット 」ウィンドウでメニューを開き、 「デバッグを有効にする」 を選択します。

  2. 会話を実行した後、チャット結果の下にある 「デバッグ」 をクリックして、エージェントのデバッグページを開きます。

デバッグインターフェースは、主に2つの構成要素から成っています:

コンポーネント

説明

エージェント構造

エージェントの構成と各部分の関連性を示した図

実施スケジュール

リクエストからレスポンスに至るまでのエージェントの推論プロセスを段階的に示す

エージェント構造

エージェントの構造は、エージェントがどのように構成されているか、またその各部分がどのように関連しているかを理解するのに役立つ視覚的なマップを提供します。 こちらには以下の内容が含まれます:

  • エージェントが利用できるツール

  • エージェントが利用可能な協力者

  • コンポーネント間の接続と関係

実施スケジュール

このタイムラインには、ユーザーからの最初のリクエストから生成されたレスポンスに至るまで、エージェントの推論の各段階が表示されています。 このビューでは、以下の操作が可能です:

  • 実行の流れを段階を追って確認する

  • 特定のステップに直接移動する

実行タイムラインの上部にあるナビゲーションコントロールを使用して、実行タイムラインを前後に移動します。

コントロール

アクション

使用済みのノードを強調表示する

クリックして、実行に含まれていたノードをハイライト表示します。

使用されていないノードを非表示にする

クリックすると、推論に関与するノードのみに焦点を当てることができます。

凡例

各ノードタイプの意味と機能の詳細については、ここをクリックしてください

各ステップには、次のような補足情報が含まれています:

情報のタイプ

詳細

変数 (Variables)

概要、入力、出力、ノードログ

ノードのメタデータ

概要、協力者、ツール、ガイドライン、LLMモデル

変数

変数は、実行中にワークフローを流れるデータを格納し、表示します。 これらは、ノード間でどのような情報がやり取りされ、それがどのように変換されるのかを理解するのに役立ちます。

変数の型

説明

サマリー

ワークフローでこれまでに生成されたすべての変数の概要。 各ノードを詳しく調べなくても、ワークフローの状態を素早く把握するのに役立ちます。

入力

ノードに入力されるデータ。 以前のノードからの出力、ユーザーによる静的な入力、またはシステムによって生成されたコンテキストを含めることができます。

出力

ノードが実行後に生成したデータ。 処理対象は、テキスト、APIの応答、構造化されたオブジェクト、または変換された変数です。

ノードのログ

デバッグおよびレビュー用の実行ログ。 生の入力データや出力データ、実行の成功または失敗の状態、実行時のエラー、およびパフォーマンスデータが含まれる場合があります。

ノードのメタデータ

ノードのメタデータには、各ノードに関する説明情報や設定関連情報が含まれています。

メタデータフィールド

説明

製品情報

そのノードの役割、機能、およびワークフローにおける位置づけを説明する簡単な概要。

ツール

そのノードが使用するAPI、コネクタ、モデル、プラグインなどの外部ツールや連携機能を一覧表示します。

ガイドライン

プロンプトのガイドライン、書式ルール、行動上の制約など、論理の一貫性や出力の品質を維持するのに役立つ、ノード固有の指示やルール。

LLMモデル

このノードでどの言語モデルが使用されているかを示します。トレーサビリティの確保や、パフォーマンス、コスト、機能の理解に役立ちます。

ナビゲーションとノードの確認

実行タイムラインの上部にあるナビゲーションコントロールを使用して、実行タイムラインを前後に移動します。

  • 実行に使用されたノードを強調表示するには、 「使用されたノードを強調表示」 をクリックします。

  • 推論に関与するノードのみに絞り込むには、 「未使用のノードを非表示」 をクリックしてください。

  • 各ノードタイプの意味や機能の詳細を確認するには、 「凡例」 をクリックしてください。

デバッグのワークフロー

ワークフローのデバッグとは、その実行状況を体系的に調査し、ロジック、パフォーマンス、または出力に影響を与える問題を特定、把握、解決することです。

入力内容を確認してください

デバッガーは、エージェントがユーザーのメッセージから正確に何を理解したかを記録するため、適切なシナリオがテストされていることを確認するのに役立ちます。

実行パスをたどる

実行を進めていくにつれて:

  • エージェントマップ上の該当するノードが強調表示されます。

  • メモリがリクエストにどのような影響を与えたかを確認できます。

  • エージェントがどのように推論を構築したのかが把握できるようになります。

協力者の行動を点検する

担当者が業務を協力者に引き継ぐ場合、以下の点を確認できます:

  • そのリクエストをどのように解釈したか

  • そのツールやガイドラインが、その行動にどのような影響を与えたか

  • 他のコンポーネントに追加のタスクを委任したかどうか

ツールの動作を確認する

デバッガーには、実際に使用されたツールが表示されます。 これは以下に役立ちます。

  • 期待通りのツールが実行されたことを確認してください

  • 本来は起動されるはずだったにもかかわらず起動されなかったツールを特定する

  • 設定の問題によって引き起こされる予期しない論理パスを検出する

根本原因を特定する

メタデータ、指示、および実行の詳細を確認することで、次のような問題を発見することができます:

  • 協力者への指示に誤りがあります

  • 工具のトリガー位置がずれている

  • 意図した動作を反映していない論理パス

問題が特定できたら、設定を更新してすぐに再テストを行うことができます。