AIエージェント開発とは

執筆者

Rina Diane Caballar

Staff Writer

IBM Think

Cole Stryker

Staff Editor, AI Models

IBM Think

AIエージェント開発とは

AIエージェント開発は、 AIエージェントを作成するプロセスです。これには、エージェント型AIの設計、構築、トレーニング、テスト、デプロイが含まれます。

企業はAIエージェントをゼロから構築することを選択できます。この場合はエージェントのアーキテクチャと機能を完全に制御できます。また、ユースケースやビジネス・ニーズに合わせてエージェント・システムをカスタマイズしたり、特定のタスク向けにエージェント型AI をカスタマイズしたりすることもできます。一方、AI エージェントをゼロから構築するには、人工知能、機械学習、ソフトウェア開発に関する高度な専門知識が必要です。さらに、費用がかかる場合もあります。

特に初心者にとって、より迅速でスケーラブルなアプローチとしては、 AI エージェント・フレームワークの使用が挙げられます。これらのソフトウェア・プラットフォームには、AI搭載エージェントの基盤構造として、事前定義されたアーキテクチャーとテンプレート、タスク管理システム、統合および監視ツールなど、エージェント開発プロセスの合理化に役立つ機能が組み込まれています。

IBMニュースレター

The DX Leaders

AI活用のグローバル・トレンドや日本の市場動向を踏まえたDX、生成AIの最新情報を毎月お届けします。登録の際はIBMプライバシー・ステートメントをご覧ください。

AIエージェント開発プロセスの手順ガイド

AI エージェントの実装は、通常、次の一連の手順で構成されます。

目標設定と範囲設定
デザイン
フレームワーク、モデル、ツールの選択
構築
トレーニング
評価版
デプロイメントと監視

目標設定と範囲設定

最初のステップは、AIエージェントの明確な目標と定義された範囲の概要を説明することです。ここでは次のような質問が役立ちます。

エージェントはどのような問題を解決しますか？
どのようなタスクを達成する必要がありますか？
AIエージェントにはどのようなデータやインプットが必要ですか？
どのような決定を下す必要がありますか？
意思決定は自律的に行われるのでしょうか、それとも人間が介入するアプローチが必要でしょうか？
ユーザーは誰で、このAIシステムをどのように使用しますか？

これらの質問への答えは、設計ステップを方向付けるのに役立ちます。

デザイン

エージェントの青写真は、設計段階で作成されます。この青写真には、アーキテクチャ、ワークフロー、統合、エクスペリエンスが含まれます。

カスタマー・サポート・エージェントが注文をリアルタイムで追跡し、顧客にステータスの更新を提供するなどの単純な機能の場合は、単独エージェントのアーキテクチャーで十分な場合があります。しかし、複雑なタスクの場合は、マルチエージェント・システムの方が適している可能性があります。たとえばヘルスケアの分野では、化合物のライブラリを探索して医学研究を要約する個別のエージェントと、新しい分子設計を生成する別の生成 AIエージェントを使用したマルチエージェント・システムで、創薬の複雑なワークフローを自動化できます。

このアーキテクチャは、適切なタイプのAIエージェントとそのコンポーネントを決定するのに役立ちます。また、エッジケースやエラーシナリオを含むエージェントワークフローのマッピングにも役立ちます。マルチエージェント・エコシステムでは、通信プロトコル、オーケストレーション、コラボレーションのストラテジーを考慮する必要があります。

エージェントがユーザーと直接対話する場合、企業は OpenAI のChatGPTのようなチャットボットに似たAIアシスタントインターフェースを選択できます。また、他のプラットフォームとの統合計画も必要となり、リアルタイムの情報処理と動的な意思決定のために、アプリケーション・プログラミング・インターフェース（API）、外部プラグイン、顧客データ、その他のデータ・ソースにアクセスするためのツール呼び出しを検討する必要があります。

フレームワーク、モデル、ツールの選択

設計が決まったら、次の段階は適切なフレームワーク、 AIモデル、その他の関連するAIツールやライブラリを選択することです。

組織は、PythonやJavaScriptなどのプログラミング言語を使用して独自にエージェントを構築できます。エージェント・フレームワークを採用している場合、一般的な選択肢としては、 BeeAI 、 CrewAI 、 LangChain 、 LangGraphなどのオープンソース・フレームワークや、 MicrosoftのAutoGenやSemantic Kernelソフトウェア開発キット（ SDK）などがあります。

モデルの選択は、機械学習アルゴリズムまたは大規模言語モデル（LLM）を AI エージェントの機能やタスクに適合させるために重要です。企業は、AIエージェントをさらに強化するために、検索拡張生成（RAG）システムなどの専用ツールや、PyTorch、scikit-learn、TensorFlowなどのライブラリも検討することができます。

Build

開発フェーズでは、エージェントの開発を行います。過負荷を回避するために、企業はモジュール式アプローチを採用し、各コンポーネントを個別に作成する前に、すべてを統合してAIエージェントに設計することができます。このモジュール式ストラテジーにより、各部分への変更がエージェント・システム全体に最小限に抑えられるため、保守が容易になります。

AIエージェント自体の構築に加え、組織はエージェント型AIを開発する際に、次の要素も考慮する必要があります。

効率： AIエージェントは、データを迅速に処理し、意思決定を行い、アクションを実行し、応答を生成する必要があります。
拡張性： エージェントは、性能を低下させることなく、増大する量を処理できる十分な堅牢性を備えている必要があります。
セキュリティ：アクセス制御、認証、暗号化などの安全ガードレールを組み込むことで、敵対的な攻撃や不正なアクセスとインタラクションを防ぐことができます。

学習

モデル・トレーニングでは、AIモデルがエージェントの機能とアクションに関連するサンプル・タスクのトレーニング・データセットからの学習を行います。これは、データセットの準備、このデータでのモデルの実行、性能の測定、将来の予測の改善のためのモデルのパラメーターの調整を含む反復的なプロセスです。

機械学習モデルをゼロからトレーニングすることは、時間と費用がかかり、大量のリソースを必要とする可能性があります。代わりに事前トレーニング済みのモデルを使用し、AI エージェントのタスクのための独自のデータセットで微調整することが好ましい場合もあります。

評価

AIエージェントの評価は、エージェント型AI が目標を達成し、期待どおりに動作することを確認するために、エージェント型AIをテストおよび検証するプロセスです。トレーニング・データセットとは異なり、考えられるすべてのテストケースをカバーし、現実世界のシナリオを反映できる十分な多様なテストまたは検証データセットが必要です。

サンドボックスまたはシミュレートされた環境でテストを実施することで、性能の改善を早期に特定し、実際のユーザーにエージェントをデプロイする前に、セキュリティ上の問題や倫理的リスクを特定することができます。

LLMのベンチマークと同様に、AIエージェントにも一連の評価用メトリクスがあります。一般的なものには、成功率やタスク完了率、エラー率、レイテンシーなどのメトリクスや、バイアスや公平性スコア、プロンプトインジェクション脆弱性などの倫理メトリクスが含まれます。ユーザーと対話するエージェントやチャットボットは、会話の流れ、エンゲージメント率、ユーザー満足度スコアに基づいて評価されます。

メトリクスを測定し、成果を分析した後、エージェント開発チームは、アルゴリズムのデバッグ、エージェント・アーキテクチャの変更、ロジックの改良、性能の最適化に進むことができます。

デプロイメントと監視

最終フェーズでは、顧客がAIエージェントと対話して使用できる実際の運用環境にエージェントシステムをデプロイします。また、継続的な監視も含まれます。これは、エージェントの性能を追跡および強化し、新しい状況や課題に適応するために不可欠です。

Amazon Bedrock AgentCoreやIBM ® watsonx.aiなどのプラットフォームはエージェントのデプロイメントと監視の自動化に役立ちます。watsonx.aiを使用すると、たとえば、開発者は、ワンクリックのデプロイメントとトレース機能を利用して、オブザーバビリティーを実現できます。

AIエージェント