AIエージェント・フレームワーク：ビジネスに適した基盤の選択

共同執筆者

Staff Writer

IBM Think

Staff Editor, AI Models

IBM Think

金融機関の不正取引を監視してフラグを立てる単一の人工知能（AI）エージェントから、在庫レベルを追跡して需要を予測するサプライチェーン管理用のマルチエージェント・システムまで、エージェント型AIは企業にとって大きなメリットとなります。では、企業はどのようにしてAIエージェントを導入できるでしょうか。ここで役立つのがAIエージェント・フレームワークです。

IBMニュースレター

The DX Leaders

AI活用のグローバル・トレンドや日本の市場動向を踏まえたDX、生成AIの最新情報を毎月お届けします。登録の際はIBMプライバシー・ステートメントをご覧ください。

AIエージェント・フレームワーク：エージェント型AIの基盤構造

AIエージェントは、ユーザーに代わってタスクを自律的に実行できるプログラムです。これらのAIシステムは、まず複雑なタスクを達成するための一連の手順を含む計画を考案します。

次に、関数呼び出しを使用して、アプリケーション・プログラミング・インターフェース（API）、データ・ソース、Web検索、その他のAIエージェントなどの外部ツールに接続し、知識のギャップを埋めるのに役立ちます。

自律エージェントは行動計画を実行した後、フィードバックから学習し、学習した情報をメモリーに保存して将来のパフォーマンスを向上させます。

組織は、PythonやJavaScriptなどのプログラミング言語を使用して、AIエージェントをゼロから構築できます。ただし、より迅速でスケーラブルなアプローチには、AIエージェント・フレームワークの使用が含まれます。

エージェント・フレームワークは、AIエージェントを開発、デプロイ、管理するための構成要素です。これらのソフトウェア・プラットフォームには、次のようなプロセスの合理化と高速化に役立つ機能が組み込まれています。

エージェント型AIの構造、特性、機能の概要を示す定義済みのアーキテクチャー。

AIエージェントと人間のユーザーまたは他のエージェント間の対話を容易にする通信プロトコル。

タスクを調整するためのタスク管理システム。

関数呼び出しのための統合ツール。

エージェント型AIのパフォーマンスを追跡するための監視ツール。

AIエージェント・フレームワークを選択する際に考慮すべき事柄

AIエージェントを導入する前に、組織の目標とユースケースについて考えてください。理想的なフレームワークは、技術的な能力、短期的な要件、長期的な目標の間でバランスをとります。

AIエージェント・フレームワークを選択する際に考慮すべきいくつかの側面を次に示します。

複雑さ

データのプライバシーとセキュリティ

操作性

シームレスな統合

効率とスケーラビリティー

複雑さ

AIエージェントに実行させたいタスクと、それらのタスクの複雑さを特定します。単一エージェントのみを使用したシンプルなシステムにするか、マルチエージェント・エコシステムが必要かを判断します。

マルチエージェント環境の場合、エージェントによる対応と、人間の介入が依然として必要な箇所をマッピングします。

例えば、カスタマー・サポートの分野では、単一のAIエージェントが、発生した問題の重大度を分類するのに役立ちます。ただし、より堅牢なワークフローを目指す場合は、問題のトラブルシューティング、修正の提案、複雑なケースを他のAIエージェントまたは人間のエージェントに割り当てるために、さまざまなエージェントを含むマルチエージェント・システムを構築することを検討してください。

データ・プライバシーとセキュリティー

エージェント・フレームワークを選択するときは、データのプライバシーとセキュリティーを最優先に考慮する必要があります。保存中および転送中のデータの暗号化、アクセス制御、機密情報の削除など、選択したフレームワークのセキュリティー・ポリシーと対策を確認します。

操作性

開発チームのスキル・レベルを考慮してください。例えば、CrewAIなどの初心者向けのAIフレームワークには、迅速なプロトタイピングのためのコード不要のインターフェースと、迅速なデプロイメントのための既製のAIエージェント・テンプレートが備わっています。

より経験豊富なAI開発者は、管理の手間が少なく、カスタマイズ可能なコード・オプションを提供するLangGraphなどの高度なエージェント・フレームワークを選択する場合があります。

シームレスな統合

既存のテクノロジー・スタックとの互換性に基づいて、エージェント型AIフレームワークを評価します。選択したフレームワークが現在のデータ・ソース、インフラストラクチャー、ツールとどの程度統合されるかを確認します。

エージェント型AIをオンプレミスまたはクラウドの環境にどのようにデプロイするか、また小規模または大規模なデプロイメントが必要かどうかを判断します。

性能と拡張性

選択したAIエージェント・フレームワークのパフォーマンスを評価します。リアルタイム・アプリケーションの応答時間や待ち時間を考慮し、膨大な量のデータや複数の同時リクエストを処理するときにパフォーマンスが低下するかどうかを評価します。短期的な視野に立ち計画しているかもしれませんが、ビジネスの成長に合わせてフレームワークがどのように拡張するかについても考慮しましょう。

AIエージェント

AIエージェントの5つのタイプ：自律機能と実世界アプリケーション

目標主導型でユーティリティーベースのAIがワークフローや複雑な環境にどのように適応するかをご覧ください。

AIエージェントを構築、展開、監視

人気のAIエージェント・フレームワーク

エージェント型AIはまだ初期段階です。AIエージェントの背後にあるテクノロジーが進化するにつれて、その基盤となるフレームワークも進化します。現在人気のあるAIエージェント・フレームワークをいくつか紹介します。

AutoGen

AutoGenは、複雑なタスクを実行するマルチエージェント型AIアプリケーションを作成するためのMicrosoft社のオープンソース・フレームワークです。このアーキテクチャーは3層で構成されています。

Coreは、エージェント・ワークフローのトレースとデバッグを行うツールを備えた、スケーラブルで分散されたエージェント・ネットワークを開発するためのプログラミング・フレームワークです。非同期メッセージングを採用し、リクエスト対応とイベント駆動型のエージェント対話の両方をサポートします。

AgentChatはCore上に構築されており、対話型のAIアシスタントを作成するために使用できます。これは初心者向けの出発点として提案されており、事前定義された動作とインタラクション・パターンを備えたデフォルトの単一エージェントとマルチエージェント・チームを提供します。

Extensionsは、CoreおよびAgentChatコンポーネントの実装を含むパッケージで、それらの機能をさらに拡張し、外部ライブラリーやその他のサービスと連携します。組み込みの拡張機能やAutoGenコミュニティーによって開発された拡張機能を使用することも、独自の拡張機能を作成することもできます。

AutoGenは、エージェント型AIのパフォーマンスを評価およびベンチマークするためのAutoGen Benchと、エージェントを開発するためのノーコードののインターフェースを提供するAutoGen Studioという2つの便利な開発者ツールを提供しています。AutoGenはGitHubからアクセスできます。

CrewAI

CrewAIは、マルチエージェント型AIソリューション用のオーケストレーション・フレームワークです。AutoGen同様、CrewAIはオープンソースです。

CrewAIのロールベースのアーキテクチャーは、エージェント型AIを「労働者」の「クルー」として扱います。クルーの中核となる構成要素は次のとおりです。

エージェントには、複雑なワークフローで共同作業しながらも専門的な役割が割り当てられます。開発者は自然言語を使用して、エージェントの役割、目標、背景を概説できます。

タスクは各エージェントの特定の責任を定義します。開発者は自然言語を使用して、各エージェントのタスクと予想される出力を記述することもできます。

プロセスは、エージェントがどのように連携し、タスクがどのように実行されるかを識別します。タスクは事前に設定された順序に従って完了する順次型にすることも、カスタム・マネージャー・エージェントがタスクの委任、実行、完了を監視する階層型にすることもできます。

CrewAIの例集の1つに、株式市場分析チームが含まれています。このチームは、特定の株式のデータを分析する役割を担う市場アナリスト・エージェント、データ分析を検証する裏付け情報を収集する役割を担う研究者エージェント、分析と裏付けデータに基づいて段階的な行動計画を作成する役割を担う戦略エージェントというように、順番に連携します。

CrewAIは、AnthropicのClaude、GoogleのGemini、MistralのAIモデル、OpenAIのGPTモデル、IBM® watsonx.aiの基盤モデルなど、さまざまな大規模言語モデル（LLM）への接続をサポートしています。

このフレームワークには、さまざまなデータ・ソースを検索するための一連の検索拡張生成（RAG）ツールも含まれています。

CrewAIはGitHubからアクセスできます。

LangChain

LangChainは、ChatGPT やAIエージェントなどのチャットボットを含む、LLMを利用したアプリケーションを構築するためのもう1つのオープンソース・フレームワークです。

モジュール式アーキテクチャーを採用しており、各モジュールはLLMの操作に必要な複雑な概念と手順をカプセル化する抽象化を表しています。

これらのモジュール・コンポーネントを連結してAIアプリケーションを作成できます。

LangChainは、簡単なワークフローを備えたシンプルなAIエージェントを開発するのに役立ちます。ベクター・データベースと、アプリケーションにメモリーを組み込むユーティリティーをサポートし、結果として履歴とコンテキストを保持します。

LangSmithプラットフォームでは、デバッグ、テスト、パフォーマンス監視が可能です。

LangChainはGitHubからアクセスできます。

LangGraph

LangGraphは、LangChainエコシステム内に存在します。このフレームワークは、マルチエージェント・システムの複雑なワークフローのオーケストレーションに優れています。

これはグラフ・アーキテクチャーを適用し、AIエージェントの特定のタスクまたはアクションがノードとして表され、それらのアクション間の移行がエッジとして表されます。

状態コンポーネントは、すべてのインタラクションにわたってタスク・リストを維持します。このタイプのアーキテクチャーは、循環的、条件付き、または非線形のワークフローに適しています。

例えば、航空会社は、ユーザーがフライトを検索して予約するのを支援する旅行アシスタントAIエージェントを構築したいかもしれません。LangGraphを使用すると、これらの各アクションはノードとして表され、それらのノードには特定のタスクを実行する複数のエージェントを含めることができます。

人間が介入するステップを追加することで、ユーザーは検索リストからフライトを選択でき、好みに合うものがない場合、旅行アシスタント・エージェントは簡単に「フライトの検索」ノードに戻って検索をやり直すことができます。

LangGraphは、GitHubからアクセスできます。

LlamaIndex

LlamaIndexは、生成AIおよびエージェント型AIソリューションを構築するためのオープンソースのデータ・オーケストレーション・フレームワークです。パッケージ化されたエージェントとツールを提供し、最近導入されたワークフロー、つまりマルチエージェント・システムを開発するためのメカニズムも提供します。

LlamaIndexのワークフローを構成する主な要素は次のとおりです。