AIエージェント・プランニングとは

共同執筆者

Staff Editor, AI Models

IBM Think

AIエージェント・プランニングとは

AIエージェント・プランニングとは、人工知能（AI）エージェントが特定の目標を達成するために、一連のアクションを決定するプロセスを指します。このプロセスには、意思決定、目標の優先順位付け、アクション・シーケンスが含まれ、さまざまなプランニング・アルゴリズムやフレームワークが用いられることが一般的です。

AIエージェント・プランニングは、多くのタイプのエージェントに共通するモジュールであり、認識、推論、意思決定、アクション、記憶、コミュニケーション、学習といった他のモジュールと並んで存在します。プランニングはこれらのモジュールと連携して機能し、エージェントが設計者の意図する成果を達成できるよう支援します。

すべてのエージェントがプランニングできるわけではありません。インプットに即座に反応する単純な事後対応型エージェントとは異なり、プランニング・エージェントは将来の状態を予測し、実行前に構造化されたアクション・プランを立てます。そのため、AIプランニングは、複数のステップにわたる意思決定や最適化、適応性が求められる自動化タスクにおいて不可欠な要素となっています。

IBMニュースレター

The DX Leaders

AI活用のグローバル・トレンドや日本の市場動向を踏まえたDX、生成AIの最新情報を毎月お届けします。登録の際はIBMプライバシー・ステートメントをご覧ください。

AIエージェント・プランニングの仕組み

大規模言語モデル（LLM）、たとえばOpenAIのGPTや、機械学習アルゴリズムを用いた関連技術の進展により、近年の生成AIブームが生まれました。そしてさらに、この進化が、自律型エージェントという新たな分野の出現につながっています。

ツール、API、ハードウェア・インターフェース、その他の外部リソースを統合することで、エージェント型AIシステムはますます自律性を高めており、リアルタイムでの意思決定や、さまざまなユースケースにおける問題解決に優れた能力を発揮しています。

複雑なエージェントは、意思決定を行わずに行動することはできず、良い意思決定を行うには、まず計画を立てる必要があります。エージェント型プランニングは、最適な意思決定を促すために連携して機能する複数の主要な構成要素で構成されています。

目標の定義

AIプランニングにおける最初で最も重要なステップは、明確な目標を定義することです。目標は、エージェントの意思決定プロセスを導く原則として機能し、エージェントが達成を目指す最終的な状態を決定づけます。目標は、プランニングの過程で変化しない静的なものである場合もあれば、環境の変化やユーザーとのやり取りに応じて変化する動的なものである場合もあります。

たとえば、自動運転車は安全規則を守りながら、目的地に効率的に到達するという目標を持っているかもしれません。明確に定義された目標がなければ、エージェントは方向性を欠き、不安定または非効率な行動を取ることになります。

目標が複雑な場合、エージェント型のAIモデルは、それをより扱いやすい小さなサブ目標に分解するタスク分解と呼ばれるプロセスを行います。これにより、システムは複雑なタスクに対して階層的に取り組むことが可能になります。

LLMは、タスク分解において重要な役割を果たします。高レベルの目標をより小さなサブタスクに分解し、それらのサブタスクをさまざまなステップを通じて実行していきます。たとえば、ユーザーが自然言語のプロンプトを使って、チャットボットに旅行の計画を依頼する、といったケースが挙げられます。

エージェントはまず、フライトの予約、ホテルの検索、旅程の作成といった構成要素にタスクを分解します。タスクを分解した後は、アプリケーション・プログラミング・インターフェース（API）を活用して、リアルタイムのデータを取得したり、料金体系を確認したり、さらには目的地を提案したりすることも可能になります。

状態表現

効果的に計画を立てるため、エージェントは環境を構造化して理解する必要があります。この理解は、意思決定に影響を与える現在の条件、制約、および文脈要因をモデル化する状態表現を通じて実現されます。

エージェントは、トレーニング・データや過去のやり取りを表すデータセットから得たあらかじめ組み込まれた知識を持っていますが、環境をリアルタイムで把握するためには認識が必要です。エージェントは、感覚インプットを通じてデータを収集し、ユーザー・インプットや自身の内部状態を示すデータとともに、環境をモデル化します。

状態表現の複雑さは、タスクの内容によって異なります。たとえば、チェスのゲームでは、状態には盤上のすべての駒の位置が含まれます。一方、ロボットのナビゲーション・システムでは、状態には空間座標や障害物、地形の状況などが含まれる場合があります。

状態表現の正確さは、エージェントが情報に基づいた意思決定を行う能力に直接影響します。それは、エージェントが自身のアクションの結果をどれだけ正確に予測できるかによって決まります。

アクション・シーケンス

エージェントが目標を設定し、環境を評価した後は、現在の状態から目標とする状態へ移行するための一連のアクションを決定する必要があります。このプロセスはアクション・シーケンスと呼ばれ、エージェントが従うべき論理的かつ効率的なステップの構築を伴います。

エージェントは、実行可能なアクションを特定し、その中から最適なアクションに絞り込み、優先順位を付ける必要があります。また、アクション間の依存関係や、環境の変化に応じた条件付きのステップも特定する必要があります。さらに、シーケンス内の各ステップにリソースを割り当てたり、環境上の制約に基づいてアクションをスケジューリングしたりする場合もあります。

たとえば、ロボット掃除機は部屋を効率的に掃除するために、すべての必要な箇所を無駄なくカバーする最適な経路を決定する必要があります。アクションのシーケンスが適切に計画されていない場合、AIエージェントは非効率的または重複したステップを踏んでしまい、リソースの無駄や実行時間の増加を招く可能性があります。

ReActフレームワークは、AIで動的な意思決定を処理するために使用される方法論です。ReActフレームワークにおいて、推論とは、エージェントが特定の目標を達成するために必要なアクションや戦略を判断する認知的プロセスを指します。

このフェーズは、エージェント型AIにおけるプランニング・フェーズに類似しており、エージェントが問題を解決したりタスクを遂行したりするための一連のステップを生成するプロセスです。ReWOO、RAISE、Reflexionなどの新たに登場したフレームワークもあり、それぞれに独自の強みと弱みがあります。

最適化と評価

AIプランニングでは、特に複数の選択肢が存在する場合に、目標達成までの最適な経路を選択することがよく求められます。最適化は、状況に応じて、エージェントが選択するアクションのシーケンスが最も効率的で、コスト効果が高く、あるいは他の面で有利であることを保証するための手段です。このプロセスでは、時間、リソースの消費、リスク、潜在的な利益といったさまざまな要因を評価する必要があります。

たとえば、倉庫内で物品のピッキングを任されたロボットは、衝突を回避しつつ、作業時間を短縮するために、最短かつ最も安全なルートを決定する必要があります。最適化が適切に行われていない場合、AIエージェントは一応機能するものの、最適とは言えないプランを実行してしまい、非効率につながる可能性があります。意思決定を最適化するために、以下の方法が使用されます。

ヒューリスティック検索

ヒューリスティック検索アルゴリズムは、目標に向かう最適な経路を推定することで、エージェントが最適な解を見つけるのを支援します。これらのアルゴリズムは、ある状態が目標にどれだけ近いかを数学的に推定するヒューリスティック関数に基づいて動作します。ヒューリスティック検索は、エージェントが迅速に最適な経路を見つける必要がある構造化された環境において、特に有効です。

強化学習

強化学習は、試行錯誤を通じて、どのアクション・シーケンスが最良の結果につながるかを学習することで、エージェントがプランニングを最適化できるようにする手法です。エージェントは環境と相互作用し、報酬やペナルティという形でフィードバックを受け取り、それに応じて戦略を洗練させていきます。

確率的プランニング

現実のシナリオでは、AIエージェントはしばしば結果が決定論的ではない、不確実な環境で動作します。確率的プランニング手法は、このような不確実性を考慮し、複数の可能な結果を評価しながら、期待効用が最も高いアクションを選択します。

コラボレーション

単一エージェントのプランニングとは別に、マルチエージェント・システムにおいては、AIエージェントがそれぞれ自律的に動作しながら、互いに連携して個別または共同の目標を達成しなければなりません。

マルチエージェント・システムにおけるAIエージェントのプランニングは、単一エージェントの場合よりも複雑です。なぜなら、各エージェントは自身のアクションを計画するだけでなく、他のエージェントのアクションや、それぞれの意思決定がどのように相互に影響し合うかも考慮しなければならないからです。

エージェント・アーキテクチャーによって異なりますが、システム内の各エージェントは通常、それぞれに固有の目標を持っており、それは特定のタスクの達成や報酬関数の最大化などを含む場合があります。多くのマルチエージェント・システムにおいては、エージェント同士が協力して共有の目標を達成する必要があります。

これらの目標は、システム全体によって定義される場合もあれば、エージェント同士の相互作用から自然に生じる場合もあります。特に協調が求められるシナリオにおいては、エージェントは目標を共有・調整するためのメカニズムを備えている必要があります。これには、明示的なメッセージのやり取り、共有されたタスク定義、あるいは暗黙的な協調などが含まれます。

マルチエージェント・システムにおけるプランニングは集中型で行うことも可能であり、その場合、1つのエンティティやコントローラー（多くの場合、LLMエージェント）がシステム全体のプランを生成します。

各エージェントは、この中央の管理主体から指示やプランを受け取ります。一方で、分散型のアプローチもあり、その場合、エージェントは自らプランを生成しつつ、互いに協調して全体の目標に貢献するように調整します。このプロセスでは、コミュニケーションや交渉が必要となることが一般的です。

この協調的な意思決定プロセスは、効率を高め、タスク実行におけるバイアスを低減し、ハルシネーション（幻覚）を相互検証や合意形成によって回避するのに役立ちます。また、エージェントが共通の目標に向かって協力することを促します。

AIエージェント

AIエージェントの5つのタイプ：自律機能と実世界アプリケーション

目標主導型でユーティリティーベースのAIがワークフローや複雑な環境にどのように適応するかをご覧ください。

AIエージェントを構築、展開、監視

プランニングの後

エージェント型のAIワークフローにおける各フェーズは、必ずしも厳密に段階的かつ直線的に進行するとは限りません。概念上はそれぞれのフェーズが区別されていても、実際にはタスクの性質やエージェントが動作する環境の複雑さに応じて、フェーズが入り混じったり、反復的に進行することがよくあります。

AIソリューションはその設計によって異なる場合がありますが、一般的なエージェント型ワークフローにおいては、プランニングの次のフェーズはアクション実行であり、ここでエージェントはプランで定義されたアクションを実際に実行します。このフェーズでは、タスクの遂行に加えて、検索拡張生成（RAG）、ツールの使用、関数呼び出し（ツール呼び出し）といった外部システムやナレッジ・ベースとのやり取りも含まれます。

これらの機能を備えた AIエージェントの構築には、LangChainの活用が含まれる場合があります。Pythonスクリプト、JSONデータ構造、その他のプログラム的なツールは、AIの意思決定能力を強化します。

プランを実行した後、一部のエージェントはメモリーを活用して経験から学習し、それに応じて自らの行動を反復・改善することができます。

動的な環境においては、プランニング・プロセスも適応的である必要があります。エージェントは常に、環境や他のエージェントのアクションに関するフィードバックを受け取り、それに応じて自らのプランを調整しなければなりません。これには、目標の見直し、アクション・シーケンスの調整、新たなエージェントの参加や離脱への対応などが含まれる場合があります。

エージェントが、現在のプランがもはや実行不可能であることを検知した場合（たとえば、他のエージェントとの衝突や環境の変化による場合など）、戦略を調整するために再プランニングを行うことがあります。エージェントは、アクションを起こす前に目標達成に必要なステップを内省するプロセスである思考の連鎖による推論を活用して、戦略を調整することができます。

2025年の戦略的テクノロジーの上位トレンド：エージェント型AI

Gartner社の調査をダウンロードして、ITリーダーにとってのエージェント型AIの機会とリスクを探り、AIイノベーションの次の波に備える方法を学びましょう。