エージェント型AIとは

共同執筆者

Cole Stryker

Staff Editor, AI Models

IBM Think

エージェント型AIとは

エージェント型AIは、限られた監視の下で特定の目標を達成できる人工知能システムです。これは、人間の意思決定を模倣して問題をリアルタイムで解決する機械学習モデルであるAIエージェントで構成されています。マルチエージェント・システムでは、各エージェントが目標を達成するために必要な特定のサブタスクを実行し、その取り組みはAIオーケストレーションを通じて調整されます。

事前に定義された制約内で動作し、人間の介入を必要とする従来のAIモデルとは異なり、エージェント型AIは自律性、目標主導の動作、適応性を備えています。「エージェント型」という用語は、これらのモデルの主体性、つまり独立して意図的に行動する能力を指します。

エージェント型AIは、生成AI技術を基盤とし、大規模言語モデル(LLM)を使用して動的な環境で機能します。生成モデルは学習したパターンに基づいてコンテンツを作成することに重点を置いていますが、エージェント型AIは生成のアウトプットを特定の目標に適用することでこの機能を拡張しています。OpenAI社のChatGPTのような生成AIモデルはテキスト、画像、コードを生成しますが、エージェント型AIシステムは生成されたコンテンツを使用して、外部ツールを呼び出すことで複雑なタスクを自律的に完了できます。たとえば、エージェントはユーザーの仕事のスケジュールを考慮してエベレスト登山に最適な時期を教えてくれるだけでなく、飛行機やホテルを予約することもできます。

The DX Leaders

AI活用のグローバル・トレンドや日本の市場動向を踏まえたDX、生成AIの最新情報を毎月お届けします。登録の際はIBMプライバシー・ステートメントをご覧ください。

ご登録いただきありがとうございます。

ニュースレターは日本語で配信されます。すべてのニュースレターに登録解除リンクがあります。サブスクリプションの管理や解除はこちらから。詳しくはIBMプライバシー・ステートメントをご覧ください。

エージェント型AIのメリットとは

エージェント型システムは、モデルのトレーニングに使用されるデータセットに含まれる情報によって制限される従来の生成システムに比べて多くのメリットがあります。

自律型

エージェント型システムの最も重要な進歩は、人間による継続的な監視なしにタスクを自律的に実行できることです。エージェント型システムは、長期的な目標を維持し、複数ステップの問題解決タスクを管理し、時間の経過に伴う進捗状況を追跡できます。

事前対応性

エージェント型システムは、LLMの柔軟性を提供します。LLMは、従来のプログラミングの構造化された、決定論的で信頼性の高い機能を備え、微妙なニュアンスやコンテキスト依存の理解に基づいて応答やアクションを生成できます。このアプローチにより、エージェントはより人間的な方法で「考え」そして「行動」できるようになります。

LLM自体は外部ツールやデータベースと直接やり取りしたり、リアルタイムでデータを監視および収集するシステムを設定したりすることはできませんが、エージェントなら可能です。エージェントは、Webを検索し、アプリケーション・プログラミング・インターフェース(API)を呼び出し、データベースを照会し、この情報を使用して意思決定を行い、アクションを実行できます。

専門的

エージェントは特定のタスクに特化できます。単純で、単一の反復タスクを確実に実行するエージェントもあれば、知覚を使い、記憶を活用して、より複雑な問題を解決できるエージェントもあります。エージェント型アーキテクチャーは、タスクと決定を監視し、他のより単純なエージェントを監視するLLMを搭載した「コンダクター」モデルで構成される場合があります。このようなアーキテクチャーは、連続的なワークフローには最適ですが、ボトルネックの影響を受けやすくなります。その他のアーキテクチャーにはより水平的で、エージェントは分散的手法により平等に調和して動作するものもありますが、このアーキテクチャーは垂直階層よりも遅くなる可能性があります。AIアプリケーションが異なれば、必要なアーキテクチャーも異なります。

適応性

エージェントは経験から学び、フィードバックを取り入れて行動を調整することができます。適切なガードレールがあれば、エージェント型システムは継続的に改善できます。マルチエージェント・システムは、最終的には広範囲にわたるイニシアチブを処理できる拡張性を備えています。

直感的

エージェント型システムはLLMを搭載しているため、ユーザーは自然言語プロンプトを使用してシステムを操作できます。これは、ソフトウェア・インターフェース全体(選択したSaaSプラットフォームに含まれる多数のタブ、ドロップダウン、チャート、スライダー、ポップアップ、その他のUI要素など)を、単純な言語または音声コマンドに置き換えることができることを意味します。理論的には、あらゆるソフトウェア・ユーザー・エクスペリエンスは、必要な情報を取得し、その情報に基づいてアクションを実行できるエージェントとの「やり取り」にまで身近なものにできます。従業員が新しいインターフェースやツールを学習して習得するのにかかる時間を考慮すると、この生産性のメリットはどれだけ強調しても、強調しすぎることはありません。

AIエージェント

AIエージェントの5つのタイプ:自律機能と実世界アプリケーション

目標主導型でユーティリティーベースのAIがワークフローや複雑な環境にどのように適応するかをご覧ください。

エージェント型AIの仕組み

エージェント型AIツールにはさまざまな形式があり、異なる問題には異なるフレームワークが適していますが、ここではエージェント型システムが操作を実行するために従う一般的な手順について説明します。

認識

エージェント型AIは、センサー、API、データベース、またはユーザー・インタラクションを通じて環境からデータを収集することから始まります。このステップにより、分析して対処するための最新の情報がシステムに確保されます。

推論

データが収集されると、AIがそれを処理して有意義な洞察を抽出します。自然言語処理(NLP)、コンピューター・ビジョン、その他のAI機能を使用して、ユーザーのクエリーを解釈し、パターンを検出し、より広いコンテキストを理解します。この機能は、AIが状況に応じてどのようなアクションを取るべきかを決定するのに役立ちます。

目標設定

AIは、事前に定義された目標またはユーザー・インプットに基づいて目標を設定します。次に、多くの場合、Decision Trees強化学習、またはその他の計画アルゴリズムを使用して、これらの目標を達成するための戦略を開発します。

意思決定

AIは複数の可能なアクションを評価し、効率、精度、予測される結果などの要素に基づいて最適なアクションを選択します。最善の行動方針を決定するために、確率モデル、効用関数、または機械学習ベースの推論が使用される場合があります。

実行

アクションを選択すると、AIは外部システム(API、データ、ロボット)と対話するか、ユーザーに応答を提供することによって、そのアクションを実行します。

学習と適応

アクションを実行した後、AIは結果を評価し、将来の意思決定を改善するためのフィードバックを収集します。強化学習または自己教師あり学習を通じて、AIは時間の経過とともに戦略を改良し、将来同様のタスクをより効果的に処理できるようになります。

オーケストレーション

AIオーケストレーションとは、システムとエージェントを調整し、管理するという意味です。オーケストレーション・プラットフォームは、AIワークフロー自動化し、タスク完了までの進行状況を追跡し、リソースの使用状況を管理し、データ・フローとメモリーを監視し、障害イベントを処理します。適切なアーキテクチャーがあれば、理論的には、数十、数百、あるいは数千ものエージェントが調和のとれた生産性を発揮し、連携して動作することができる可能性があります。

エージェント型AIの例

エージェント型AIソリューションは、現実世界のあらゆるエコシステムにおけるほぼすべてのAIユースケースに導入できます。エージェントは複雑なワークフロー内に統合して、ビジネス・プロセスを自律的に実行できます。

  • AIを搭載した取引用ロボットは、リアルタイムの株価や経済指標を分析して予測分析を行い、取引を実行できます。

  • 自動運転車では、GPSやセンサー・データなどのリアルタイムのデータ・ソースによってナビゲーションと安全性が向上します。

  • ヘルスケア分野では、エージェントは患者データを監視し、新しい検査結果に基づいて治療の推奨事項を調整し、チャットボットを通じて臨床医にリアルタイムのフィードバックを提供できます。

  • サイバーセキュリティーでは、エージェントはネットワーク・トラフィック、システム・ログ、およびユーザーの動作を継続的に監視し、マルウェア、フィッシング攻撃、または不正アクセスの試みに対する脆弱性を示す可能性のある異常を検知できます。

  • AIは、プロセスの自動化と最適化を通じてサプライチェーン管理を合理化し、サプライヤーに自動的に発注したり、生産スケジュールを調整して最適な在庫レベルを維持したりすることができます。

エージェント型AIシステムの課題

エージェント型AIシステムは企業にとって大きな可能性を秘めています。自律性はエージェント型システムの最大のメリットですが、この自律性は、エージェント型システムが「軌道から外れた」場合に深刻な結果をもたらす可能性があります。通常のAIリスクが適用されますが、エージェント型システムではリスクが拡大される可能性があります。

多くのエージェント型AIシステムでは、報酬関数を最大化する強化学習が使用されます。報酬システムの設計が適切でない場合、AIは抜け穴を利用して意図しない方法で「高得点」を達成する可能性があります。

次のような例を考えてみましょう。

  • センセーショナルなコンテンツや誤解を招くコンテンツを優先し、意図せず誤った情報を広めるSNSのエンゲージメントを最大化する任務を負ったエージェント

  • 商品をより速く移動させるためにスピードを最適化する倉庫用ロボット。

  • 利益を最大化することを目的としていることから、リスクの高い、または非倫理的な取引慣行に従事し、市場の不安定化を引き起こす金融取引用AI。

  • 有害な発言を減らすように設計され、正当な議論を過度に検閲するコンテンツ・モデレーションAI。

一部のエージェント型AIシステムは、自己強化的になり、意図しない方向に動作をエスカレートさせる可能性があります。この問題は、AIが安全策を講じずに特定のメトリックに対して過度に積極的に最適化した場合に発生します。また、エージェント型システムは連携して動作する複数の自律エージェントで構成されることが多いため、障害が発生する可能性があります。交通渋滞、ボトルネック、リソースの競合など、これらすべてのエラーが連鎖的に発生する可能性があります。モデルには、測定可能な明確に定義された目標があり、フィードバックのためのループが確保されていることが重要です。そうすることで、モデルは時間の経過とともに組織の意図にさらに近づくことができます。

関連ソリューション
IBMのAIエージェント開発

開発者が、IBM watsonx.aiを使用してAIエージェントの構築、デプロイ、および監視を行えるようにします。

watsonx.aiの詳細はこちら
IBMのAIエージェントとアシスタント

業界で最も包括的な機能セットの1つを使用して、企業がAIエージェントとアシスタントを構築、カスタマイズ、管理できるようにすることで、生産性を飛躍的に向上させます。

AIエージェントの詳細はこちら
IBM Granite

開発者の効率性を考慮したGraniteの小型オープンモデルで、コストを90%以上削減します。エンタープライズ対応モデルは、安全性ベンチマークに対して、さらにサイバーセキュリティーからRAGまでの幅広い企業タスクに対して優れたパフォーマンスを発揮します。

Graniteの詳細はこちら
次のステップ

包括性で業界でも屈指の機能セットを使用して、複雑なワークフローを自動化し、生産性を飛躍的に向上させましょう。企業がAIエージェントとアシスタントを構築、カスタマイズ、管理するのに役立つ機能セットです。

watsonx.aiエージェントの開発の詳細はこちら watsonx Orchestrateの詳細はこちら