エージェント型ワークフローとは

共同執筆者

Staff Editor, AI Models

IBM Think

AI Engineer, Developer Advocate

IBM

エージェント型ワークフローとは

エージェント型ワークフローは、自律的なAIエージェントが意思決定を行い、行動を起こし、タスクを調整するAI駆動型のプロセスであり、人間の介入を最小限に抑えます。これらのワークフローは、推論、計画、ツール使用などのインテリジェント・エージェントの中核となるコンポーネントを活用して、複雑なタスクを効率的に実行します。ロボティック・プロセス・オートメーション（RPA）などの従来のオートメーションでは、事前に定義されたルールと設計パターンに従います。このアプローチは、標準的な構造に従う反復的なタスクには十分です。エージェントのワークフローは動的であり、リアルタイムのデータや予期せぬ条件に適応することで柔軟性が高まります。AIエージェントのワークフローは、複数ステップかつ反復的な方法で複雑な問題にアプローチするため、AIエージェントはビジネス・プロセスを細分化し、動的に適応し、時間をかけて行動を洗練させます。

生成AIによって複雑なワークフローを処理できるようになることで、組織は業務効率、拡張性、さらには情報に基づいた意思決定の向上といったメリットを享受できます。機械学習と自然言語処理（NLP）の進歩が続く中、人間の監視への依存を減らしながらプロセスの自動化・最適化を目指す業界では、AIテクノロジーの導入がますます進んでいます。進化するAIモデルの影響は、ソフトウェア開発だけでなく、ヘルスケア、金融、人事など、さまざまな業界に及んでいます。

IBMニュースレター

The DX Leaders

AI活用のグローバル・トレンドや日本の市場動向を踏まえたDX、生成AIの最新情報を毎月お届けします。登録の際はIBMプライバシー・ステートメントをご覧ください。

エージェント型ワークフローの仕組み

企業に、ルールベースのオートメーション・システムに従ってITサポート・チャットボットを運用していると想像してください。従業員が問題（例えば、「WiFiが使えない」）を報告すると、チャットボットは静的なDecision Treesを実行し、事前定義された応答を提供します。問題が解決されない場合、チャットボットは単に人間のサポートにエスカレーションします。このアプローチは、基本的で明確に定義された問題に対しては効率的ですが、適応性を必要とする複雑で複数ステップのトラブルシューティングでは適切に機能しません。

エージェント型ワークフローでは、ITアシスタントは複数ステップの反復的なプロセスとしてトラブルシューティングにアプローチします。従業員がWiFiの問題を報告すると、エージェントは次のような動的なステップバイステップのプロセスに従ってワークフローを細分化します。

問題の理解：AIエージェントは従業員から詳細な情報を収集し、「他のデバイスはネットワークに接続されていますか」や「最近のアップデート後に問題が発生しましたか」などの明確な質問をします。
診断手順の実行：ユーザーの回答に基づいて、AIはさまざまな問題解決手順を選択し、実行します。ルーターにpingを送信したり、ネットワーク・ログを確認したり、具体的な設定変更を提案したり、これらの情報を取得してユーザー向けに要約したりします。
適応型ツールの活用：AIがサーバー側の問題を検知した場合、内部監視ツールAPIを呼び出して障害の有無を確認します。問題がデバイス固有のものである場合は、ドライバー更新の提案を取得したり、スクリプトを実行してネットワーク設定をリセットしたりすることができます。
結果に基づく反復処理：アクションで問題が解決しない場合、AIは動的にアプローチを調整します。すぐにエスカレーションするのではなく、関連する問題のクロスチェックや、診断の再試行、あるいは別の解決策を提案する場合があります。
最終決定と学習：問題が解決した場合、AIは解決策を将来のケースのために記録し、時間の経過とともにトラブルシューティングの効率を向上させます。問題が解決しない場合は、詳細なレポートとともにエスカレーションし、試行された修正の概要をまとめることでITスタッフの作業時間を節約します。

AIエージェント

AIエージェントの5つのタイプ：自律機能と実世界アプリケーション

目標主導型でユーティリティーベースのAIがワークフローや複雑な環境にどのように適応するかをご覧ください。

AIエージェントを構築、展開、監視

エージェント型ワークフローのコンポーネント

エージェント型ワークフローは次のもので構成されています。

AIエージェント - 人工知能（AI）において、ワークフローがAIエージェントで構成されていない場合、それはエージェント的ではありません。AIエージェントとは、ワークフローを設計し、利用可能なツールを活用することで、ユーザーまたは他のシステムに代わってタスクを自律的に実行できるシステムまたはプログラムを指します。
大規模言語モデル（LLM） - AIエージェントの中核を成すのは大規模言語モデルです。LLMは自然言語の処理と生成に不可欠です。温度などのLLMパラメーターの調整によっても、アウトプット品質は変化します。

ツール - LLMがモデルのトレーニングに使用したデータ以外の情報を取得するには、ツールを提供する必要があります。一般的に使用されるツールの例としては、外部データセット、Web検索、アプリケーション・プログラミング・インターフェース（API）などが挙げられます。ツールを使用することで、AIエージェントを日常的なタスクだけでなく、特定のユースケースに合わせてカスタマイズできます。

フィードバック・メカニズム - ヒューマン・イン・ザ・ループ（HITL）や他のエージェントなどのフィードバック・メカニズムは、AIエージェントの意思決定プロセスを促進し、エージェントのアウトプットを管理するのに役立ちます。

プロンプト・エンジニアリング - エージェント・ワークフローのパフォーマンスは、提供されるプロンプトの品質に大きく依存します。プロンプト・エンジニアリングは、生成AIモデルが単純なものから高度な技術的なものまで、幅広いクエリーをより適切に理解し、応答するのに役立ちます。一般的なプロンプト・エンジニアリング手法には、Chain of Thought（CoT）、ワンショット、ゼロショット、自己反映などがあります。

マルチエージェント・コラボレーション - マルチエージェント・システム（MAS）におけるコミュニケーションと分散型問題解決は、複雑なユースケースにおいて鍵となります。MAS内の各エージェントには、ツール、アルゴリズム、そして「専門分野」のセットを割り当てることができるため、すべてのエージェントが同じ情報を再学習する必要はありません。その代わりに、エージェントは学習した情報を他のMASと共有します。

統合 - 既存のプロセスを効率化するには、エージェント型ワークフローを既存のインフラストラクチャーと統合する必要があります。この相乗効果は、エージェント型ワークフローの要件と目標によって異なります。多くの場合、最初のステップは、エージェントがアクセスできるようにデータを中央データベースに統合するデータ統合プロセスです。その他の統合形式としては、LangChain、LangGraph、crewAI、IBMのBeeAIなどのエージェント・フレームワークがあります。これらのエージェント・オーケストレーション・フレームワークは、より大規模なスケールとパフォーマンスを実現するためのプロバイダーとして機能します。コンテキスト固有のツールを統合することも、適切なアウトプットを得るための鍵となります。

エージェント型ワークフローの影響

AI界のリーダー的存在であるAndrew Ng氏の個人的な逸話では、エージェント型ワークフローの適応性が強調されています。Ng氏は、AIエージェントを開発する際のデモンストレーションで、多数のAIツールのうちの1つであるWeb検索APIが失敗しました。AIシステムは、代わりに利用可能なWikipedia検索ツールを使用することで、依存関係の失敗に迅速に対処することができました。システムはタスクを完了し、変化する環境に適応できる状態を維持しました。人間による監視の必要性が減ることで、日常的で反復的な作業に労力を費やすことが減り、人間の知能を必要とする複雑な作業に労力を費やすことができるようになるかもしれません。

Ng氏は、エージェント型ワークフローはタスク実行だけでなく、次世代のLLMのトレーニングにも有効であると説明しています。従来の非エージェント型ワークフローでは、あるLLMのアウトプットを別のLLMのトレーニングに使用しても効果的な成果が得られないことが分かっています。しかし、高品質なデータを生成するエージェント型ワークフローを使用することで、有用なトレーニングが可能になります。