IBMニュースレター
The DX Leaders
AI活用のグローバル・トレンドや日本の市場動向を踏まえたDX、生成AIの最新情報を毎月お届けします。登録の際はIBMプライバシー・ステートメントをご覧ください。
ニュースレターは日本語で配信されます。すべてのニュースレターに登録解除リンクがあります。サブスクリプションの管理や解除はこちらから。詳しくはIBMプライバシー・ステートメントをご覧ください。
ここ数年、生成AIまたは生成AIは技術者の間で注目の話題となってきましたが、最近、人工知能(AI)開発コミュニティに新しい用語が浸透してきました。「エージェント」はAIにおける最新の流行語であり、この場合はその話題性に見合うだけの価値があると信じるのが妥当です。エージェント型AIは、大規模言語モデル(LLM)の汎用性と柔軟性と、従来のプログラミングの精度を融合したものです。
エージェント型AIとは、独自のワークフローを設計し、利用可能なツールを使用して、ユーザーまたは別のシステムに代わってタスクを自律的に実行できるシステムまたはプログラムを指します。システムには、システムの機械学習(ML)モデルがトレーニングされたデータを超えて、意思決定、アクションの実行、複雑な問題の解決、外部環境との対話を行う「主体性」があります。
AIエージェントは、データベースやネットワークから情報を取得するだけでなく、ユーザーの行動からも学習することもでき、時間の経過とともに改善していきます。エージェントの適応性により、従来のAIでは処理できなかった複雑で多段階のAIアプリケーションを処理できるため、エージェントは現代の組織におけるプロセス・オートメーション・ストラテジーの重要な要素になっています。
ChatGPTなどの汎用LLMチャットボットにどのアイスクリーム・メーカーを購入すればよいかを尋ねるとします。するとそのモデルの自然言語処理(NLP)機能により、インターネットから収集された情報を含む可能性のあるトレーニング・データに基づいて推奨事項が提示されるようになります。しかし、過去の一般的な助言などは求めていません。必要なのはリアルタイムの情報を考慮したアドバイスです。
エージェント型AIプラットフォームは、さまざまなアプリケーションにデプロイできる複数のエージェントの動作を調整するLLMで構成されています。これらのエージェントは、AIモデルに近いものである場合もあれば、ナレッジベースやオンラインで情報をすばやく検索できるシンプルな検索ツールである場合もあります。前の例の続きを説明するために、GPTのような大規模言語モデル(LLM)がリアルタイムの電子商取引データやあなたの支払い情報にもアクセスできると想像してみてください。
このようなエージェント型AIプラットフォームは、特定の小売店でセール中のアイスクリームメーカーが人気だと伝えるだけでなく、理論的には代わりに購入することも可能です。エージェント型AIは、これまでSFの世界だと思われていたユースケースに私たちを近づけています。そこでは機械が、複雑なワークフローを伴う複雑なタスクを、データ駆動型意思決定と最小限の人為的介入による行動実行を通じて遂行できるのです。
エージェント型AIに関する誇大宣伝は正当だと考えられる理由は十分にあります。次の4つをご覧ください。
LLMは人間のようなテキストの処理と生成に優れているため、ユーザーは自然言語コマンドを使用してAIと対話しやすくなります。これにより、明示的なプログラミング知識の必要性が少なくなります。LLMは、文脈からニュアンスをくみ取って理解し、応答やアクションを生成できるため、従来のプログラミングではすべてのエッジ・ケースをカバーするのが困難なシナリオで役立ちます。さらに、LLMはコンテンツ生成やコード補完の要約などのタスクで創造性を発揮します。この生成機能を従来のルールベースのプログラミングで再現するのは困難です。
一方、従来のプログラミングは高度に構造化され、決定的で信頼性が高いため、精度、再現性、検証可能性が必要なタスクに最適です。従来のプログラミング言語は、タスクの実行方法をきめ細かく制御できるため、複雑なワークフロー、アルゴリズム、または特定のシステム要件を明示的に定義して最適化できます。従来のプログラミングは、高い性能や独自の機能を必要とするタスクの場合、多くの場合より効率的です。
エージェント型AIシステムは、LLMを使用して柔軟性と動的な応答が得られるタスクを処理すると同時に、これらのAI機能と従来のプログラミングを組み合わせて厳格なルール、ロジック、性能を実現するという、両方の長所を提供します。このハイブリッドなアプローチにより、AIは直感的で正確な作業を実現します。エージェントは、新しいデータや動的環境に適応しながら自律的にタスクを実行できますが、これは静的コードでは困難です。同時に、クリティカルなプロセス(セキュリティや計算など)は、決定論的な従来のアルゴリズムに依存することができます。
エージェント型AI搭載システムには、1つの単純なタスクを適切かつ一貫して実行する単純な反射エージェントが含まれる場合があります。より複雑なルールベースのエージェントは、現在の認識を使用し記憶を活用できるため、新しい情報を受信して保管できるようになり、より幅広いタスクを実行できるようになります。学習エージェントは新たなデータを取り込むことも可能であり、これを後の意思決定に活用することで、時間の経過とともに精度を向上させることができる。強力なエージェント型AIプラットフォームには、さまざまな機能を持つ数十、場合によっては数百のエージェントが連携する場合があります。
IBMニュースレター
AI活用のグローバル・トレンドや日本の市場動向を踏まえたDX、生成AIの最新情報を毎月お届けします。登録の際はIBMプライバシー・ステートメントをご覧ください。
ニュースレターは日本語で配信されます。すべてのニュースレターに登録解除リンクがあります。サブスクリプションの管理や解除はこちらから。詳しくはIBMプライバシー・ステートメントをご覧ください。
LLMは通常、特定の時点までの情報の断片を表す静的なデータセットでトレーニングされます。LLMは、トレーニング期間後にWebから新しい情報を積極的に収集することはできません。企業は、既に「知っている」ことに基づいてのみ回答を生成できます。外部ソースからのリアルタイム・データに独自にアクセスしたり更新したりすることはできません。
LLMは、外部ツールやデータ処理システム(スプレッドシート、クラウド・プラットフォーム、分析ソフトウェアなど)と直接やり取りしたり、進行中のデータ(IoT(モノのインターネット)センサー、ビジネス・プロセス、システムからのログなど)を監視および収集するシステムを自律的にセットアップしたりすることはできません。継続的なタスクを実行するように設計されていないためです。
エージェント型AIは、アプリケーション・プログラミング・インターフェース(API)と呼ばれるWebを検索したり、データベースを照会したりするように設計できます。エージェントは、リアルタイムの情報の取得、更新の取得、意思決定に重要な特定のデータポイントの取得が可能です。エージェントは、データ・ロギング、リアルタイム監視、傾向分析などのタスクを開始して管理できます。IoTデバイス、ソーシャル・メディア・フィード、またはその他のシステムからデータ・ストリームを積極的に追跡および収集し、より情報に基づいた意思決定と状況に応じた応答のための新しいインプットをLLMに提供します。
エージェント型AIは、フィードバック・ループを使用して新しいデータを積極的に探し、モデルや意思決定プロセスを改良できます。これには、定期的に新しいソースにクエリを実行したり、ユーザー・フィードバックを収集したり、現実世界の結果を分析して、理解やストラテジーを更新および改善したりすることが含まれる場合があります。このようにしてLLMは、より豊富で継続的に進化するデータから、時間をかけて最適化を達成できます。
LLMの高度な知能とエージェントの特化能力を組み合わせたエージェント型AIは、人間の継続的な監視を必要とせず、自律的に動作し特定のタスクを自律的に実行できます。これにより、人間の監視が制限されている、あるいは不要な環境でも継続的な運用が可能になります。自律システムは、長期的な目標を維持し、複数ステップのタスクを管理して、進捗状況を長期的に追跡できます。
たとえば、エージェント型AIには、マーケティング・キャンペーンの管理、性能の継続的な監視、ストラテジーの調整、フィードバックに基づく成果の最適化などのタスクを実行できます。人間は各段階でインプットする必要はありません。
ヘルスケア分野では、エージェントは患者データを監視し、新しい検査結果に基づいて治療の推奨事項を調整し、臨床医にリアルタイムのフィードバックを提供できます。
サイバーセキュリティーでは、エージェントはネットワーク・トラフィック、システム・ログ、およびユーザーの動作を継続的に監視し、マルウェア、フィッシング攻撃、または不正アクセスの試みに対する潜在的なセキュリティー脅威を示す可能性のある異常を検知できます。サプライチェーンにおいては、AIがサプライヤーに自動で発注したり、生産スケジュールを調整したりして、最適な在庫レベルを維持できます。
人事面では、エージェントは新入社員の役割と背景を分析して、パーソナライズされたオンボーディング・トレーニング・パスを作成することができます。個人のこれまでの経験、役割要件、学習ペースに基づいて、コンテンツや学習教材を調整できます。
現在Software as a Service(SaaS)製品で実行されている多くのビジネス機能が、 エージェント型システムに置き換えられたり、補強されたりする未来は想像に難くありません。 こうしたシステムは、自然言語インプットと簡素化されたユーザーインターフェースを通じて、 従業員がデータと対話し、より効率的にタスクを実行することを可能にします。
たとえば、ソフトウェア開発者がプロジェクトの進行状況を追跡するために使用する チケット発行システムを想像してみてください。このようなシステムには多くのテーブル、タブ、ワークフローが必要であり、 それらは一見しただけでは必ずしも理解しやすいとは限りません。 有用な情報を見つけるには、ユーザーは適切なデータを探し、 複雑に並んだメニューから必要な情報を得る必要があります。 その後、その情報を使用してプレゼンテーションを作成する 必要があるかもしれません。
すべてのデータをテーブルやタブに配列する代わりに、 ユーザーが必要な情報をわかりやすい人間の言語で尋ねるだけで済むとしたらどうでしょうか。
たとえば、複雑なデータセットを手作業で分類しなくても、 従業員ごとの今月の完了チケット数を5年分遡って表示する棒グラフ5本を含む プレゼンテーション・スライドを生成できることを想像してみてください。
手作業でそのデータを取得するのに30分、 見栄えの良いプレゼンテーション用に整った形式で表示するのにさらに30分かかっていたかもしれませんが、 エージェントなら数秒でこれをまとめられるのです。
生成AIのメリットを実感しにくい組織にとって、 AIエージェントこそが具体的なビジネス価値を見出すための鍵となるかもしれません。 モノリシックLLMは素晴らしいものですが、 エンタープライズAIの領域でのユースケースは限られています。現在、少数の大規模LLMに注ぎ込まれている巨額の資金が、現実世界のユースケースで回収されるかどうかは未知数です。しかし、エージェント型AIはLLMを現実世界に導入する有望なフレームワークであり、よりAIを活用する未来への道筋を示しています。
開発者が、IBM watsonx.aiを使用してAIエージェントの構築、デプロイ、および監視を行えるようにします。
業界で最も包括的な機能セットの1つを使用して、企業がAIエージェントとアシスタントを構築、カスタマイズ、管理できるようにすることで、生産性を飛躍的に向上させます。
開発者の効率性を考慮したGraniteの小型オープンモデルで、コストを90%以上削減します。エンタープライズ対応モデルは、安全性ベンチマークに対して、さらにサイバーセキュリティーからRAGまでの幅広い企業タスクに対して優れたパフォーマンスを発揮します。