IBMニュースレター
The DX Leaders
AI活用のグローバル・トレンドや日本の市場動向を踏まえたDX、生成AIの最新情報を毎月お届けします。登録の際はIBMプライバシー・ステートメントをご覧ください。
ニュースレターは日本語で配信されます。すべてのニュースレターに登録解除リンクがあります。サブスクリプションの管理や解除はこちらから。詳しくはIBMプライバシー・ステートメントをご覧ください。
AIエージェントのメモリーとは、人工知能(AI)システムが過去の経験を保存して再利用することで、意思決定、認識、および全体的な性能を向上させる能力を指します。
各タスクを個別に処理する従来のAIモデルとは異なり、メモリーを備えたAIエージェントは、コンテキストを保持し、時間の経過とともにパターンを認識し、過去のやり取りに基づいて適応することができます。この機能は、フィードバック・ループやナレッジ・ベース、適応型学習を必要とする目標志向型のAIアプリケーションにとって不可欠です。
メモリーとは、過去の対話に関する要素を記憶するシステムです。 AIエージェントは必ずしも記憶システムを必要としません。たとえば、単純な反射型エージェントは、環境に関するリアルタイムの情報を認識し、それに基づいて行動したり、その情報を伝えたりします。
基本的なサーモスタットは、昨日の温度を記憶する必要はありません。しかし、メモリー付きのより高度な「スマート」サーモスタットは、パターンを学習し、ユーザーの行動に適応し、エネルギー効率を最適化することにより、単純なオン/オフによる温度制御を超えています。現在の温度だけに反応するのではなく、過去のデータを保管して分析することで、よりインテリジェントな意思決定を行うことができます。
大規模言語モデル(LLM)は、それ自体では物事を記憶することはできず、メモリー・コンポーネントを追加する必要があります。しかし、過剰なデータを保存すると応答時間が遅くなる可能性があるため、AIメモリー設計における最大の課題の1つは、検索効率の最適化です。
最適化されたメモリー管理により、AIシステムはリアルタイム・アプリケーション向けに低遅延で処理を維持しながら、最も関連性の高い情報だけを保存することが可能になります。
IBMニュースレター
AI活用のグローバル・トレンドや日本の市場動向を踏まえたDX、生成AIの最新情報を毎月お届けします。登録の際はIBMプライバシー・ステートメントをご覧ください。
ニュースレターは日本語で配信されます。すべてのニュースレターに登録解除リンクがあります。サブスクリプションの管理や解除はこちらから。詳しくはIBMプライバシー・ステートメントをご覧ください。
心理学者が人間の記憶を分類するのとほぼ同じ方法で、研究者はエージェントのメモリーを分類します。プリンストン大学のチームによる有力なCognitive Architectures for Language Agents(CoALA)の論文1では、さまざまな種類のメモリーについて以下のように説明しています。
短期記憶(STM)により、AIエージェントは最近のインプットを記憶して、即座に意思決定を行うことができます。このタイプのメモリーは、複数のやり取りにわたってコンテキストを維持する必要がある対話型AIで有用です。
たとえば、セッション内の過去のメッセージを記憶できるチャットボットは、各ユーザーのインプットを個別に扱うのではなく、一貫性のある応答を返すことができ、ユーザー体験の向上につながります。たとえば、OpenAIのChatGPTは、1つのセッション内でチャット履歴を保持することで、よりスムーズでコンテキストを考慮した対話を実現しています。
STMは通常、ローリング・バッファーまたはコンテキスト・ウィンドウを使用して実装され、上書きされる前に限られた量の最新データを保持します。このアプローチにより、短いやり取りの継続性が向上しますが、セッション以降の情報を保持しないため、長期的なパーソナライゼーションや学習には適していません。
長期記憶(LTM)は、AIエージェントが異なるセッションをまたいで情報を保管・想起することを可能にし、時間の経過とともによりパーソナライズされ、知的なアクションを実現します。
短期記憶とは異なり、LTMは永続ストレージ用に設計されており、多くの場合、データベース、知識グラフ、またはベクトル埋め込みを使用して実装されます。このタイプのメモリーは、パーソナライズされたアシスタントや推奨システムなど、過去の知識を必要とするAIアプリケーションには不可欠です。
たとえば、AIを活用したカスタマー・サポート・エージェントは、ユーザーとの過去のやり取りを記憶し、それに応じた応答を行うことで、全体的なカスタマー・エクスペリエンスを向上させることができます。
LTMを実装するための最も効果的な技術の1つは、検索拡張生成(RAG)です。これにより、エージェントは保存された知識ベースから関連情報を取得し、応答を強化します。
エピソード記憶によって、AIエージェントは過去の特定の経験を想起することが可能となり、人間が個々の出来事を記憶することと似ています。このタイプのメモリーは、AIが過去のイベントから学習して将来により適切な意思決定を行う、ケースベースの推論に役立ちます。
エピソード記憶は、多くの場合、エージェントが意思決定を行う際にアクセスできるように、構造化された形式で主要な出来事、行動、およびその結果をロギングすることで実装されます。
たとえば、AIを活用したファイナンシャル・アドバイザーは、ユーザーの過去の投資選択を記憶し、その履歴をもとにより適切な提案を行うことができます。このタイプの記憶は、ロボティクスや自律型システムにおいても不可欠であり、エージェントが過去のアクションを想起して効率的に移動する必要がある場面で活用されます。
意味記憶は、AIエージェントが推論のために取得・使用できる構造化された事実知識を保管する役割を担います。エピソード記憶が特定の出来事を取り扱うのに対し、意味記憶は事実、定義、規則などの一般的な情報を含んでいます。
AIエージェントは通常、知識ベース、シンボリックAI、またはベクトル埋め込みを使用して意味記憶を実装し、関連情報を効率的に処理および取得できるようにします。このタイプのメモリは、法律AIアシスタント、医療診断ツール、エンタープライズ・ナレッジ管理システムなど、専門知識を必要とする現実世界のアプリケーションで使用されています。
たとえば、AIを活用したリーガル・アシスタントは、自身のナレッジ・ベースを用いて判例を保管・検索し、正確な法的アドバイスを提供することができます。
AIエージェントにおける手続き記憶とは、スキル、ルール、学習された行動を保管し、それを想起する能力を指します。これにより、エージェントは毎回明示的な推論を行わなくても、自動的にタスクを実行できるようになります。
これは、自転車に乗る、タイピングをするなどのアクションを、各ステップを意識することなく実行できるようにする人間の手続き記憶に着想を得たものです。AIにおいても、手続き記憶は、過去の経験に基づいて複雑なアクションのシーケンスを自動化し、エージェントの効率を向上させるのに役立ちます。
AIエージェントは、トレーニングを通じてアクションのシーケンスを学習し、多くの場合は強化学習を用いてパフォーマンスを時間とともに最適化します。タスクに関連する手順を保管することで、AIエージェントは計算時間を短縮し、データを一から再処理することなく、特定のタスクに対して迅速に対応できるようになります。
開発者は、外部ストレージ、特殊なアーキテクチャー、フィードバック・メカニズムを用いてメモリを実装します。AIエージェントの複雑さは、単純な反射エージェントから高度な学習エージェントまで多岐にわたるため、メモリの実装はエージェントのアーキテクチャー、ユースケース、そして求められる適応性によって異なります。
メモリー対応AIエージェントを構築するための重要なエージェント・フレームワークの1つがLangChainで、メモリー、API、推論ワークフローの統合を容易にします。 LangChainとベクトル・データベースを組み合わせることで、AIエージェントは過去の大量の対話を効率的に保管、取得できるため、長期にわたってより一貫性のある対応が可能になります。
LangGraphを使用することで、開発者はAIエージェントの階層的なメモリー・グラフを構築できるようになり、依存関係の追跡や継続的な学習能力を向上させることができます。
ベクトル・データベースを統合することで、エージェント型システムは過去のやり取りの埋め込みを効率的に保管できるようになり、コンテキストに基づく想起が可能になります。これは、ユーザーの好みや過去の修正内容を記憶する必要があるAIによるドキュメント生成において特に有用です。
オープンソースフレームワークの台頭により、メモリ強化型AIエージェントの開発が加速しました。GitHubなどのプラットフォームは、メモリをAIワークフローに統合するためのツールとテンプレートを提供する多数のリポジトリをホストしています。
さらに、Hugging Faceは、メモリー・コンポーネントと組み合わせてファインチューニング可能な事前学習済みモデルを提供しており、AIの想起能力を向上させることができます。AI開発で主流となっているPythonは、オーケストレーション、メモリーの保管および検索メカニズムを扱うためのライブラリーを備えており、AIメモリー・システムの実装に最適な言語となっています。
1 "Cognitive Architectures for Language Agents," Princeton University, February, 2024.
生成AIを使用してワークフローとプロセスを自動化する強力なAIアシスタントとエージェントを構築、デプロイ、管理しましょう。
信頼できるAIソリューションでビジネスの未来を構築します。
IBMコンサルティングAIサービスは、企業がAIをトランスフォーメーションに活用する方法を再考するのに役立ちます。