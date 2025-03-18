ReActフレームワークは、人間が複雑なタスクの計画や実行を段階的に行う際に、自然言語を直感的に、しばしば内なる独り言として活用する方法に着想を得ています。



ルールベースやあらかじめ定義されたワークフローを実行するのではなく、ReActエージェントは、LLMの推論能力に基づいて、新たな情報や前のステップの結果に応じてアプローチを動的に調整します。

短い旅行の荷造りを想像してみてください。まずは重要な要素を考え（「現地の天気はどうだろう」）、そして次に外部の情報源を参照するでしょう（「現地の天気予報を調べよう」）。



その新しい情報（「寒くなりそうだ」）をもとに、次に考慮すべきこと（「暖かい服は持っていたかな」）や行動（「クローゼットを確認しよう」）を決めます。その行動を取ることで、思いがけない問題に直面するかもしれません（「暖かい服は全部収納してあった」）、そしてそれに応じて次のステップを調整します（「重ね着できる服はあるかな」）。

同様に、ReActフレームワークでは、プロンプト・エンジニアリングを活用して、AIエージェントの活動を思考、アクション、観察を交互に繰り返す形式的なパターンに構造化します。

言語化されたCoTによる推論ステップ（思考）は、モデルが大きなタスクをより扱いやすいサブタスクに分解するのに役立ちます。

アクションを実行した後、モデルは進捗を再評価し、その観察をもとに最終的な答えを出すか、次の思考に反映させます。理想的には、この観察には、モデルの通常のコンテキスト・ウィンドウ内で以前に得られた情報や、外部のメモリー・コンポーネントからの情報も考慮されるべきです。

ReActエージェントの性能は、その中心となるLLMが複雑なタスクを「言語的に」思考しながら進める能力に大きく依存しているため、ReActエージェントは高度な推論力と指示遂行能力を備えた高性能なモデルから大きな恩恵を受けます。

コストとレイテンシーを最小限に抑えるために、マルチエージェント型のReActフレームワークでは、中心となるエージェントとして、より高性能な大規模モデルを主に活用し、その推論プロセスやアクションの一環として、より小型で効率的なモデルを用いた複数のエージェントにサブタスクを委任することがあります。