Le cadre ReAct s’inspire de la manière dont les humains peuvent intuitivement employer le langage naturel, souvent à travers leur monologue intérieur, pour planifier et exécuter étape par étape des tâches complexes.
Plutôt que de mettre en œuvre des workflows basés sur des règles ou prédéfinis, les agents ReAct s’appuient sur les capacités de raisonnement de leur LLM pour s’adapter dynamiquement à de nouvelles informations ou aux résultats des étapes précédentes.
Imaginez que vous fassiez vos valises pour un court voyage. Vous pouvez commencer par identifier les éléments clés («Quel temps fera-t-il pendant mon séjour ? »), puis consulter activement des sources externes («Je vais vérifier les prévisions météo locales »).
À partir de ces nouvelles informations (« Il va faire froid »), vous déterminez l’étape suivante (« Quels vêtements chauds ai-je ? ») et l’action à entreprendre (« Je vais regarder dans mon placard »). Lorsque vous effectuez cette action, un obstacle inattendu peut se présenter («Tous mes vêtements chauds sont au grenier ») et vous devez ajuster l’étape suivante en conséquence («Quels vêtements puis-je superposer ? »).
De manière similaire, le cadre ReAct utilise le prompt engineering pour structurer l’activité d’un agent d’IA selon un modèle formel alternant pensées, actions et observations :
Les actions prédéfinies permettent au modèle d’utiliser des outils, d’effectuer des appels d’interface de programmation des applications (API) et de recueillir davantage d’informations auprès de sources externes (telles que des moteurs de recherche) ou de bases de connaissances (telles qu’un magasin de documents interne).
Après avoir exécuté une action, le modèle réévalue sa progression et s’appuie sur cette observation pour fournir une réponse finale ou alimenter la pensée suivante. Idéalement, l’observation devrait également tenir compte des informations antérieures, qu’elles proviennent de la fenêtre contextuelle standard du modèle ou d’un composant de mémoire externe.
Étant donné que les performances d’un agent ReAct dépendent fortement de la capacité de son LLM central à penser « verbalement » pour accomplir des tâches complexes, les agents ReAct tirent grandement parti de modèles hautement performants dotés de capacités avancées de raisonnement et de suivi des instructions.
Afin de minimiser les coûts et la latence, un cadre ReAct multi-agents peut s’appuyer principalement sur un modèle plus vaste et plus performant qui sert d’agent central dont le processus de raisonnement ou les actions peuvent impliquer la délégation de sous-tâches à d’autres agents conçus à partir de modèles plus petits et plus efficaces.