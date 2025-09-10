Les premiers LLM (comme les modèles GPT-1 et GPT-2 d’OpenAI) fournissaient des réponses directes ; la vague suivante de modèles de chaîne de pensée, qui a débuté en 2022, ajoutait un élément de raisonnement externalisé. En effet, les modèles « pensaient à haute voix » lorsqu’ils parvenaient à une réponse, améliorant ainsi la précision et l’explicabilité.

Vint ensuite une génération de modèles de langage augmentés (« systèmes ALM ») et d’agents IA, qui ajoutaient des capacités d’appel d’outils à ce raisonnement. Les premiers cadres ALM, comme ReAct, suivent un schéma de pensée-action-observation : le système observe ce qu’il génère avant de recommencer à y réfléchir. Bien qu’ils soient généralement efficaces, les cadres comme ReAct peuvent enregistrer une forte consommation de tokens, car chaque appel d’outil ultérieur doit inclure tout l’historique de conversation qui le précède, un coût qui s’alourdit à chaque étape.

ReWOO s’affranchit du schéma penser-agir-observer en dissociant le raisonnement des observations externes, ce qui permet au modèle de planifier sa chaîne de raisonnement en interne avant d’invoquer de manière sélective les outils ou de récupérer des informations. Cette séparation évite les allers-retours inutiles et permet au modèle de conserver son plan tout au long de la tâche.