Die ersten LLMs (wie die GPT-1- und GPT-2-Modelle von OpenAI) lieferten direkte Antworten; die nachfolgende Welle von Chain-of-Thought-Modellen, die 2022 debütierte, fügte ein Element des externalisierten Denkens hinzu, wobei die Modelle im Wesentlichen „laut denken“, wenn sie zu einer Antwort kommen, was die Genauigkeit und Erklärbarkeit verbessert.

Als Nächstes kam eine Generation von erweiterten Sprachmodellen („ALM-Systemen“) und KI-Agenten, die zusätzlich zu dieser Argumentation auch Funktionen zum Aufrufen von Tools hinzufügten. Die frühen ALM-Frameworks – wie React – verwenden ein Denk-Aktion-Beobachten-Muster, bei dem das System beobachtet, was es generiert, bevor es erneut anfängt, darüber nachzudenken. Frameworks wie React sind zwar im Allgemeinen effektiv, können jedoch einen hohen Token-Verbrauch erfordern, da jeder nachfolgende Tool-Aufruf den gesamten Konversationsverlauf enthalten muss, der ihm vorausgeht — Kosten, die sich mit jedem Schritt erhöhen.

ReWOO löst sich vom Denk-Aktion-Beobachten-Muster, indem es die Argumentation von externen Beobachtungen entkoppelt und es dem Modell ermöglicht, seine Argumentationskette intern zu planen, bevor es selektiv Tools aufruft oder Informationen abruft. Diese Trennung reduziert unnötiges Hin und Her und ermöglicht es dem Modell, während der gesamten Aufgabe einen Plan beizubehalten.