Die meisten kognitiven Modelle reduzieren Experimente auf reine Zahlen. Centaur macht das Gegenteil. Es liest jede Aufgabe vollständig vor, inklusive der Anweisungen in natürlicher Sprache und jedem einzelnen Schritt der menschlichen Reaktion. Das Modell wurde auf einem Datensatz namens Psych 101 trainiert, einer Sammlung klassischer psychologischer Probleme, die alles von visuellen Rätseln und Gedächtnistests bis hin zu moralischen Dilemmata und Sprachspielen umfasst. Indem er die gleichen Informationen sieht, die auch eine Person sehen würde, lernt Centaur, der Aufgabe wie ein Mensch zu folgen.

Dieser Ansatz ermöglichte eine Generalisierung, die weit über die Trainingsdaten hinausgeht. Als die Forscher ein Standardproblem des Reinforcement Learning umformulierten und den Rahmen von Astronauten auf fliegende Teppiche verlagerten, zeigte Centaur immer noch die gleichen Verhaltenstendenzen. Es funktionierte auch bei völlig neuen Aufgaben, wie etwa LSAT-ähnlichen Logikrätseln, gut.

Die Verwendung von Sprache anstelle von komprimierten numerischen Beschreibungen war beabsichtigt. „Wir wollten, dass das Modell sieht, was die Teilnehmer gesehen haben“, erklärte Binz. „Vollständige Anweisungen, vollständiger Kontext. Keine Abkürzungen.“

Centaur wurde nicht dafür konzipiert, die Funktionsweise des Gehirns zu erklären. Stattdessen konzentriert sie sich darauf, das Verhalten von Menschen in Verhaltensstudien zu reproduzieren. Diese Vorhersagekraft hat unmittelbare Auswirkungen auf Forscher, die sich oft auf schmale, handgefertigte Modelle für jede Art kognitiver Funktion verlassen.

Russell Poldrack, Professor für Psychologie an der Stanford University, der nicht an dem Projekt beteiligt war, sieht Centaur als Teil einer größeren Verschiebung im Fachgebiet.

"Historisch gesehen haben wir Modellen stark reduzierte Versionen von Aufgaben gegeben", sagte er IBM Think in einem Interview. „Jetzt können wir ihnen das geben, was wir einem Menschen geben würden, und ein Verhalten beobachten, das dem eines Menschen ähnelt.“

Der Unterschied liegt nicht nur im Ausmaß, sondern auch in der Absicht. Die meisten kognitiven Modelle werden entwickelt, um ein bestimmtes Verhalten zu erklären. Centaur ist darauf ausgelegt, Verhalten in verschiedenen Bereichen zu beobachten und zu replizieren, wie zum Beispiel visuelles Denken und Speicheraufgaben. Das eröffnet die Möglichkeit, neue Muster zu entdecken, die Forscher sonst vielleicht übersehen würden.

In einem Beispiel aus der Studie untersuchte das Team, wie Menschen zwischen Produkten mit mehreren Expertenbewertungen wählen. Das Verhalten von Centaur offenbarte eine zweistufige Strategie: Zunächst schienen die Mitarbeiter die Anzahl der positiven Bewertungen zu zählen und die Glaubwürdigkeit von Experten nur als Kriterium einzusetzen. Diese Erkenntnis führte zu einem neuen, interpretierbaren Modell menschlicher Entscheidungsfindung, das Centaur nach einer gewissen Verfeinerung nachbilden konnte.

„Wir versuchen nicht, kognitive Modelle zu ersetzen“, sagte Binz. „Wir wollen Forschern bessere Tools an die Hand geben, um zu erkunden, was Menschen tun könnten.“