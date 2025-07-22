La plupart des modèles cognitifs réduisent les expériences à des chiffres bruts. Centaur fait le contraire. Il lit chaque tâche dans son intégralité, avec des instructions en langage naturel et chaque étape de la réponse humaine. Le modèle a été entraîné sur un jeu de données appelé Psych 101, une collection de problèmes psychologiques classiques allant des puzzles visuels et des tests de mémoire aux dilemmes moraux et aux jeux de langage. En voyant les mêmes informations qu'une personne, Centaur apprend à suivre la tâche comme un humain.

Cette approche a permis une généralisation bien au-delà des données de formation. Lorsque les chercheurs ont reformulé un problème standard d'apprentissage par renforcement, en remplaçant les astronautes par des tapis volants, Centaur a continué à présenter les mêmes tendances comportementales. Il s’en est également montré performant sur des types de tâches entièrement nouveaux, comme les puzzles logiques de type LSAT.

L’utilisation d’un langage, plutôt que de descriptions numériques compressées, était délibérée. « Nous voulions que le mannequin voie ce que les participants voyaient », a expliqué M. Binz. « Instructions complètes, contexte complet. Pas de raccourcis. »

Centaur n'est pas conçu pour expliquer le fonctionnement du cerveau. Il s’agit plutôt de reproduire ce que les gens font dans les études comportementales. Ce pouvoir prédictif a des implications immédiates pour les chercheurs, qui s’appuient souvent sur des modèles étroits et construits à la main pour chaque type de fonction cognitive.

Russell Poldrack, professeur de psychologie à l'université de Stanford, qui n'a pas participé au projet, considère que Centaur s'inscrit dans le cadre d'une évolution plus large dans ce domaine.

« Historiquement, nous avons donné aux modèles des versions très réduites des tâches », a-t-il déclaré lors d'un entretien avec IBM Think. « Maintenant, on peut leur donner ce qu’on donnerait à une personne et voir un comportement qui reflète ce qu’une personne ferait. »

La différence ne réside pas seulement dans l'échelle, mais aussi dans l'intention. La plupart des modèles cognitifs sont construits pour expliquer un comportement spécifique. Centaur est conçu pour observer et reproduire des comportements dans différents domaines, tels que le raisonnement visuel et les tâches de mémoire. Cela ouvre la possibilité de découvrir de nouveaux modèles que les chercheurs pourraient ignorer autrement.

Dans un exemple tiré de l'étude, l'équipe a examiné la manière dont les utilisateurs choisissent entre des produits évalués par plusieurs experts. Le comportement de Centaur révélait une stratégie en deux étapes : les gens semblaient d’abord compter le nombre de notes positives, et n’utilisaient que la crédibilité des experts comme critère d’égalité. Cette informations a donné naissance à un nouveau modèle interprétable de prise de décision humaine, que Centaur a réussi à égaler après l'avoir affiné.

« Nous n'essayons pas de remplacer les modèles cognitifs », explique Binz. « Nous voulons donner aux chercheurs de meilleurs outils pour découvrir ce que les gens peuvent faire. »