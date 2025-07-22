La mayoría de los modelos cognitivos reducen los experimentos a números sin procesar. Centaur hace lo contrario. Lee cada tarea completa, con instrucciones en lenguaje natural y cada paso de la respuesta humana. El modelo se entrenó con un conjunto de datos llamado Psych 101, una colección de problemas clásicos de psicología que incluye desde rompecabezas visuales y pruebas de memoria hasta dilemas morales y juegos de lenguaje. Al ver la misma información que vería una persona, Centaur aprende a seguir la tarea como un humano.

Ese enfoque permitió la generalización mucho más allá de los datos de entrenamiento. Cuando los investigadores reformularon un problema estándar de aprendizaje por refuerzo, cambiando el encuadre de los astronautas a las alfombras mágicas, Centaur siguió exhibiendo las mismas tendencias de comportamiento. También obtuvo buenos resultados en tipos de tareas completamente nuevas, como los rompecabezas lógicos al estilo LSAT.

El uso del lenguaje, en lugar de descripciones numéricas comprimidas, fue deliberado. "Queríamos que el modelo viera lo que veían los participantes", explicó Binz. "Instrucciones completas, contexto completo. Sin atajos.”

Centaur no está diseñado para explicar el funcionamiento del cerebro. En cambio, se centra en reproducir lo que hacen las personas en los estudios del comportamiento. Ese poder predictivo tiene implicaciones inmediatas para los investigadores, que a menudo se basan en modelos estrechos, construidos a mano, para cada tipo de función cognitiva.

Russell Poldrack, profesor de Psicología en la Universidad de Stanford que no participó en el proyecto, considera Centaur como parte de un cambio más amplio en el campo.

"Históricamente, hemos proporcionado a los modelos versiones muy reducidas de las tareas", dijo a IBM Think en una entrevista. "Ahora, podemos darles lo que le daríamos a una persona y ver un comportamiento que refleja lo que haría una persona".

La diferencia no está solo en la escala, sino en la intención. La mayoría de los modelos cognitivos se construyen para explicar un comportamiento específico. Centaur está diseñado para observar y replicar el comportamiento en todos los dominios, como el razonamiento visual y las tareas de memoria. Esto abre la posibilidad de descubrir nuevos patrones que, de otro modo, los investigadores podrían pasar por alto.

En un ejemplo del estudio, el equipo examinó cómo las personas eligen entre productos con múltiples calificaciones de expertos. El comportamiento de Centaur reveló una estrategia de dos pasos: inicialmente, las personas parecían contar el número de calificaciones positivas y solo utilizaban la credibilidad de los expertos como desempate. Ese conocimiento llevó a un nuevo modelo interpretable de toma de decisiones humanas, uno que Centauro pudo igualar tras su refinamiento.

"No pretendemos sustituir los modelos cognitivos", afirmó Binz. "Queremos proporcionar a los investigadores herramientas mejores con las que explorar lo que las personas podrían estar haciendo".