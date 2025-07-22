A maioria dos modelos cognitivos reduz os experimentos a números brutos. O Centaur faz o oposto. Ele lê cada tarefa na íntegra, com instruções em linguagem natural e cada etapa da resposta humana. O modelo foi treinado em um conjunto de dados chamado Psycho 101, uma coleção de problemas clássicos de psicologia que inclui tudo, desde quebra-cabeças visuais e testes de memória até dilemas morais e jogos de linguagem. Ao ver as mesmas informações que uma pessoa veria, o Centaur aprende a seguir a tarefa como um humano.

Essa abordagem permitiu a generalização muito além dos dados de treinamento. Quando os pesquisadores reformularam um problema padrão de aprendizado por reforço, mudando o enquadramento de planetas para tapetes mágicos, o Centaur ainda exibia as mesmas tendências comportamentais. Ele também teve um bom desempenho em tipos totalmente novos de tarefas, como quebra-cabeças lógicos no estilo LSAT.

O uso de linguagem, em vez de descrições numéricas comprimidas, foi deliberado. “Queríamos que o modelo visse o que os participantes viam”, explicou Binz. "Instruções completas, contexto completo. Sem atalhos."

O Centaur não foi criado para explicar o funcionamento do cérebro. Em vez disso, concentra-se em reproduzir o que as pessoas fazem em estudos comportamentais. Esse poder preditivo tem implicações imediatas para os pesquisadores, que muitas vezes confiam em modelos restritos e construídos à mão para cada tipo de função cognitiva.

Russell Poldrack, Professor de Psicologia na Stanford University que não esteve envolvido no projeto, vê o Centaur como parte de uma mudança maior no campo.

"Historicamente, temos dado aos modelos versões altamente reduzidas de tarefas", disse ele ao IBM Think em uma entrevista. "Agora, podemos dar a eles o que daríamos a uma pessoa e ver um comportamento que reflete o que uma pessoa faria."

A diferença não está apenas na escala, mas na intenção. A maioria dos modelos cognitivos é construída para explicar um comportamento específico. O Centaur foi desenvolvido para observar e replicar comportamentos em várias áreas, como raciocínio visual e tarefas de memória. Isso abre a possibilidade de descobrir novos padrões que, de outra forma, os pesquisadores poderiam perder.

Em um exemplo do estudo, a equipe examinou como as pessoas escolhem entre produtos com várias classificações de especialistas. O comportamento do Centaur revelou uma estratégia de duas etapas: inicialmente, as pessoas pareciam contar o número de avaliações positivas e apenas usaram a credibilidade do especialista como desempate. Essa insight levou a um novo modelo interpretável de tomada de decisão, um que o Centaur foi capaz de igualar após refinamento.

"Não estamos tentando substituir os modelos cognitivos", disse Binz. "Queremos dar aos pesquisadores ferramentas melhores para explorar o que as pessoas podem estar fazendo."