Sebagian besar model kognitif menyederhanakan eksperimen menjadi angka mentah. Centaur melakukan kebalikannya. Centaur membaca setiap tugas secara lengkap, lengkap dengan instruksi bahasa alami dan setiap langkah respons manusia. Model tersebut dilatih pada kumpulan data yang disebut Psych 101, kumpulan masalah psikologi klasik yang mencakup semuanya mulai dari teka-teki visual dan tes memori hingga dilema moral dan permainan bahasa. Dengan melihat informasi yang sama dengan seseorang, Centaur belajar mengikuti tugas seperti manusia.

Pendekatan itu memungkinkan generalisasi jauh melampaui data pelatihan. Ketika para peneliti menulis ulang masalah pembelajaran penguatan standar, mengalihkan pembingkaian dari astronot ke karpet ajaib, Centaur masih menunjukkan kecenderungan perilaku yang sama. Ini juga bekerja dengan baik pada jenis tugas yang sama sekali baru, seperti teka-teki logika gaya LSAT.

Penggunaan bahasa, daripada deskripsi numerik terkompresi, disengaja. “Kami ingin model melihat apa yang dilihat peserta,” jelas Binz. “Instruksi lengkap, konteks lengkap. “Tidak ada jalan pintas.”

Centaur tidak dibangun untuk menjelaskan cara kerja otak. Sebaliknya, Centaur berfokus pada mereproduksi apa yang dilakukan orang dalam studi perilaku. Kekuatan prediktif itu memiliki implikasi langsung bagi para peneliti, yang sering mengandalkan model buatan tangan yang sempit untuk setiap jenis fungsi kognitif.

Russell Poldrack, seorang Profesor Psikologi di Universitas Stanford yang tidak terlibat dalam proyek tersebut, memandang Centaur sebagai bagian dari pergeseran yang lebih besar di bidangnya.

“Secara historis, kami telah memberikan model versi tugas yang sangat berkurang,” katanya kepada IBM Think dalam sebuah wawancara. “Sekarang, kita bisa memberi mereka apa yang akan kita berikan kepada seseorang dan melihat perilaku yang mencerminkan apa yang akan dilakukan seseorang.”

Perbedaannya bukan hanya dalam skala, tetapi dalam niat. Sebagian besar model kognitif dibangun untuk menjelaskan perilaku tertentu. Centaur dibangun untuk mengamati dan mereplikasi perilaku lintas domain, seperti penalaran visual dan tugas memori. Itu membuka kemungkinan menemukan pola-pola baru yang mungkin terlewatkan oleh para peneliti.

Dalam satu contoh dari penelitian ini, tim memeriksa bagaimana orang memilih antara produk dengan beberapa peringkat pakar. Perilaku Centaur mengungkapkan strategi dua langkah: orang awalnya tampaknya menghitung jumlah peringkat positif, dan hanya menggunakan kredibilitas pakar sebagai pemutus. Insight itu mengarah pada model pengambilan keputusan manusia yang baru dan dapat ditafsirkan, yang dapat dicocokkan Centaur setelah penyempurnaan.

“Kami tidak mencoba mengganti model kognitif,” kata Binz. “Kami ingin memberi para peneliti alat yang lebih baik untuk mengeksplorasi apa yang mungkin dilakukan manusia.”