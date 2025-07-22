대부분의 인지 모델은 실험을 원시적인 숫자로 축소합니다. Centaur는 그 반대입니다. Centaur는 자연어 지침과 사람이 응답하는 모든 단계가 포함된 각 작업의 전체 내용을 읽습니다. 이 모델은 시각적 퍼즐과 기억력 테스트부터 도덕적 딜레마와 언어 게임까지 모든 것이 포함된 고전 심리학 문제 모음인 Psych-101이라는 데이터 세트를 학습했습니다. Centaur는 사람과 동일한 정보를 보면서 사람처럼 작업을 수행하는 방법을 배웁니다.

이러한 접근 방식은 학습 데이터를 훨씬 뛰어넘는 일반화를 가능하게 했습니다. 연구자들이 표준 강화 학습 문제를 재구성하여 우주 비행사에서 마법의 양탄자로 프레임을 전환했을 때에도 Centaur는 여전히 동일한 행동 경향을 보였습니다. 또한 LSAT 스타일의 논리 퍼즐과 같은 완전히 새로운 유형의 작업에서도 우수한 성능을 발휘했습니다.

압축된 수치 설명이 아니라, 언어를 사용한 것은 의도적 선택이었습니다. "우리는 모델이 참가자들이 본 것을 볼 수 있기를 원했습니다."라고 Binz는 설명했습니다. "전체 지침과 전체 컨텍스트를 제공했습니다. 어떤 편법도 없었습니다."

Centaur는 뇌의 작동 방식을 설명하기 위해 만들어지지 않았습니다. 대신, 행동 연구에서 사람들이 하는 행동을 재현하는 데 중점을 둡니다. 이러한 예측력은 각 인지 기능 유형에 대해 수작업으로 구축한 좁은 모델에 의존하는 경우가 많은 연구자에게 즉각적인 영향을 미칩니다.

프로젝트에 참여하지 않은 스탠퍼드 대학교 심리학 교수 Russell Poldrack은 Centaur를 이 분야의 더 큰 변화의 일부로 보고 있습니다.

"역사적으로 우리는 모델에 매우 축소된 버전의 작업을 제공했습니다."라고 그는 IBM Think와의 인터뷰에서 말했습니다. "이제 우리는 우리가 사람에게 제공했을 정보를 모델에 동일하게 제공하고 모델이 사람이 했을 법한 행동을 모방하는 반응을 확인할 수 있습니다."

규모뿐 아니라 의도에 있어서도 차이가 있습니다. 대부분의 인지 모델은 특정 행동을 설명하기 위해 구성됩니다. Centaur는 시각적 추론 및 기억 작업과 같은 도메인 전반의 동작을 관찰하고 복제하도록 구축되었습니다. 이를 통해 연구자들이 놓칠 수 있는 새로운 패턴을 발견할 수 있는 가능성이 열립니다.

이 연구의 한 예로, 연구팀은 사람들이 여러 전문가의 평점을 받은 제품 중에서 어떻게 선택하는지 조사했습니다. Centaur의 행동은 2단계 전략을 보여주었습니다. 사람들은 처음에는 긍정적인 평점의 수를 세는 것처럼 보였고 전문가의 신뢰성만을 순위 결정으로 사용했습니다. 이러한 인사이트를 바탕으로 인간의 의사 결정에 대한 해석 가능한 새로운 모델이 탄생했으며, Centaur는 이를 개선한 후 일치시킬 수 있었습니다.

"우리는 인지 모델을 대체하려는 것이 아닙니다."라고 Binz는 말합니다. "우리는 연구자들이 사람들이 무엇을 하고 있는지 탐색할 수 있는 더 나은 도구를 제공하고자 합니다."