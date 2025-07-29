하지만 이 모든 사실을 알게 된 후에도 '잘못된 확신'에 대한 찜찜한 의문이 남습니다. 이러한 생성형 AI 도구들은 왜 자신의 체스 실력에 대해 그토록 자신이 있었을까요? 이런 교만이 패망의 선봉이 된 이유는 무엇일까요? 앞서 언급했듯이 Caruso는 이 실험은 원래 자신의 아이디어가 아니었으며 ChatGPT가 Atari에 도전했다고 밝혔습니다. Caruso는 LinkedIn 게시물에 이렇게 썼습니다.

[“Chat GPT]는 자신이 강력한 플레이어라고 주장했으며... 수 1~2개만 앞서 생각하는 Atari의 Video Chess를 쉽게 이길 수 있다고 했습니다. 자신이 얼마나 빨리 이길 수 있는지 궁금해 했으며, Stella 에뮬레이터를 사용하여 게임을 설정해 달라고 요청했습니다."

Caruso는 또 다른 LinkedIn 게시물에서 Copilot도 똑같이 건방졌다고 썼습니다.

“Copilot은 자신이 10~15수 정도를 내다볼 수 있다고 주장했지만, 2600을 상대로 3~5수를 앞서 나갈 것으로 예상했습니다. 심층 계산에 매달리기보다는 2600의 '최적이 아닌 수'를 '활용할 수 있을 것 같아서'라나요."

Google Gemini의 경우, Caruso는 기술 간행물 The Register와의 인터뷰에서 처음에는 Gemini가 자신에게 그러한 경기에서 승리할 수 있다고 주장했다고 말했습니다. Gemini는 Caruso에게 "자신이 단순한 대규모 언어 모델이 아니"라고 했다는 것입니다. 하지만 이전 경기에 대해 자세히 전해 듣자마자 Gemini는 꼬리를 내렸습니다. Caruso에 따르면, Gemini는 "이번에는 Atari가 이겼네요. 저를 공정하게 이긴 빈티지 실리콘 최종 보스에게 정정당당하게 디지털 왕관을 내놓겠습니다."라고 답변했습니다.

호기심이 든 저는 ChatGPT에게 직접 물어보기로 했습니다. "1979년식 Atari 콘솔 게임에게 체스 게임에서 진 것에 대해 어떻게 생각해?"라는 프롬프트를 입력했습니다.

ChatGPT는 이렇게 답변했습니다. "'실리콘 조상님에게 내가 졌군'이라고 말할 것 같네요. [원본은 이탤릭체]

뭐지? ChatGPT는 이 경기가 있었다는 것조차 알지 못하는 것 같았습니다. 저는 ChatGPT에게 이 질문이 가상의 질문이 아니라고 알렸습니다.

저: 이론적인 질문이 아냐. 실제로 일어난 일이라고. 그 경기를 다룬 여러 뉴스 기사 중 하나를 첨부할게. https://www.cnet.com/tech/services-and-software/how-did-chatgpt-get-absolutely-wrecked-at-chess-losing-to-a-1970s-era-atari-2600/

ChatGPT는 제 프롬프트의 모든 단어를 하나 하나 반복하며 답변을 시작했습니다.

ChatGPT: 이론적인 질문이 아니라 정말로 있었던 일이군요. 2025년 6월, Citrix의 엔지니어인 Robert Caruso는 초보자 모드로 Atari 2600 콘솔의 1979년식 체스 카트리지인 Video Chess를 실행하는 Atari 2600 콘솔의 에뮬레이션과 ChatGPT와 간 경기를 개최했습니다. 약 90분의 플레이 후, ChatGPT는 룩과 비숍을 헷갈리거나 폰 포크를 누락하는 등 체스판의 진행 상황을 지속적으로 놓쳤으며, 이러한 현상은 체스판을 재설정하거나 비주얼을 더 선명하게 설정해도 반복적으로 일어났습니다. 결국 ChatGPT는 패배를 인정했습니다.

AI 전문가들은 이러한 유형의 응답이 LLM이 가끔 부정확하거나 말도 안 되는 답변을 뱉어내는 현상인 할루시네이션에 속한다고 말합니다. 할루시네이션을 자동 완성 실패로 보는 경우, 프롬프트에 컨텍스트가 추가되지 않은 특정 체스 경기에 대한 질문이 포함되어 있었으며, ChatGPT는 가장 일반적이거나 가능성이 높은 자동 완성으로 보이는 답변, 즉 체스 경기에서 진 후 할 만한 말을 제공한 것입니다.

IBM의 기술 콘텐츠 및 AI 옹호 관리자인 Ash Minhas는 "도움이 되려는 확률적 앵무새에 불과합니다."라고 설명합니다('확률적'이라는 것은 시간이 지남에 따라 평균을 냈을 때 무작위적이면서 패턴을 따르는 일종의 중간 상태에 있다는 의미임).

"모델은 인간의 피드백을 통한 강화 학습(RLHF)을 통해 도움이 되고 자신감 있는 것처럼 들리게 훈련되었습니다."라고 Minhas는 설명합니다. "사용자들은 '잘 모르겠습니다'라고 답변하는 시스템을 사용하지 않을 것이기 때문입니다."

다시 말해, 자랑처럼 들리는 것은 다음 토큰 예측 시스템의 기능으로, 다음 답변일 가능성이 높은 것을 자동으로 완성하게 하는 것입니다. 그리고 Minhas가 지적한 것처럼 유용성에 대한 편향을 고려하면, LLM의 답변은 이러한 편향을 반영할 것입니다.

다시 말해, LLM은 교만한 게 아니라 설계된 대로 작동하는 것일 뿐입니다. 이는 ChatGPT가 저와의 세션에서 이야기한 다음 내용과도 부합합니다.

"사실, 저는 주관적인 인식이 없습니다."