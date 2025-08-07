추론 모델은 사용자의 입력에 대한 직접적인 응답을 즉시 생성하는 대신 사용자에게 제공되는 최종 답변에 도달하기 전에 먼저 중간 '추론 단계'를 생성하도록 학습됩니다. 일부 추론 LLM은 사용자에게 추론 흔적을 보여주는 반면, 다른 LLM은 이러한 중간 아웃풋만 요약하거나 완전히 숨깁니다.

간단히 말해서, 추론 LLM은 응답하기 전에 '생각'하는 데 더 많은 시간을 할애하도록 학습됩니다. 이 '추론 프로세스'를 추가하면 복잡한 추론 작업에서 LLM의 성능이 크게 향상되는 것으로 경험적으로 나타났습니다. 이러한 성공은 AI 모델을 적용할 수 있는 실제 사용 사례와 영역을 확장하여 생성형 AI 및 AI 에이전트의 지속적인 개발에 중요한 변곡점을 마련했습니다.

그러나 모델의 '사고 과정'과 같은 의인화된 용어가 문자 그대로의 용어보다 더 편리하다는 점은 주목할 가치가 있습니다. 모든 머신 러닝 모델과 마찬가지로 추론 모델도 궁극적으로 학습 데이터에서 학습한 패턴을 반영하여 다음에 어떤 단어가 와야 하는지와 같은 예측을 수행하기 위해 정교한 알고리즘을 적용하는 것입니다. 추론 LLM은 인공 일반 지능(AGI)의 의식이나 기타 징후를 보여주지 않았습니다. Apple이 2025년 6월에 발표한 AI 연구에 따르면 현재 모델 추론 능력이 진정으로 '일반화 가능한' 추론으로 확장될 수 있는지에 대해 의문이 제기됩니다.1

추론 LLM은 인간의 사고 과정과 유사한 일련의 토큰(단어)을 생성하여 '자신의 작업을 보여주도록' 학습되었으며, 이러한 생각을 '언어화'하는 행위는 잠재된 추론 기능, 즉 LLM이 방대한 학습 데이터(개인이 자신의 과정을 직간접적으로 표현하는 예시를 포함)에서 암묵적으로 학습하는 능력을 해금한다고 말하는 것이 가장 정확할 것입니다.

'추론 모델'이라는 개념은 2024년 9월 OpenAI의 o1-preview(및 o1-mini)에 의해 도입되었으며2 11월에 Alibaba의 'Qwen with Quesque'(QWQ-32B-Preview), 12월에는 Google의 Gemini 2.0 플래시 실험이 그 뒤를 이었습니다. 추론 LLM 개발에 있어서 중요한 이정표는 2025년 1월에 오픈 소스 DeepSeek-R1 모델이 출시된 것입니다. 이전 추론 모델을 미세 조정하는 데 사용된 학습 프로세스는 기밀로 유지되었지만 DeepSeek는 다른 모델 개발자를 위한 청사진을 제공하는 상세한 기술 문서를 발표했습니다. 그 이후로 IBM Granite, Anthropic, Mistral AI 등이 자체 추론 LLM을 출시했습니다.