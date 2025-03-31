OpenAI의 o1, DeepSeek-R1, Google의 Gemini 2.5와 같은 추론 모델들이 최고 수준의 AI 성능 벤치마크를 두고 경쟁하고 있습니다. 이에 따라 AI를 도입하려는 기업들은 ‘모델 팽창(model bloat)’이라 불리는 현상 즉, 모델이 불필요하게 커지거나 복잡해져 계산 비용과 학습 시간이 증가하고 기업이 필요로 하는 응답을 제공하는 속도가 느려지는 문제에 대해 점점 더 경계하고 있습니다.

OpenAI의 o1과 DeepSeek-R1은 생각의 연결고리(CoT) 추론 방식을 복잡한 문제를 단계별로 나누어 해결함으로써 기존 모델을 능가하는 전례 없는 성능과 더 높은 정확도를 보여주고 있습니다. 그러나 CoT는 추론 과정에서 상당한 연산 자원을 요구해 출력이 길어지고 지연 시간이 증가한다고 IBM의 부사장이자 AI Infrastructure Portfolio 운영 책임자인 Volkmar Uhlig는 IBM Think와의 인터뷰에서 설명합니다.

다양한 최신 연구에서는 사고 원자(AoT)와 초안 사슬(CoD)을 포함한 새로운 프롬프팅 기법들이 제안되고 있습니다. 이러한 기법들은 모델이 문제를 더 빠르게 해결하도록 유도함으로써 CoT의 효율성과 정확성을 향상시키고 동시에 비용과 지연 시간을 줄이는 것을 목표로 합니다.

AI 과학자이자 스타트업 창립자인 Lance Elliott은 이러한 생각의 연결고리의 새로운 변형 기법들을 프롬프트 엔지니어가 활용할 수 있는 도구 세트의 한 형태로 보고 있습니다. 그는 IBM Think에 “일반적인 가정용 수작업 도구 세트에는 보통 망치가 포함되어 있습니다. 이는 CoT에 해당합니다.”라고 설명합니다. "AoT는 건식 벽체 절단 및 조정을 위한 특수 망치를 사용하는 것에 비유할 수 있습니다. 석고보드 작업에 일반 망치를 사용할 수도 있지만 석고보드 망치가 있고 이를 올바르게 사용할 수 있다면 해당 망치를 사용하는 것이 더 좋습니다."

IBM의 AI 기술 솔루션 아키텍트인 Vyoma Gajjar는 특히 “소형 모델이 특정 사용 사례에서 정확한 답변을 내도록 유도할 수 있는, 보다 비용 효율적인 방법을 찾고 있는” 기업들에게 이러한 새로운 CoT 계열 접근법이 잠재력이 있다고 말합니다.