생각의 사슬(CoT - Chain of Thought) 프롬프트란 무엇인가요?

작성자

Vrunda Gadesha

AI Advocate | Technical Content Author

Eda Kavlakoglu

Business Development + Partnerships

IBM Research

Vanna Winland

AI Advocate & Technology Writer

생각의 연결고리(CoT)는 특히 다단계 추론과 관련된 복잡한 작업의 경우 대규모 언어 모델(LLM)의 아웃풋을 향상시키는 프롬프트 엔지니어링 기법입니다. CoT는 일관된 일련의 논리적 단계를 사용하여 단계별 추론 프로세스를 통해 모델을 안내함으로써 문제 해결을 용이하게 합니다. 

프롬프트 엔지니어링은 인공 지능에서 입력(프롬프트)을 개선하여 가장 정확한 모델 출력을 얻는 데 사용됩니다. 본 연구에서는 LLM에서 추론을 이끌어내는 생각의 연결고리 프롬프트의 개념을 소개합니다.1 본문은 모델이 중간 추론 단계를 생성하도록 프롬프트하면 산술, 상식 및 기호 추론과 같은 다단계 문제를 정확하게 해결하는 능력이 크게 향상된다고 주장합니다. 

연구원들은 자연어로 "큰 소리로 생각하는" LLM의 능력에 영감을 받았으며, 매개변수 크기가 증가함에 따라 추론 능력과 정확도도 증가한다는 점에 주목했습니다. 이러한 이유로 CoT 프롬프트는 신생 능력 또는 모델 크기나 복잡성이 확장됨에 따라 나타나는 능력으로 간주됩니다. 대규모 LLM은 대규모 데이터 세트에 대한 훈련을 통해 더 미묘한 추론 패턴을 학습했으므로 더 나은 성과를 내는 경향이 있습니다. 

그러나 모델 크기를 늘리는 것만이 다양한 벤치마크에서 문제 해결 정확도를 향상하는 유일한 방법은 아닙니다. 명령 조정의 발전으로 더 작은 모델에서도 CoT 추론을 수행할 수 있게 되었습니다. 예를 들어, IBM® Granite Instruct 모델은 CoT 작업에 대한 지침 프롬프트와 예시로 구성된 전문 학습 데이터 세트를 사용하여 미세 조정됩니다. 예시는 모델이 이상적인 대응 방법으로 사용하는 프롬프트 예시입니다.

AI가 텍스트를 생성하는 데 사용하는 두 가지 방법을 비교하는 프롬프트 체이닝과 생각의 연결고리.

CoT 프롬프트가 효과적인 이유는 무엇인가요?

생각의 연결고리 프롬프트는 정교한 문제를 관리 가능한 중간 단계로 세분화하여 순차적으로 결론에 도달하는 인간과 유사한 추론 과정을 시뮬레이션합니다.2 이 단계별 문제 해결 구조는 추론 프로세스가 명확하고 논리적이며 효과적인지 확인하는 것을 목표로 합니다.

표준 프롬프트 형식에서 모델 아웃풋은 보통 제공된 입력에 대한 직접적인 답변입니다. 예를 들어, "하늘은 무슨 색이야?"라고 질문하는 입력 프롬프트를 제공하면 AI는 "하늘은 파란색입니다."와 같은 간단하고 직접적인 답변을 생성합니다. 

그러나 CoT 프롬프트를 사용하여 하늘이 파란색인 이유를 설명해 달라고 요청하면, AI는 먼저 '파란색'의 의미(원색)를 정의한 다음 대기에 의해 다른 색이 흡수되어 하늘이 파란색으로 보인다고 추론할 것입니다. 이 답변은 논리적 논증을 구성하는 AI의 능력을 보여줍니다.

프롬프트를 구성하기 위해 사용자는 일반적으로 프롬프트 끝에 지침을 추가합니다. 사용자는 일반적으로 프롬프트에 "추론 단계를 설명해 줘" 또는 "답변을 단계별로 설명해 줘"와 같은 지침을 추가합니다. 본질적으로 이 프롬프트 기술은 LLM에게 결과를 생성할 뿐만 아니라 해당 답변이 도출된 일련의 중간 단계를 자세히 설명하도록 요청합니다.3

프롬프트 체이닝은 복잡한 작업을 분해하기 위해 순차적으로 여러 프롬프트를 구축하여 신뢰성을 개선하는 데 자주 사용되는 또 하나의 방법입니다. 프롬프트 체이닝 및 CoT와 같은 기술은 모델이 단순히 옳게 들리는 답변으로 넘어가는 대신 문제를 단계별로 추론하도록 안내합니다. 이 방법은 모델의 추론을 보다 투명하게 만들도록 장려하므로 관측 가능성 및 디버깅에도 도움이 될 수 있습니다. 이러한 방법의 주요 차이점은 프롬프트 체인은 여러 프롬프트를 시퀀싱하여 작업을 단계별로 분류하는 반면, CoT 프롬프트는 단일 프롬프트 내에서 모델의 추론 프로세스를 이끌어낸다는 것입니다.

생각의 연결고리 프롬프트는 어떻게 작동하나요?

생각의 연결고리 프롬프트는 대규모 언어 모델(LLM)을 활용하여 추론 단계의 연속을 표현하고, 이를 통해 모델이 새로운 작업에 대해 유사한 추론의 연결고리를 생성하도록 모델을 안내합니다. 추론 과정을 설명하는 예시 기반 프롬프트를 통해 이루어지며, 이는 복잡한 추론 과제를 해결하는 모델의 역량을 향상합니다.4 다항식 방정식을 푸는 고전적인 수학 단어 문제를 예로 들어 이 프롬프트 기법의 흐름을 이해해 보겠습니다.

예: 다항식 방정식을 풀 때 생각의 연결고리 프롬프트는 어떻게 작동하나요?

생각의 연결고리(CoT) 프롬프트는 LLM이 일련의 논리적 단계를 따르도록 안내하여 문제 해결 과정을 세분화함으로써 다항식 방정식을 푸는 데 큰 도움을 줄 수 있습니다.5 CoT 프롬프트가 다항식 방정식을 어떻게 해결할 수 있는지 살펴보겠습니다.

이차 방정식을 푸는 예제를 살펴보세요.

입력 프롬프트: 다음 2차 방정식을 풀어보세요. x2 - 5x + 6 = 0

이 프롬프트를 IBM® watsonx.ai 채팅에 입력하면 사람의 질문과 AI 지원의 답변 사이에 다음과 같은 대화가 오가는 것을 볼 수 있습니다.

생각의 연결고리 방정식 프롬프트 방정식

이러한 유형의 출력을 생성하기 위해 CoT 기본 사항은 다음 이미지와 같이 작동합니다. 생각의 연결고리의 최종 대답은 "방정식 x2 − 5x + 6 = 0에 대한 해는 x = 3 x = 2"입니다.

생각의 연결고리 방정식 이미지

생각의 연결고리 변형

생각의 연결고리(CoT) 프롬프트는 다양한 혁신적 변형으로 발전해 왔으며 각각은 특정 문제를 해결하고 고유한 방식으로 모델의 추론 능력을 향상하도록 맞춤화되었습니다. 이러한 조정은 다양한 도메인에서 CoT의 적용 가능성을 확장할 뿐만 아니라 모델의 문제 해결 프로세스를 개선합니다.6

제로샷 생각의 연결고리

제로샷 생각의 연결고리 방식은 모델에 내재된 지식을 활용하여 당면한 작업에 대한 사전 특정 예제나 미세 조정 없이 문제를 해결하는 방식입니다. 이 접근 방식은 맞춤형 교육 데이터를 사용할 수 없는 경우의 새롭거나 다양한 문제 유형을 다룰 때 특히 유용합니다.7또한 표준 프롬프트와 퓨샷 프롬프트의 속성을 활용할 수 있습니다.

예를 들어, "프랑스와 국경을 접하고 있고 빨간색과 흰색으로 된 국기가 있는 국가의 수도는 어디입니까?"라는 질문이 있을 때 제로 샷 CoT를 사용하는 모델은 해당 쿼리에 대해 명시적으로 학습하지 않았어도 내장된 지리 및 국기 지식을 활용하여 스위스로 이어지는 단계를 정답으로 추론합니다.

자동 생각의 연결고리

자동 생각의 연결고리(auto-CoT)는 효과적인 추론 경로의 생성 및 선택을 자동화하여 프롬프트를 만드는 데 드는 수작업을 최소화하는 것을 목표로 합니다. 또한 더 광범위한 작업과 사용자를 지원하기 위해 CoT 프롬프트의 확장성과 접근성을 향상시킵니다.8, 9

예를 들어, "5개의 사과를 구입했고 이미 3개의 사과를 갖고 있었다면 사과는 총 몇 개입니까?"와 같은 수학 문제를 풀기 위해 자동 CoT 시스템은 "3개의 사과로 시작" 및 "기존 3개에 5개의 사과 추가"와 같은 중간 단계를 자동으로 생성하여 "총 사과 = 8"로 마무리하며 사람의 개입 없이 추론 과정을 간소화합니다.

멀티모달 생각의 연결고리

멀티모달 생각의 연결고리는 CoT 프레임워크를 확장하여 텍스트 및 이미지와 같은 다양한 양식의 입력을 통합하여 모델이 복잡한 추론 작업을 위해 다양한 유형의 정보를 처리하고 통합할 수 있도록 합니다.10

예를 들어, 붐비는 해변 풍경의 사진을 제시하고 "이 해변이 여름에 인기가 있을 것 같습니까?"라고 물었을 때, 멀티모달 CoT를 사용하는 모델은 시각적 단서 (해변 점유율, 기상 조건 등 포함)와 계절적 인기에 대한 텍스트 이해를 분석하여 상세한 답변을 추론하고, "해변이 붐비고 있으므로 인기가 높다는 것을 나타내며 여름에 더 증가할 가능성이 있습니다."라는 답변을 할 수 있습니다.

이러한 생각의 연결고리 프롬프트의 변형은 CoT 접근 방식의 유연성과 적응성을 보여줄 뿐 아니라 AI 추론 및 문제 해결 능력에서 향후 발전할 잠재력이 크다는 것을 시사합니다.

AI 아카데미

AI 전문가 되기

비즈니스 성장을 주도하는 AI 투자의 우선순위를 정할 수 있는 지식을 확보하세요. 지금 바로 무료 AI 아카데미를 시작하고 조직에서 AI의 미래를 주도하세요.

장점 및 제한 사항

CoT 프롬프트는 복잡한 추론 작업에서 대규모 언어 모델(LLM)의 성능을 향상하는 강력한 기술로, 다양한 영역에서 향상된 정확성, 투명성, 다단계 추론 능력과 같은 상당한 이점을 제공합니다. 그러나 고품질 프롬프트의 필요성, 계산 비용 증가, 적대적 공격에 대한 취약성, 추론 또는 이해의 질적 향상 평가의 어려움 등 제한 사항을 고려하는 것이 중요합니다. 이러한 제한 사항을 해결함으로써 연구자와 실무자는 다양한 응용 분야에서 CoT 프롬프트를 책임감 있고 효과적으로 배포할 수 있습니다.11

생각의 연결고리 프롬프트의 장점

사용자는 생각의 연결고리 프롬프트 내에서 여러 가지 이점을 누릴 수 있습니다. 예를 들면 다음과 같습니다.

  • 향상된 프롬프트 출력: CoT 프롬프트는 복잡한 추론 작업을 더 간단하고 논리적인 단계로 세분화하여 LLM의 성능을 향상시킵니다.
  • 투명성 및 이해: 중간 추론 단계를 생성하면 모델이 결론에 도달하는 방식에 대한 투명성이 제공되어 사용자가 의사 결정 프로세스를 더 쉽게 이해할 수 있습니다.
  • 다단계 추론: CoT 프롬프트는 문제의 각 구성 요소를 체계적으로 처리하여, 특히 다단계 추론이 필요한 작업에서 더 정확하고 신뢰할 수 있는 답을 도출하곤 합니다. 다단계 추론이란 복잡한 논리 연산을 순차적인 단계로 더 잘게 나누어 수행하는 작업을 일컫습니다. 이는 복잡한 문제를 해결하고, 결정을 내리고, 인과 관계를 이해하는 데 필수적인 인지 기술입니다. 
  • 세부 사항에 대한 주의: 단계별 설명 모델이 상세한 분석을 통해 이해를 촉진하는 교수법과 유사하므로 CoT 프롬프트는 교육적 맥락에서 유용합니다.
  • 다양성: CoT는 산술 추론, 상식 추론, 복잡한 문제 해결을 포함하되 이에 국한되지 않는 광범위한 작업에 적용할 수 있어 유연한 활용성을 보여줍니다.

생각의 연결고리 프롬프트의 한계

생각의 연결고리를 도입하는 과정에서 발생하는 몇 가지 제한 사항은 다음과 같습니다.
  • 품질 관리: CoT 프롬프트의 효과는 제공된 프롬프트의 품질에 크게 좌우되므로 모델을 정확하게 안내하기 위해 신중하게 제작된 예제가 필요합니다.
  • 고도의 연산 능력: 여러 추론 단계를 생성하고 처리하려면 표준 단일 단계 프롬프트에 비해 더 많은 연산 능력과 시간이 필요합니다. 따라서 어느 조직에서든 이 기술을 도입하는 데 더 많은 비용이 듭니다.
  • 개념의 오해: 그럴듯하지만 부정확한 추론 경로를 생성하여 오해의 여지가 있거나 잘못된 결론으로 이어질 위험이 있습니다.
  • 비용이 많이 들고 노동 집약적: 효과적인 CoT 프롬프트를 설계하는 것은 더 복잡하고 노동 집약적일 수 있으므로 문제 도메인과 모델의 기능에 대한 깊은 이해가 필요합니다.
  • 모델 과적합: 프롬프트의 추론 스타일이나 패턴에 모델이 과적합하여 다양한 작업에 대한 일반화 능력이 저하될 수 있는 잠재적 위험이 있습니다.
  • 평가 및 검증: CoT는 해석 가능성과 정확성을 향상할 수 있지만 추론 또는 이해의 질적 향상을 측정하는 것은 어려울 수 있습니다. 인간 인식의 내재적 복잡성과 언어 표현 평가의 주관적 특성 때문입니다. 그러나 CoT 프롬프트의 효과를 평가하기 위해 몇 가지 접근 방식을 사용할 수 있습니다. 예를 들어, 모델의 응답을 기준 모델 또는 인간 전문가의 응답과 비교하면 상대적인 성능 향상에 대한 통찰력을 얻을 수 있습니다. 또한 LLM에 의해 생성된 중간 추론 단계를 분석하면 추론 또는 이해의 향상을 직접 측정하기는 어려워도 의사 결정 프로세스에 대한 귀중한 통찰력을 얻을 수 있습니다.
     

생각의 연결고리의 발전

생각의 연결고리(CoT)의 진화는 여러 도메인, 특히 자연어 처리(NLP), 머신 러닝, 급성장하는 생성형 AI 분야에서 시너지를 일으키며 발전할 수 있다는 것을 보여주는 증거입니다. 이러한 발전으로 CoT는 복잡한 문제 해결의 최전선에 서게 되었을 뿐 아니라 다양한 응용 분야에서 CoT의 유용성이 부각되었습니다. CoT의 현황을 포괄적으로 이해하기 위해 지정된 용어를 포함해 주요 발전 현황을 자세히 살펴보겠습니다.

프롬프트 엔지니어링 및 원본 프롬프트

프롬프트 엔지니어링의 혁신으로 인해 모델의 이해도와 원본 프롬프트와의 상호 작용이 크게 향상되어 보다 미묘하고 맥락에 맞는 추론 경로를 도출할 수 있게 되었습니다. 이러한 발전은 CoT의 효과를 개선하는 데 매우 중요한 역할을 했습니다.12

상징적 추론과 논리적 추론

상징적 추론 작업과 논리적 추론 작업으로의 통합을 통해 추상적인 사고와 추론을 위한 모델의 역량을 향상시켜서, CoT로 논리 기반 난제를 해결하는 데 있어 상당한 도약을 이루었습니다.13

예를 들어, 상징적 추론은 2 + 3 = 5와 같은 수학 방정식을 푸는 것입니다. 이 경우 문제는 구성 부분(덧셈 및 숫자)으로 분류되고 모델은 학습된 지식과 추론 규칙을 기반으로 정답을 추론합니다. 반면에 논리적 추론은 "모든 새는 날 수 있고 펭귄은 새"와 같은 전제나 가정에서 결론을 도출하는 것을 포함합니다. 모델은 제공된 정보를 기반으로 펭귄이 날 수 있다고 판단합니다. CoT 프롬프트를 상징적 추론 및 논리적 추론 작업에 통합함으로써 LLM은 향상된 추상적 사고 및 추론 능력을 입증하여 더 복잡하고 다양한 문제를 해결할 수 있게 되었습니다.

창의력 향상

생성형 AI트랜스포머 아키텍처의 적용은 CoT에 혁신을 가져왔으며, 창의성과 깊이를 보여주는 정교한 추론 경로를 생성할 수 있게 되었습니다. 이러한 시너지 효과는 CoT의 적용 범위를 넓혀 학문과 실무 영역 모두에 영향을 미쳤습니다.14

더 작은 모델과 자체 일관성

소규모 모델이 CoT 추론에 효과적으로 관여할 수 있도록 발전함에 따라 정교한 추론 기능의 이용이 보편화되었습니다. CoT 내의 자체 일관성에 중점을 두면 생성된 경로의 논리적 건전성을 보장하여 모델에 의해 도출된 결론의 신뢰성을 높일 수 있습니다.15

생각의 연결고리 사용 사례

복잡한 문제를 이해하기 쉬운 추론 단계로 분해하는 생각의 연결고리(CoT) 방법론은 다양한 분야에 걸쳐 적용되고 있습니다. 이러한 사용 사례는 CoT의 범용성을 보여줄 뿐만 아니라 CoT가 시스템에서 문제 해결 및 의사 결정 작업에 접근하는 방식을 변화시킬 수 있는 잠재력이 있음을 입증합니다. 다음 섹션에서는 CoT가 효과적으로 적용된 몇 가지 대표적인 사용 사례를 살펴보겠습니다.

AI 어시스턴트

챗봇에 CoT를 통합하고 최첨단 NLP 기술을 활용하여 대화형 AI를 혁신함으로써 챗봇이 더 깊은 수준의 이해와 문제 해결 능력이 필요한 더 복잡한 상호 작용을 수행할 수 있게 되었습니다.

이러한 발전은 종합적 관점에서 CoT 기능의 비약적인 발전, 챗봇과 CoT 모델 통합의 중요성을 상징하며 AI 기반 의사 결정과 문제 해결 과정에 혁신을 일으킬 수 있는 잠재력을 강조합니다. 챗봇의 대화 기능과 CoT 모델의 고급 추론 기능을 결합하면 더 폭넓은 작업과 애플리케이션을 처리할 수 있는, 더욱 정교하고 효과적인 AI 시스템을 만들 수 있습니다.

또한 다양한 애플리케이션과 CoT 모델의 통합은 AI 시스템이 사용자의 요구와 선호도를 더 잘 이해하고 이에 대응할 수 있도록 함으로써 전반적인 사용자 경험을 향상시킬 수 있습니다. 자연어 처리(NLP) 기술을 CoT 모델에 통합하면 챗봇이 보다 인간과 유사한 방식으로 사용자 입력을 이해하고 응답하여 더욱 직관적이고 효과적이며 사용자의 참여도가 높은 대화 환경을 만들 수 있습니다.

고객 서비스 챗봇

고급 챗봇은 CoT를 활용하여 고객 문의를 더 정확히 이해하고 해결합니다. 챗봇은 고객의 문제를 작고 관리하기 쉬운 부분으로 나누어 더욱 정확하고 도움이 되는 답변을 제공할 수 있으며, 결과적으로 고객 만족도가 향상되고 인간의 개입 필요성은 줄어듭니다.

연구 및 혁신

연구자는 CoT를 사용하여 복잡한 과학적 문제 해결에서 사고 과정을 구조화함으로써 혁신을 촉진합니다. 이러한 구조화된 접근 방식은 발견 프로세스를 가속화하고 새로운 가설의 수립을 지원합니다.

콘텐츠 제작 및 요약

콘텐츠 생성에서 CoT는 생각과 정보를 논리적으로 구성하여 구조화된 개요 또는 요약을 생성하는 데 도움을 주고 서면 콘텐츠의 일관성과 품질을 높여줍니다.

교육 및 학습

CoT는 교육 기술 플랫폼에서 복잡한 문제에 대한 단계별 설명을 생성하는 데 도움을 주며 중요한 역할을 합니다. 이 능력은 과정을 이해하는 것이 최종 답을 구하는 것만큼이나 중요한 수학 및 과학과 같은 과목에서 특히 가치가 있습니다. CoT 기반 시스템은 학생에게 문제 해결 절차를 안내하여 이해력과 기억력을 향상시킬 수 있습니다.

AI 윤리 및 의사 결정

CoT는 특히 윤리적 고려가 필요한 시나리오에서 AI 기반 의사 결정 이면의 추론 과정을 명확히 설명하는 데 매우 중요합니다. CoT는 투명한 추론 경로를 제공함으로써 AI 의사 결정이 윤리적 기준과 사회적 규범에 부합하도록 보장합니다.

이러한 사용 사례는 다양한 부문에서 CoT의 혁신적인 잠재력을 부각하며, 문제 해결 및 의사 결정 프로세스를 재정의할 수 있는 CoT의 능력을 엿볼 수 있습니다. CoT가 계속 발전함에 따라 응용 분야가 확장되어 이 방법론을 기술 및 사회 발전의 구조에 포함하게 될 것으로 예상됩니다.

생각의 연결고리(Chain of Thought) 프롬프트는 인간의 인지 과정을 모방하여 복잡한 추론 작업을 수행할 수 있는 AI 능력의 도약을 의미합니다. CoT는 중간 추론 단계를 설명함으로써 LLM의 문제 해결 능력을 증폭시킬 뿐만 아니라 투명성과 해석 가능성을 향상합니다. 내재적 한계에도 불구하고 CoT 변형 및 응용 분야에 대한 지속적인 탐구는 AI 모델의 추론 능력을 계속 확장하여 AI 인지 기능의 향후 개선을 예고하고 있습니다.

관련 솔루션
IBM® watsonx.ai

AI 빌더를 위한 차세대 엔터프라이즈 스튜디오인 IBM watsonx.ai로 생성형 AI, 파운데이션 모델 및 머신 러닝 기능을 학습, 검증, 조정 및 배포하세요. 적은 데이터로 짧은 시간 내에 AI 애플리케이션을 구축하세요.

watsonx.ai 살펴보기
인공 지능 솔루션

업계 최고의 AI 전문성과 솔루션 포트폴리오를 보유한 IBM과 함께 AI를 비즈니스에 활용하세요.

AI 솔루션 살펴보기
인공 지능(AI) 컨설팅 및 서비스

IBM Consulting AI 서비스는 기업이 AI 활용 방식을 재구상하여 혁신을 달성하도록 지원합니다.

AI 서비스 살펴보기
다음 단계 안내

IBM Concert는 AI를 사용하여 운영에 관한 중요한 인사이트를 발견하고 개선을 위한 애플리케이션별 권장 사항을 제공합니다. Concert를 통해 비즈니스를 발전시키는 방법을 알아보세요.

Concert 살펴보기 비즈니스 프로세스 자동화 솔루션 살펴보기