프롬프트 이상을 생각하고 전체 맥락 파악
Think Newsletter를 통해 업계 뉴스, AI 툴, 프롬프트 엔지니어링 관련 최신 트렌드 소식을 받아보세요. 새로운 설명서, 튜토리얼, 전문가 인사이트도 이메일로 보내드립니다. IBM 개인정보 보호정책을 참고하세요.
생각의 연결고리(CoT)는 특히 다단계 추론과 관련된 복잡한 작업의 경우 대규모 언어 모델(LLM)의 아웃풋을 향상시키는 프롬프트 엔지니어링 기법입니다. CoT는 일관된 일련의 논리적 단계를 사용하여 단계별 추론 프로세스를 통해 모델을 안내함으로써 문제 해결을 용이하게 합니다.
프롬프트 엔지니어링은 인공 지능에서 입력(프롬프트)을 개선하여 가장 정확한 모델 출력을 얻는 데 사용됩니다. 본 연구에서는 LLM에서 추론을 이끌어내는 생각의 연결고리 프롬프트의 개념을 소개합니다.1 본문은 모델이 중간 추론 단계를 생성하도록 프롬프트하면 산술, 상식 및 기호 추론과 같은 다단계 문제를 정확하게 해결하는 능력이 크게 향상된다고 주장합니다.
연구원들은 자연어로 "큰 소리로 생각하는" LLM의 능력에 영감을 받았으며, 매개변수 크기가 증가함에 따라 추론 능력과 정확도도 증가한다는 점에 주목했습니다. 이러한 이유로 CoT 프롬프트는 신생 능력 또는 모델 크기나 복잡성이 확장됨에 따라 나타나는 능력으로 간주됩니다. 대규모 LLM은 대규모 데이터 세트에 대한 훈련을 통해 더 미묘한 추론 패턴을 학습했으므로 더 나은 성과를 내는 경향이 있습니다.
그러나 모델 크기를 늘리는 것만이 다양한 벤치마크에서 문제 해결 정확도를 향상하는 유일한 방법은 아닙니다. 명령 조정의 발전으로 더 작은 모델에서도 CoT 추론을 수행할 수 있게 되었습니다. 예를 들어, IBM® Granite Instruct 모델은 CoT 작업에 대한 지침 프롬프트와 예시로 구성된 전문 학습 데이터 세트를 사용하여 미세 조정됩니다. 예시는 모델이 이상적인 대응 방법으로 사용하는 프롬프트 예시입니다.
생각의 연결고리 프롬프트는 정교한 문제를 관리 가능한 중간 단계로 세분화하여 순차적으로 결론에 도달하는 인간과 유사한 추론 과정을 시뮬레이션합니다.2 이 단계별 문제 해결 구조는 추론 프로세스가 명확하고 논리적이며 효과적인지 확인하는 것을 목표로 합니다.
표준 프롬프트 형식에서 모델 아웃풋은 보통 제공된 입력에 대한 직접적인 답변입니다. 예를 들어, "하늘은 무슨 색이야?"라고 질문하는 입력 프롬프트를 제공하면 AI는 "하늘은 파란색입니다."와 같은 간단하고 직접적인 답변을 생성합니다.
그러나 CoT 프롬프트를 사용하여 하늘이 파란색인 이유를 설명해 달라고 요청하면, AI는 먼저 '파란색'의 의미(원색)를 정의한 다음 대기에 의해 다른 색이 흡수되어 하늘이 파란색으로 보인다고 추론할 것입니다. 이 답변은 논리적 논증을 구성하는 AI의 능력을 보여줍니다.
프롬프트를 구성하기 위해 사용자는 일반적으로 프롬프트 끝에 지침을 추가합니다. 사용자는 일반적으로 프롬프트에 "추론 단계를 설명해 줘" 또는 "답변을 단계별로 설명해 줘"와 같은 지침을 추가합니다. 본질적으로 이 프롬프트 기술은 LLM에게 결과를 생성할 뿐만 아니라 해당 답변이 도출된 일련의 중간 단계를 자세히 설명하도록 요청합니다.3
프롬프트 체이닝은 복잡한 작업을 분해하기 위해 순차적으로 여러 프롬프트를 구축하여 신뢰성을 개선하는 데 자주 사용되는 또 하나의 방법입니다. 프롬프트 체이닝 및 CoT와 같은 기술은 모델이 단순히 옳게 들리는 답변으로 넘어가는 대신 문제를 단계별로 추론하도록 안내합니다. 이 방법은 모델의 추론을 보다 투명하게 만들도록 장려하므로 관측 가능성 및 디버깅에도 도움이 될 수 있습니다. 이러한 방법의 주요 차이점은 프롬프트 체인은 여러 프롬프트를 시퀀싱하여 작업을 단계별로 분류하는 반면, CoT 프롬프트는 단일 프롬프트 내에서 모델의 추론 프로세스를 이끌어낸다는 것입니다.
Think Newsletter를 통해 업계 뉴스, AI 툴, 프롬프트 엔지니어링 관련 최신 트렌드 소식을 받아보세요. 새로운 설명서, 튜토리얼, 전문가 인사이트도 이메일로 보내드립니다. IBM 개인정보 보호정책을 참고하세요.
생각의 연결고리 프롬프트는 대규모 언어 모델(LLM)을 활용하여 추론 단계의 연속을 표현하고, 이를 통해 모델이 새로운 작업에 대해 유사한 추론의 연결고리를 생성하도록 모델을 안내합니다. 추론 과정을 설명하는 예시 기반 프롬프트를 통해 이루어지며, 이는 복잡한 추론 과제를 해결하는 모델의 역량을 향상합니다.4 다항식 방정식을 푸는 고전적인 수학 단어 문제를 예로 들어 이 프롬프트 기법의 흐름을 이해해 보겠습니다.
생각의 연결고리(CoT) 프롬프트는 LLM이 일련의 논리적 단계를 따르도록 안내하여 문제 해결 과정을 세분화함으로써 다항식 방정식을 푸는 데 큰 도움을 줄 수 있습니다.5 CoT 프롬프트가 다항식 방정식을 어떻게 해결할 수 있는지 살펴보겠습니다.
이차 방정식을 푸는 예제를 살펴보세요.
입력 프롬프트: 다음 2차 방정식을 풀어보세요. x2 - 5x + 6 = 0
이 프롬프트를 IBM® watsonx.ai 채팅에 입력하면 사람의 질문과 AI 지원의 답변 사이에 다음과 같은 대화가 오가는 것을 볼 수 있습니다.
생각의 연결고리(CoT) 프롬프트는 다양한 혁신적 변형으로 발전해 왔으며 각각은 특정 문제를 해결하고 고유한 방식으로 모델의 추론 능력을 향상하도록 맞춤화되었습니다. 이러한 조정은 다양한 도메인에서 CoT의 적용 가능성을 확장할 뿐만 아니라 모델의 문제 해결 프로세스를 개선합니다.6
제로샷 생각의 연결고리 방식은 모델에 내재된 지식을 활용하여 당면한 작업에 대한 사전 특정 예제나 미세 조정 없이 문제를 해결하는 방식입니다. 이 접근 방식은 맞춤형 교육 데이터를 사용할 수 없는 경우의 새롭거나 다양한 문제 유형을 다룰 때 특히 유용합니다.7또한 표준 프롬프트와 퓨샷 프롬프트의 속성을 활용할 수 있습니다.
예를 들어, "프랑스와 국경을 접하고 있고 빨간색과 흰색으로 된 국기가 있는 국가의 수도는 어디입니까?"라는 질문이 있을 때 제로 샷 CoT를 사용하는 모델은 해당 쿼리에 대해 명시적으로 학습하지 않았어도 내장된 지리 및 국기 지식을 활용하여 스위스로 이어지는 단계를 정답으로 추론합니다.
자동 생각의 연결고리(auto-CoT)는 효과적인 추론 경로의 생성 및 선택을 자동화하여 프롬프트를 만드는 데 드는 수작업을 최소화하는 것을 목표로 합니다. 또한 더 광범위한 작업과 사용자를 지원하기 위해 CoT 프롬프트의 확장성과 접근성을 향상시킵니다.8, 9
예를 들어, "5개의 사과를 구입했고 이미 3개의 사과를 갖고 있었다면 사과는 총 몇 개입니까?"와 같은 수학 문제를 풀기 위해 자동 CoT 시스템은 "3개의 사과로 시작" 및 "기존 3개에 5개의 사과 추가"와 같은 중간 단계를 자동으로 생성하여 "총 사과 = 8"로 마무리하며 사람의 개입 없이 추론 과정을 간소화합니다.
멀티모달 생각의 연결고리는 CoT 프레임워크를 확장하여 텍스트 및 이미지와 같은 다양한 양식의 입력을 통합하여 모델이 복잡한 추론 작업을 위해 다양한 유형의 정보를 처리하고 통합할 수 있도록 합니다.10
예를 들어, 붐비는 해변 풍경의 사진을 제시하고 "이 해변이 여름에 인기가 있을 것 같습니까?"라고 물었을 때, 멀티모달 CoT를 사용하는 모델은 시각적 단서 (해변 점유율, 기상 조건 등 포함)와 계절적 인기에 대한 텍스트 이해를 분석하여 상세한 답변을 추론하고, "해변이 붐비고 있으므로 인기가 높다는 것을 나타내며 여름에 더 증가할 가능성이 있습니다."라는 답변을 할 수 있습니다.
이러한 생각의 연결고리 프롬프트의 변형은 CoT 접근 방식의 유연성과 적응성을 보여줄 뿐 아니라 AI 추론 및 문제 해결 능력에서 향후 발전할 잠재력이 크다는 것을 시사합니다.
CoT 프롬프트는 복잡한 추론 작업에서 대규모 언어 모델(LLM)의 성능을 향상하는 강력한 기술로, 다양한 영역에서 향상된 정확성, 투명성, 다단계 추론 능력과 같은 상당한 이점을 제공합니다. 그러나 고품질 프롬프트의 필요성, 계산 비용 증가, 적대적 공격에 대한 취약성, 추론 또는 이해의 질적 향상 평가의 어려움 등 제한 사항을 고려하는 것이 중요합니다. 이러한 제한 사항을 해결함으로써 연구자와 실무자는 다양한 응용 분야에서 CoT 프롬프트를 책임감 있고 효과적으로 배포할 수 있습니다.11
사용자는 생각의 연결고리 프롬프트 내에서 여러 가지 이점을 누릴 수 있습니다. 예를 들면 다음과 같습니다.
생각의 연결고리(CoT)의 진화는 여러 도메인, 특히 자연어 처리(NLP), 머신 러닝, 급성장하는 생성형 AI 분야에서 시너지를 일으키며 발전할 수 있다는 것을 보여주는 증거입니다. 이러한 발전으로 CoT는 복잡한 문제 해결의 최전선에 서게 되었을 뿐 아니라 다양한 응용 분야에서 CoT의 유용성이 부각되었습니다. CoT의 현황을 포괄적으로 이해하기 위해 지정된 용어를 포함해 주요 발전 현황을 자세히 살펴보겠습니다.
프롬프트 엔지니어링의 혁신으로 인해 모델의 이해도와 원본 프롬프트와의 상호 작용이 크게 향상되어 보다 미묘하고 맥락에 맞는 추론 경로를 도출할 수 있게 되었습니다. 이러한 발전은 CoT의 효과를 개선하는 데 매우 중요한 역할을 했습니다.12
상징적 추론 작업과 논리적 추론 작업으로의 통합을 통해 추상적인 사고와 추론을 위한 모델의 역량을 향상시켜서, CoT로 논리 기반 난제를 해결하는 데 있어 상당한 도약을 이루었습니다.13
예를 들어, 상징적 추론은 2 + 3 = 5와 같은 수학 방정식을 푸는 것입니다. 이 경우 문제는 구성 부분(덧셈 및 숫자)으로 분류되고 모델은 학습된 지식과 추론 규칙을 기반으로 정답을 추론합니다. 반면에 논리적 추론은 "모든 새는 날 수 있고 펭귄은 새"와 같은 전제나 가정에서 결론을 도출하는 것을 포함합니다. 모델은 제공된 정보를 기반으로 펭귄이 날 수 있다고 판단합니다. CoT 프롬프트를 상징적 추론 및 논리적 추론 작업에 통합함으로써 LLM은 향상된 추상적 사고 및 추론 능력을 입증하여 더 복잡하고 다양한 문제를 해결할 수 있게 되었습니다.
생성형 AI와 트랜스포머 아키텍처의 적용은 CoT에 혁신을 가져왔으며, 창의성과 깊이를 보여주는 정교한 추론 경로를 생성할 수 있게 되었습니다. 이러한 시너지 효과는 CoT의 적용 범위를 넓혀 학문과 실무 영역 모두에 영향을 미쳤습니다.14
소규모 모델이 CoT 추론에 효과적으로 관여할 수 있도록 발전함에 따라 정교한 추론 기능의 이용이 보편화되었습니다. CoT 내의 자체 일관성에 중점을 두면 생성된 경로의 논리적 건전성을 보장하여 모델에 의해 도출된 결론의 신뢰성을 높일 수 있습니다.15
복잡한 문제를 이해하기 쉬운 추론 단계로 분해하는 생각의 연결고리(CoT) 방법론은 다양한 분야에 걸쳐 적용되고 있습니다. 이러한 사용 사례는 CoT의 범용성을 보여줄 뿐만 아니라 CoT가 시스템에서 문제 해결 및 의사 결정 작업에 접근하는 방식을 변화시킬 수 있는 잠재력이 있음을 입증합니다. 다음 섹션에서는 CoT가 효과적으로 적용된 몇 가지 대표적인 사용 사례를 살펴보겠습니다.
챗봇에 CoT를 통합하고 최첨단 NLP 기술을 활용하여 대화형 AI를 혁신함으로써 챗봇이 더 깊은 수준의 이해와 문제 해결 능력이 필요한 더 복잡한 상호 작용을 수행할 수 있게 되었습니다.
이러한 발전은 종합적 관점에서 CoT 기능의 비약적인 발전, 챗봇과 CoT 모델 통합의 중요성을 상징하며 AI 기반 의사 결정과 문제 해결 과정에 혁신을 일으킬 수 있는 잠재력을 강조합니다. 챗봇의 대화 기능과 CoT 모델의 고급 추론 기능을 결합하면 더 폭넓은 작업과 애플리케이션을 처리할 수 있는, 더욱 정교하고 효과적인 AI 시스템을 만들 수 있습니다.
또한 다양한 애플리케이션과 CoT 모델의 통합은 AI 시스템이 사용자의 요구와 선호도를 더 잘 이해하고 이에 대응할 수 있도록 함으로써 전반적인 사용자 경험을 향상시킬 수 있습니다. 자연어 처리(NLP) 기술을 CoT 모델에 통합하면 챗봇이 보다 인간과 유사한 방식으로 사용자 입력을 이해하고 응답하여 더욱 직관적이고 효과적이며 사용자의 참여도가 높은 대화 환경을 만들 수 있습니다.
고급 챗봇은 CoT를 활용하여 고객 문의를 더 정확히 이해하고 해결합니다. 챗봇은 고객의 문제를 작고 관리하기 쉬운 부분으로 나누어 더욱 정확하고 도움이 되는 답변을 제공할 수 있으며, 결과적으로 고객 만족도가 향상되고 인간의 개입 필요성은 줄어듭니다.
연구자는 CoT를 사용하여 복잡한 과학적 문제 해결에서 사고 과정을 구조화함으로써 혁신을 촉진합니다. 이러한 구조화된 접근 방식은 발견 프로세스를 가속화하고 새로운 가설의 수립을 지원합니다.
콘텐츠 생성에서 CoT는 생각과 정보를 논리적으로 구성하여 구조화된 개요 또는 요약을 생성하는 데 도움을 주고 서면 콘텐츠의 일관성과 품질을 높여줍니다.
CoT는 교육 기술 플랫폼에서 복잡한 문제에 대한 단계별 설명을 생성하는 데 도움을 주며 중요한 역할을 합니다. 이 능력은 과정을 이해하는 것이 최종 답을 구하는 것만큼이나 중요한 수학 및 과학과 같은 과목에서 특히 가치가 있습니다. CoT 기반 시스템은 학생에게 문제 해결 절차를 안내하여 이해력과 기억력을 향상시킬 수 있습니다.
CoT는 특히 윤리적 고려가 필요한 시나리오에서 AI 기반 의사 결정 이면의 추론 과정을 명확히 설명하는 데 매우 중요합니다. CoT는 투명한 추론 경로를 제공함으로써 AI 의사 결정이 윤리적 기준과 사회적 규범에 부합하도록 보장합니다.
이러한 사용 사례는 다양한 부문에서 CoT의 혁신적인 잠재력을 부각하며, 문제 해결 및 의사 결정 프로세스를 재정의할 수 있는 CoT의 능력을 엿볼 수 있습니다. CoT가 계속 발전함에 따라 응용 분야가 확장되어 이 방법론을 기술 및 사회 발전의 구조에 포함하게 될 것으로 예상됩니다.
생각의 연결고리(Chain of Thought) 프롬프트는 인간의 인지 과정을 모방하여 복잡한 추론 작업을 수행할 수 있는 AI 능력의 도약을 의미합니다. CoT는 중간 추론 단계를 설명함으로써 LLM의 문제 해결 능력을 증폭시킬 뿐만 아니라 투명성과 해석 가능성을 향상합니다. 내재적 한계에도 불구하고 CoT 변형 및 응용 분야에 대한 지속적인 탐구는 AI 모델의 추론 능력을 계속 확장하여 AI 인지 기능의 향후 개선을 예고하고 있습니다.