업계 뉴스레터
전문가의 인사이트를 바탕으로 한 최신 기술 뉴스
Think 뉴스레터를 통해 AI, 자동화, 데이터 등 가장 중요하고 흥미로운 업계 동향에 대한 최신 소식을 받아보세요. IBM 개인정보 보호정책을 참조하세요.
구독한 뉴스레터는 영어로 제공됩니다. 모든 뉴스레터에는 구독 취소 링크가 있습니다. 여기에서 구독을 관리하거나 취소할 수 있습니다. 자세한 정보는 IBM 개인정보 보호정책을 참조하세요.
이전의 머신 러닝 모델은 의사 결정에 도달하기 위해 미리 프로그래밍된 규칙 집합을 따랐습니다. AI의 발전은 더 진화된 추론 능력을 가진 AI 모델을 가능하게 했지만, 여전히 정보에서 지식을 전환하는 데 인간의 개입이 필요합니다. 에이전틱 추론은 한 단계 더 나아가, AI 에이전트가 지식을 행동으로 변환할 수 있게 합니다.
“추론 엔진”은 에이전틱 워크플로의 계획 및 툴 호출 단계를 구동합니다. 계획은 작업을 더 관리하기 쉬운 추론으로 분해하고, 툴 호출은 이용 가능한 툴을 통해 AI 에이전트의 의사 결정을 돕습니다. 이러한 툴에는 애플리케이션 프로그래밍 인터페이스(API), 외부 데이터 세트 그리고 지식 그래프와 같은 데이터 소스가 포함될 수 있습니다.
기업 입장에서는, 에이전틱 AI가 검색 증강 생성(RAG)을 통해 추론 과정을 증거에 더욱 기반할 수 있도록 지원할 수 있습니다. RAG 시스템은 엔터프라이즈 데이터 및 기타 관련 정보를 검색하여 AI 에이전트의 추론을 위한 컨텍스트에 추가할 수 있습니다.
업계 뉴스레터
Think 뉴스레터를 통해 AI, 자동화, 데이터 등 가장 중요하고 흥미로운 업계 동향에 대한 최신 소식을 받아보세요. IBM 개인정보 보호정책을 참조하세요.
구독한 뉴스레터는 영어로 제공됩니다. 모든 뉴스레터에는 구독 취소 링크가 있습니다. 여기에서 구독을 관리하거나 취소할 수 있습니다. 자세한 정보는 IBM 개인정보 보호정책을 참조하세요.
에이전틱 추론은 에이전트의 아키텍처와 유형에 따라 다양한 방식으로 접근할 수 있습니다. 다음은 각 기술의 장단점과 함께 AI 에이전트 추론을 위한 몇 가지 일반적인 기법입니다.
● 조건부 논리
● 휴리스틱
● ReAct(이유 + 행동)
● ReWOO(관찰 없이 추론하기)
● 자기 성찰
● 다중 에이전트 추론
단순 AI 에이전트는 미리 프로그래밍된 조건-동작 규칙 집합을 따릅니다. 이러한 규칙은 보통 'if-then' 형식으로 구성되며, 여기서 'if' 부분은 조건을 지정하고 'then' 부분은 동작을 나타냅니다. 조건이 충족되면, 에이전트는 해당 동작을 수행합니다.
이러한 추론 방법론은 특히 도메인 특화된 사용 사례에 적합합니다. 예를 들어 금융 분야에서는, 사기 탐지 에이전트가 은행이 정의한 일련의 기준에 따라 거래를 사기로 표시할 수 있습니다.
조건부 논리에서는 에이전틱 AI가 인식하지 못하는 시나리오에 직면하면 그에 맞게 행동할 수 없습니다. 이러한 유연성 부족을 줄이기 위해 모델 기반 에이전트는 자신의 기억과 인식을 사용하여 환경의 현재 모델이나 상태를 저장합니다. 이 상태는 에이전트가 새로운 정보를 받을 때 업데이트됩니다. 그러나 모델 기반 에이전트는 여전히 조건-동작 규칙에 의해 제한됩니다.
예를 들어, 로봇이 창고를 탐색하여 선반에 제품을 진열합니다. 로봇은 경로를 결정하기 위해 창고의 모델을 참조하지만, 장애물을 감지하면 장애물을 피하기 위해 경로를 변경하고 탐색을 계속할 수 있습니다.
AI 에이전트 시스템은 추론을 위해 휴리스틱을 사용할 수도 있습니다. 예를 들어, 목표 기반 에이전트는 미리 설정된 목표를 가지고 있습니다. 검색 알고리즘을 사용하여 목표를 달성하는 데 도움이 될 수 있는 행동의 순서를 찾고, 이를 실행하기 전에 이러한 행동들을 계획합니다.
예를 들어, 자율주행 차량은 목적지까지 실시간으로 가장 빠른 경로를 제시하는 것을 목표로 하는 내비게이션 에이전트를 가질 수 있습니다. 이 에이전트는 다양한 경로를 탐색하여 가장 빠른 경로를 추천할 수 있습니다.
목표 기반 에이전트와 마찬가지로 유용성 기반 에이전트는 목표를 달성하는 행동 순서를 찾지만, 유용성도 고려합니다. 이들은 유용성 기능을 사용하여 가장 최적의 결과를 결정합니다. 탐색 에이전트 예시에서는 가장 빠른 경로뿐만 아니라 연료 소비가 가장 적은 경로를 찾는 과제가 주어질 수 있습니다.
이 추론 패러다임은 문제를 단계별로 해결하고 응답을 반복적으로 개선하는 think-act-observe 루프를 포함합니다. 에이전트는 자신의 추론 과정을 추적하도록 지시받으며,1 이는 생각의 연결고리 추론이 생성형 AI(gen AI) 모델과 대형 언어 모델(LLM)에서 발생하는 방식과 유사합니다. 이후 에이전트는 해당 추론에 따라 행동하고, 그 결과를 관찰하여,2 관찰을 기반으로 새로운 추론으로 컨텍스트를 업데이트합니다. 에이전트는 답변이나 해결책에 도달할 때까지 이 사이클을 반복합니다.2
ReAct는 자연어 관련 작업에서 잘 작동하며, 그 추적 가능성은 투명성을 향상시킵니다. 그러나 동일한 추론과 행동을 반복적으로 생성할 수 있어 무한 루프에 빠질 위험이 있습니다.2
ReAct와 달리, ReWOO는 관찰 단계를 제거하고 대신 사전 계획을 수립합니다. 이 에이전틱 추론 설계 패턴은 플래너, 워커, 솔버의 3가지 모듈로 구성됩니다.3
플래너 모듈은 작업을 하위 작업으로 나누고, 각 하위 작업을 워커 모듈에 할당합니다. 워커는 각 하위 작업을 증거와 사실로 뒷받침하는 데 사용되는 툴을 통합합니다. 마지막으로, 솔버 모듈은 모든 하위 작업과 그에 해당하는 증거를 종합하여 결론을 도출합니다.3
ReWOO는 특정 자연어 처리(NLP) 벤치마크에서 ReAct보다 뛰어난 성능을 보입니다. 그러나 추가 툴을 더하면 ReWOO의 성능이 저하될 수 있으며, 환경에 대한 맥락이 제한된 상황에서는 좋은 성과를 내지 못합니다.3
에이전틱 AI는 또한 추론 능력을 평가하고 개선하는 과정에 자기 반성을 포함할 수 있습니다. 이에 대한 예시로는 LLM의 사고의 나무(Tree of Thought) 추론과 유사한 언어 에이전트 트리 탐색(Language Agent Tree Search, LATS)이 있습니다.
LATS는 몬테카를로 강화 학습 방법에서 영감을 받아, 연구자들이 몬테카를로 트리 탐색(Monte Carlo Tree Search)을 LLM 기반 에이전트에 맞게 수정했습니다.4 LATS는 상태를 노드로, 동작을 에지로 표현하는 Decision Tree를 구축하고, 트리를 검색하여 가능한 동작 옵션을 찾고, 상태 평가기를 사용하여 특정 동작을 선택합니다.2 또한 자체 반성 추론 단계를 적용하여, 자신의 관찰뿐만 아니라 언어 모델로부터 받은 피드백을 통합하여 추론에서의 오류를 식별하고 대안을 추천합니다.2 추론 오류와 반성은 메모리에 저장되어, 향후 참조를 위한 추가적인 컨텍스트로 활용됩니다.4
LATS는 코딩 및 인터랙티브 질문 응답과 워크플로 자동화, 특히 웹 검색 및 탐색과 같은 더 복잡한 작업에서 뛰어납니다.4 그러나 더 복잡한 접근 방식과 추가적인 자기 반성 단계로 인해 LATS는 ReAct와 같은 방법에 비해 자원과 시간이 더 많이 소모됩니다.2
다중 에이전트 시스템은 복잡한 문제를 해결하기 위해 여러 AI 에이전트가 협력하는 구조로 구성됩니다. 각 에이전트는 특정 도메인에 특화되어 있으며, 고유한 에이전틱 추론 전략을 적용할 수 있습니다.
그러나 의사 결정 과정은 AI 시스템의 아키텍처에 따라 달라질 수 있습니다. 계층적 또는 수직 에코시스템에서는 하나의 에이전트가 AI 오케스트레이션의 리더 역할을 하며 어떤 행동을 취할지 결정합니다. 반면, 수평 아키텍처에서는 에이전트들이 집단적으로 결정을 내립니다.
추론은 AI 에이전트의 핵심이며, 더 강력한 AI 기능을 제공할 수 있지만, 그 한계도 존재합니다. 다음은 에이전틱 추론에서의 몇 가지 과제입니다.
● 계산 복잡성
● 해석 가능성
● 확장성
에이전틱 추론은 구현이 어려울 수 있습니다. 이 과정은 특히 더 복잡한 실제 문제를 해결할 때 상당한 시간과 계산 능력을 요구합니다. 기업은 에이전틱 추론 전략을 최적화할 방법을 찾아야 하며, 개발을 위한 필요한 AI 플랫폼과 자원에 투자할 준비를 해야 합니다.
에이전틱 추론 기법은 일률적인 해결책이 아니므로 AI 애플리케이션 전반에 걸쳐 이를 확장하기 어렵습니다. 기업은 각 사용 사례에 맞게 이러한 추론 설계 패턴을 맞춤화해야 할 수 있으며, 이는 시간과 노력이 필요합니다.
모든 링크는 ibm.com 외부에 있습니다.
1 ReAct: Synergizing Reasoning and Acting in Language Models, arXiv, 2023년 3월 10일
2 The Landscape of Emerging AI Agent Architectures for Reasoning, Planning, and Tool Calling: A Survey, arXiv, 2024년 4월 17일
3 Language Agent Tree Search Unifies Reasoning Acting and Planning in Language Models, arXiv, 2024년 6월 6일
4 Language Agent Tree Search Unifies Reasoning Acting and Planning in Language Models, arXiv, 2024년 6월 6일
생성형 AI로 워크플로와 프로세스를 자동화하는 강력한 AI 어시스턴트 및 에이전트를 구축, 배포, 관리하세요.
믿을 수 있는 AI 솔루션으로 비즈니스의 미래를 설계하세요.
IBM Consulting AI 서비스는 기업이 AI 활용 방식을 재구상하여 혁신을 달성하도록 지원합니다.