OpenAI의 ChatGPT 최신 버전과 달리, AgentGPT는 최소한의 수동 프롬프트만으로 사고, 계획, 행동 및 적응을 수행하는 자율 AI 에이전트를 생성할 수 있도록 합니다. AgentGPT를 특별하게 만드는 기능 중 하나는 사용자 친화적인 인터페이스로, 이를 통해 연구 및 데이터 수집, 탐색적 문제 해결, 아이디어 생성, 반복 작업 자동화, 챗봇 생성 등 다양한 사용 사례에서 AI 에이전트 기능을 쉽게 활용할 수 있습니다.
AgentGPT는 노코드 툴로, 사용자는 목표를 정의하고 모델을 선택하며 에이전트를 배포하기 위해 소프트웨어를 작성하거나 개발 환경을 설정할 필요가 없습니다. 초보자가 효과적인 목표를 설정하는 방법을 이해할 수 있도록 템플릿이 제공됩니다.
AgentGPT는 Reworkd AI 팀이 주도적으로 개발한 오픈 소스 프로젝트입니다. 샌프란시스코에 기반을 둔 이 스타트업은 2023년 4월에 이 툴을 출시했으며 현재도 이를 유지 관리하고 있습니다. 가격 측면에서 Reworkd는 무료 버전과 함께 유료 요금제가 포함된 호스팅 서비스를 제공합니다. 이 프로젝트는 코드와 문서가 GitHub에 공개되어 있어 접근성이 높다는 점에서 초기부터 주목을 받았습니다.
AgentGPT에서 “GPT”는 생성 사전 학습 트랜스포머를 의미하며, 이는 트랜스포머 기반의 딥러닝 아키텍처에 기반한 대형 언어 모델(LLM) 계열을 지칭합니다. AgentGPT라는 이름은 GPT가 ChatGPT처럼 단순한 챗봇이 아니라 자율 에이전트로 작동하기 때문에 붙여졌으며, 두 시스템 모두 내부적으로 GPT-3.5 및 GPT-4와 같은 동일한 OpenAI 모델을 기반으로 합니다.
AgentGPT는 웹이 아닌 사용자 개인 장치에서 실행되는 유사한 툴인 AutoGPT와 혼동해서는 안 됩니다. BabyAGI는 보다 기술적인 Python 기반 에이전트 플랫폼으로, 개발자들이 기초 툴로 자주 활용합니다.
가장 중요하고 흥미로운 AI 뉴스에 대한 선별된 인사이트를 확인하세요. 주간 Think 뉴스레터를 구독하세요. IBM 개인정보 보호정책을 참조하세요.
에이전트는 사용 가능한 툴을 활용해 워크플로를 설계함으로써 작업을 자율적으로 수행하는 AI 기반 시스템입니다. IBM® Granite 모델과 같은 전통적인 LLM은 학습에 사용된 데이터를 기반으로 응답을 생성하며, 지식과 추론의 한계에 의해 제약을 받습니다.
반면 에이전트는 단순히 사용자와 대화하는 것 이상의 작업을 수행할 수 있습니다. LLM은 일종의 두뇌로 볼 수 있습니다. 에이전트는 LLM이라는 두뇌를 활용해 사고하고 행동을 수행하는 시스템입니다. 에이전트는 최소한의 인간 개입으로 장기 목표를 달성하기 위해 다단계 추론이 필요한 복잡한 작업을 계획하고 수행합니다.
예를 들어 커피숍을 시작하고 싶지만 좋은 입지 조건이 무엇인지 모른다고 가정해 보겠습니다. 좋은 입지를 판단하는 기준을 정의하고, 데이터를 수집하고, 후보 지역을 좁히며, 장단점과 위험 요소를 파악하고자 합니다. 이 경우 에이전트는 주니어 리서치 분석가 역할을 수행합니다. 그렇다면 어떤 툴을 사용해야 할까요? 두 툴 모두 머신러닝을 활용해 콘텐츠를 생성하므로 이론적으로는 ChatGPT(또는 다른 LLM 기반 챗봇)를 사용할 수 있습니다.
AgentGPT의 실시간 웹 검색 및 외부 툴 접근 기능은 ChatGPT의 유사한 기능보다 먼저 제공되었다는 점은 주목할 만하며, 현재는 두 툴 모두 이러한 기능을 지원합니다. 그럼에도 불구하고 AgentGPT는 여전히 고유한 강점을 가지고 있습니다.
ChatGPT는 후속 질문을 하거나 가정을 검토하고 아이디어를 상호작용적으로 개선하는 데 강점을 보입니다. 반면 작업이 다단계이고 경로가 불확실하며 각 단계를 일일이 직접 제어하고 싶지 않다면 AgentGPT가 더 적합할 수 있습니다.
ChatGPT는 지시를 받아야 작동하며, 모든 단계를 사용자가 직접 안내해야 합니다. 반면 AgentGPT는 초기 목표를 기반으로 스스로 최적의 실행 단계를 결정하며 작업을 진행합니다. 또한 “알지 못했던 미지의 영역”을 발견하고 미처 질문하지 못했던 영역까지 탐색하는 데 유용합니다.
ChatGPT를 사용할 경우 각 단계마다 다음과 같이 질문해야 합니다.
AgentGPT를 사용할 경우 “좋은 커피숍 입지를 조사해줘”라고 한 번만 말하면, 에이전트가 스스로 심층적으로 조사하여 포괄적인 결과를 도출합니다. 에이전트는 이러한 질문을 스스로 제기하고 능동적으로 답을 도출합니다.
예를 들어 커피숍에 영향을 미치는 새로운 규제, 트렌드, 기술을 모니터링하고 주간 위험과 기회를 정리해 깔끔한 보고서로 제공하는 에이전트를 만든다고 가정해 보겠습니다. 이 에이전트는 다양한 소스를 탐색하고 커피숍과의 관련성을 필터링하며, 위험과 기회를 종합하고 결과를 요약할 수 있어야 합니다.
이러한 사용 사례는 보다 개방적인 특성을 가지므로 ChatGPT보다 AgentGPT가 더 적합하며, 새로운 정보를 계속 요청하는 대신 완성된 요약 결과를 검토하기만 하면 됩니다.
먼저 에이전트의 이름을 지정합니다(예: “커피 산업 위험 및 기회 분석가”). 그런 다음 목표를 작성합니다.
“웹과 소셜 미디어를 스캔하여 독립 커피숍에 영향을 미치는 새로운 규제, 트렌드, 기술을 파악하고 주간 위험, 기회 및 주목할 항목을 요약하세요. 그 다음 비즈니스 임원 독자를 위해 뉴스레터를 편집하고 간결하게 정리하세요.”
“독립 커피숍”이라는 표현은 관련 범위를 좁혀 줍니다. “위험, 기회 및 주목할 항목”은 분류를 강제합니다. “편집 및 간결화”는 중복을 줄이고 원하는 스타일의 결과를 생성합니다.
불필요한 결과를 방지하기 위해 추가 제약 조건이나 운영 규칙을 설정할 수 있습니다. 예를 들어 다음과 같습니다.
“별도 지정이 없는 한 지역 규제에 집중하세요”
“관련 없는 환대 산업 뉴스(파인다이닝, 호텔 등)는 제외하세요”
“최근 7일 이내의 출처를 우선 사용하세요”
“영향을 명확하고 간결하게 요약하세요”
“정보가 불완전한 경우 불확실성을 표시하세요”
핵심 요약으로 시작하세요(최대 5개 항목)
모든 출처를 하이퍼링크로 포함하세요
이전 보고서의 결과를 반복하지 마세요
“과장된” 뉴스는 제외하세요
이 초기 프롬프트를 저장해 두고 매주 실행하여 새로운 결과를 얻을 수 있습니다.
AgentGPT는 이러한 “개인 비서” 또는 “디지털 코파일럿” 범주의 단순한 사용 사례에서 특히 강점을 보입니다. 이러한 에이전트는 서로 다른 목표를 위해 여러 개를 병렬로 실행함으로써 수평 확장이 가능합니다. 이러한 확장성은 IBM® watsonX Orchestrate와 같은 기업용 에이전트 시스템의 프로토타입으로서 AgentGPT의 매력을 높이며, 이 경우 더 강력한 가드레일, 평가 및 모니터링이 요구됩니다.
생성형 AI로 워크플로와 프로세스를 자동화하는 강력한 AI 어시스턴트 및 에이전트를 구축, 배포, 관리하세요.
믿을 수 있는 AI 솔루션으로 비즈니스의 미래를 설계하세요.
IBM Consulting AI 서비스는 기업이 AI 활용 방식을 재구상하여 혁신을 달성하도록 지원합니다.