에이전틱 RAG란 무엇인가요?

작성자

Staff writer

Staff Editor, AI Models

IBM Think

에이전틱 RAG는 AI 에이전트 를 사용하여 검색 증강 생성(RAG) 을 최적화하는 방식입니다. 에이전틱 RAG 시스템은 RAG 파이프라인에 AI 에이전트를 추가하여 적응성과 정확성을 높입니다. 기존 RAG 시스템과 비교할 때, 에이전틱 RAG는 대규모 언어 모델(LLM) 이 여러 소스에서 정보 검색 을 수행하고 더 복잡한 워크플로를 처리할 수 있습니다.

RAG란 무엇인가요?

검색 증강 생성은 생성형 AI 모델을 외부 지식 기반과 연결하는 인공 지능(AI) 애플리케이션입니다. 지식 기반의 데이터는 더 많은 컨텍스트로 사용자 쿼리를 보강하여 LLM이 더 정확한 응답을 생성할 수 있도록 합니다. RAG를 사용하면 LLM이 미세 조정 없이 도메인 특화 컨텍스트에서 더 정확하게 작동할 수 있습니다.

RAG 지원 AI 모델은 학습 데이터에만 전적으로 의존하지 않고 API 및 기타 데이터 소스에 대한 연결을 통해 실시간으로 현재 데이터에 액세스할 수 있습니다. 표준 RAG 파이프라인은 다음과 같은 두 가지 AI 모델을 포함합니다.

정보 검색 구성 요소는 일반적으로 검색할 데이터가 포함된 벡터 데이터베이스와 쌍을 이루는 임베딩 모델입니다.

생성형 AI 구성 요소는 일반적으로 LLM입니다.

임베딩 모델은 자연어 사용자 쿼리에 대한 응답으로 쿼리를 벡터 임베딩으로 변환한 다음, 지식 기반에서 유사한 데이터를 검색합니다. AI 시스템은 검색된 데이터를 사용자 쿼리와 결합하여 컨텍스트 인식 응답을 생성합니다.

에이전틱 AI란 무엇인가요?

에이전틱 AI는 스스로 행동 방침을 결정하고 수행할 수 있는 AI의 한 유형입니다. 게시 시점에 사용할 수 있는 대부분의 에이전트는 함수 호출 능력이 있는 LLM으로, 도구를 호출하여 작업을 수행할 수 있습니다. 이론적으로 AI 에이전트는 다음과 같은 세 가지 중요한 특성을 가진 LLM입니다.

에이전틱 AI는 장단기 메모리를 모두 갖추고 있어 복잡한 작업을 계획하고 실행할 수 있습니다. 또한 에이전트는 메모리를 통해 이전 작업을 참조하고 해당 데이터를 사용하여 향후 워크플로에 정보를 제공할 수 있습니다. 에이전틱 RAG 시스템은 시맨틱 캐싱을 사용해 이전 쿼리, 컨텍스트 및 결과 세트를 저장하고 참조합니다.

쿼리 라우팅, 단계별 계획 및 의사 결정을 수행할 수 있습니다. 에이전트는 정보를 유지하고 복잡한 쿼리 및 프롬프트에 대한 응답으로 적절한 작업 과정을 계획하기 위해 메모리 기능을 사용합니다.

API를 통해 도구 호출을 수행할 수 있습니다. 역량 있는 에이전트는 사용자 상호작용에 따라 생성하는 워크플로에 사용할 도구를 선택할 수 있습니다.

워크플로는 하나의 AI 에이전트 또는 여러 에이전트를 함께 결합하는 멀티에이전트 시스템으로 구성될 수 있습니다.

업계 뉴스레터

전문가가 전하는 최신 AI 트렌드

가장 중요하고 흥미로운 AI 뉴스에 대한 선별된 인사이트를 확인하세요. 주간 Think 뉴스레터를 구독하세요. IBM 개인정보 보호정책을 참조하세요.

에이전틱 RAG와 기존 RAG 시스템 비교

에이전틱 RAG에는 기존 RAG 구현에 비해 몇 가지 중요한 개선 사항이 포함되어 있습니다.

유연성: 에이전틱 RAG 애플리케이션은 여러 외부 지식 기반에서 데이터를 가져오고 외부 도구를 사용할 수 있습니다. 표준 RAG 파이프라인은 LLM을 단일 외부 데이터 세트에 연결합니다. 예를 들어, 많은 엔터프라이즈 RAG 시스템은 조직의 독점 데이터가 포함된 지식 기반과 챗봇을 결합합니다.
적응성: 기존 RAG 시스템은 특정 쿼리에 대한 응답으로 관련 정보를 찾아주는 반응형 데이터 검색 도구입니다. RAG 시스템에는 변화하는 상황에 적응하거나 다른 데이터에 액세스할 수 있는 기능이 없습니다. 최적의 결과를 얻으려면 광범위한 프롬프트 엔지니어링이 필요한 경우가 많습니다.

한편, 에이전틱 RAG는 정적인 규칙 기반 질의에서 적응형 지능형 문제 해결 방식으로의 전환을 의미합니다. 멀티에이전트 시스템은 여러 AI 모델이 협업하고 서로의 작업을 확인하도록 장려합니다.
정확성: 기존 RAG 시스템은 결과를 자체적으로 최적화하거나 검증하지 않습니다. 시스템이 허용 가능한 수준의 성능을 발휘하고 있는지 판단하는 것은 사람의 몫입니다. 올바른 데이터를 찾고 있는지, 또는 이를 적절히 통합하여 맥락을 반영한 생성이 이루어지고 있는지를 시스템이 스스로 판단할 수 있는 방법이 없습니다. 그러나 AI 에이전트는 이전 프로세스를 반복하여 시간이 지남에 따라 결과를 최적화할 수 있습니다.
확장성: 여러 RAG 에이전트가 협력하는 네트워크를 통해, 다양한 외부 데이터 소스를 활용하고 도구 호출 및 계획 기능을 적용하면 에이전틱 RAG는 더욱 확장성이 커집니다. 개발자는 광범위한 사용자 쿼리를 처리할 수 있는 유연하고 확장 가능한 RAG 시스템을 구성할 수 있습니다.
멀티모달: 에이전틱 RAG 시스템은 최신 멀티모달 LLM 기술 발전을 활용해 이미지, 오디오 파일 등 더 다양한 유형의 데이터를 처리할 수 있습니다. 멀티모달 모델은 여러 유형의 정형, 반정형 및 비정형 데이터 를 처리합니다. 예를 들어, 최근의 여러 GPT 모델은 표준 텍스트 생성 외에도 시각적 및 오디오 콘텐츠를 생성할 수 있습니다.

사무실에서 일하는 여러 직원을 생각해 보세요. 전통적인 RAG 시스템은 특정 작업이 주어지고 작업을 수행 방법을 알려주었을 때 우수한 성과를 내는 직원과 같습니다. 주도적으로 행동하는 것을 꺼리며, 주어진 지시 범위를 벗어나는 것을 불편해합니다.

이에 비해 에이전틱 RAG 시스템은 사전 예방적이고 창의적인 팀입니다. 지시를 잘 따를 뿐만 아니라 주도적으로 행동하며 스스로 문제를 해결하는 것을 좋아합니다. 동료들이 벽에 부딪히거나 부담스러워하는 복잡한 작업에 대해서도 주저하지 않고 자신만의 해결책을 찾아냅니다.

에이전틱 RAG가 기존 RAG보다 나은가요?

에이전틱 RAG는 함수 호출, 다단계 추론, 멀티에이전트 시스템을 활용하여 결과를 최적화하지만, 항상 가장 좋은 선택은 아닙니다. 더 많은 에이전트가 작동할수록 비용이 증가하며, 에이전틱 RAG 시스템은 일반적으로 토큰 사용 비용이 더 많이 발생합니다. 에이전틱 RAG는 기존 RAG보다 속도를 높일 수 있지만, LLM이 아웃풋을 생성하는 데 더 많은 시간이 걸릴 수 있기 때문에 지연 시간도 발생합니다.

마지막으로 에이전트를 항상 신뢰할 수 있는 것은 아닙니다. 작업의 복잡성과 사용된 에이전트에 따라 작업 수행에 어려움을 겪거나 실패할 수도 있습니다. 에이전트가 항상 원활하게 협력하는 것은 아니며, 리소스를 두고 경쟁할 수도 있습니다. 시스템에 에이전트가 많으면 협업이 복잡해지고 문제가 발생할 가능성도 높아집니다. 심지어 아무리 빈틈없는 RAG 시스템도 할루시네이션 발생 가능성을 완전히 제거할 수는 없습니다.

AI 아카데미

AI 전문가 되기

비즈니스 성장을 주도하는 AI 투자의 우선순위를 정할 수 있는 지식을 확보하세요. 지금 바로 무료 AI 아카데미를 시작하고 조직에서 AI의 미래를 주도하세요.

시리즈 보기

에이전틱 RAG는 어떻게 작동하나요?

에이전틱 RAG는 하나 이상의 AI 에이전트를 RAG 시스템에 통합하는 방식으로 작동합니다. 예를 들어, 에이전틱 RAG 시스템은 각기 다른 도메인이나 데이터 소스 유형에 특화된 여러 정보 검색 에이전트를 조합할 수 있습니다. 한 에이전트가 외부 데이터베이스를 쿼리하는 동안, 다른 에이전트는 이메일과 웹 검색 결과를 분석할 수 있습니다.

LangChain 및 LlamaIndex 와 같은 에이전틱 AI 프레임워크와 오케스트레이션 프레임워크 LangGraph를 GitHub에서 찾을 수 있습니다. 이를 통해 최소한의 비용으로 RAG용 에이전트 아키텍처 를 실험할 수 있습니다. Granite 또는 Llama-3 같은 오픈 소스 모델을 사용하면,RAG 시스템 설계자가 OpenAI 같은 다른 제공업체에 지불하는 비용 부담을 줄이면서도 더 높은 관측 가능성을 확보할 수 있습니다.

에이전틱 RAG 시스템에는 다음 중 하나 이상의 유형의 AI 에이전트가 포함될 수 있습니다.

라우팅 에이전트

쿼리 계획 에이전트

ReAct 에이전트

계획 및 실행 에이전트

라우팅 에이전트

라우팅 에이전트는 사용자 쿼리에 적합한 외부 지식 소스와 도구를 결정합니다. 사용자 프롬프트를 처리하고 최적의 응답 생성으로 이어질 가능성이 가장 높은 RAG 파이프라인을 식별합니다. 단일 에이전틱 RAG 시스템에서는 라우팅 에이전트가 어떤 데이터 소스를 쿼리할지 선택합니다.

쿼리 계획 에이전트

쿼리 계획 에이전트는 RAG 파이프라인의 작업 관리자입니다. 복잡한 사용자 쿼리를 처리하여 단계별 프로세스로 세분화합니다. 생성된 하위 쿼리를 RAG 시스템 내 다른 에이전트에 전달한 후, 개별 응답을 종합하여 일관성 있는 최종 응답을 생성합니다. 하나의 에이전트를 사용하여 다른 AI 모델을 관리하는 프로세스는 AI 오케스트레이션의 한 유형입니다.

ReAct 에이전트

ReAct(추론과 실행)는 단계별 솔루션을 생성하고 실행할 수 있는 멀티에이전트 시스템을 구축하는 에이전트 프레임워크입니다. 또한 도움이 될 만한 적절한 도구를 식별할 수도 있습니다. 각 단계의 결과에 따라, ReAct 에이전트는 생성된 워크플로의 다음 단계를 동적으로 조정할 수 있습니다.

계획 및 실행 에이전트

계획 및 실행 에이전트 프레임워크는 ReAct 에이전트에서 발전한 것입니다. 기본 에이전트를 다시 호출하지 않고 다단계 워크플로를 실행할 수 있어 비용을 절감하고 효율성을 높일 수 있습니다. 또한 계획 에이전트가 작업을 수행하는 데 필요한 모든 단계를 논리적으로 추론하기 때문에 완료율과 품질이 더욱 높아지는 경향이 있습니다.