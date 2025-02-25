고급 RAG는 다음과 같이 순차적인 단계 기반 프로세스로 작동합니다.

1. 질의 처리: 사용자 질의를 수신하면 질의의 의미적 의미를 포착하는 임베딩 모델을 사용하여 이를 고차원 벡터로 변환합니다.

2. 문서 검색: 인코딩된 쿼리는 조밀한 벡터 검색과 희소 검색, 즉 의미론적 유사성 및 키워드 기반 검색을 모두 사용하여 하이브리드 검색을 제공하는 거대한 지식 데이터베이스를 탐색합니다. 따라서 검색된 문서에 의미론적 키워드가 일치하는 결과가 표시됩니다.

3. 검색된 문서의 순위 재지정: 검색기는 컨텍스트와 문서를 검색하는 쿼리와 관련하여 최종 점수를 제공합니다.

4. 생성을 위한 컨텍스트 융합: 각 문서가 다르게 인코딩되기 때문에 디코더는 인코딩된 모든 컨텍스트를 융합하여 생성된 응답이 인코딩된 쿼리와 일관성을 갖도록 합니다.

5. 응답 생성: 일반적으로 IBM® Granite 모델이나 Llama와 같은 LLM인 고급 RAG 생성기는 검색된 문서를 기반으로 답변을 제공합니다.

6. 피드백 루프: 고급 RAG는 능동 학습, 강화 학습, 검색기-생성기 공동 학습과 같은 다양한 기술을 사용하여 성능을 지속적으로 향상시킵니다. 이 단계에서는 관련성을 추론하는 검색된 문서의 클릭과 같은 암시적 신호가 발생하여 생성 중에 추가 애플리케이션을 위한 수정 또는 등급을 포함하는 명시적 피드백을 유발합니다. 따라서 수년에 걸쳐 이러한 전략은 검색 및 응답 생성 프로세스를 개선하여 보다 정확하고 관련성 높은 답변을 생성할 수 있도록 합니다6.