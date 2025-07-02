검색 증강 생성(RAG)은 LLM을 외부 데이터 소스와 연결하여 지식 기반을 확장합니다. 사용자가 쿼리를 제출하면 RAG 시스템은 쌍을 이루는 데이터베이스에서 관련 정보를 검색한 다음 이를 쿼리와 결합하여 응답을 생성할 때 LLM에 더 많은 컨텍스트를 제공합니다.

RAG는 임베딩을 사용하여 검색 가능한 벡터 데이터베이스에서 데이터베이스, 소스 코드 또는 기타 정보를 변환합니다. 임베딩은 3차원 벡터 공간에 각 데이터 포인트를 수학적으로 표시합니다. RAG 시스템의 정보 검색 모델은 관련 데이터를 찾기 위해 사용자 쿼리를 임베딩으로 변환하고 벡터 데이터베이스에서 유사한 임베딩을 찾습니다.

RAG 시스템은 일반적으로 다음과 같은 동일한 표준 시퀀스를 따릅니다.

프롬프트: 사용자는 AI 기반 챗봇과 같은 사용자 인터페이스에 프롬프트를 제출합니다. 쿼리: 정보 검색 모델은 프롬프트를 임베딩으로 변환하고 데이터베이스에서 유사한 데이터를 쿼리합니다. 검색: 검색 모델은 데이터베이스에서 관련 데이터를 검색합니다. 생성: RAG 시스템은 검색된 데이터를 사용자의 쿼리와 결합하고 LLM에 제출하여 응답을 생성합니다. 전달: RAG 시스템은 생성된 응답을 사용자에게 반환합니다.

RAG는 RAG 시스템이 관련 데이터를 검색하고 이를 사용하여 LLM에서 생성한 응답을 보강하는 방식 때문에 붙여진 이름입니다. 더 복잡한 RAG 시스템은 프로세스를 개선하고 응답 품질을 더욱 향상시키기 위해 추가 구성 요소를 도입합니다.