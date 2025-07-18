외부 데이터 소스에 LLM을 연결하는 검색 증강 생성(RAG)의 개발로 인해 청킹 시스템을 만드는 것이 필요해졌습니다. RAG 시스템은 LLM이 실제 결과나 정보를 반영하지 않는 답변을 제공하는 할루시네이션 문제에 대응하는 데 도움이 되었습니다.

RAG 시스템은 LLM이 추가 지식 기반과 결합하여 더 정확하고 유용한 답변을 생성할 수 있도록 도와줍니다. 대부분의 경우 RAG 지식 기반은 연결된 LLM이 도메인별 지식에 액세스할 수 있는 문서를 포함하는 벡터 데이터베이스입니다. 임베딩 모델은 문서를 수학적 벡터로 변환한 다음 사용자 쿼리에 대해 동일한 작업을 수행합니다.

RAG 시스템은 벡터 데이터베이스 내에서 관련 정보를 나타내고 사용자 쿼리와 일치하는 임베딩을 찾습니다. 그런 다음 LLM은 검색된 데이터를 사용하여 사용자에게 보다 관련성이 높고 정확한 답변을 제공합니다.

그러나 컨텍스트 창의 제한으로 인해 LLM은 한 번에 단일 문서를 처리할 수 없습니다. 청킹이 해결책으로 떠올랐습니다. LLM은 문서를 조각으로 나누어 문맥 이해를 유지하면서 실시간으로 관련 청크를 효율적으로 찾을 수 있습니다.