检索增强生成 (RAG) 的发展——将 LLM 与外部数据源连接起来——催生了分块系统的创建需求。RAG 系统的出现有助于解决幻觉问题：当 LLM 给出的答案不能反映真实世界的结果或信息时，就会出现幻觉。

RAG 系统通过为 LLM 配对附加知识库，帮助其生成更准确、更有用的答案。多数情况下，RAG 知识库包含文档的向量数据库，这些文档使连接的 LLM 能够访问特定领域的知识。嵌入模型将文档转换为数学向量，然后对用户查询执行相同的操作。

RAG 系统在其向量数据库中查找与用户查询匹配的相关信息嵌入表示。然后，LLM 使用检索到的数据为用户提供更相关和更准确的答案。

但由于上下文窗口的限制，LLM 无法一次性处理整个文档。分块技术由此成为解决方案。通过将文档分解为片段，LLM 可在保持上下文理解的同时，实时高效查找相关分块。