检索增强生成 (RAG) 将 LLM 与外部数据源连接起来，以扩展其知识库。当用户提交查询时，RAG 系统会在配对数据库中搜索相关信息，然后将其与查询相结合，为 LLM 生成响应提供更丰富的上下文。

RAG 利用嵌入将数据库、源代码或其他信息转换为可搜索的矢量数据库。嵌入通过数学方式将每个数据点绘制在三维向量空间中。为了查找相关数据，RAG 系统中的信息检索模型将用户查询转换为嵌入，并在矢量数据库中查找相似的嵌入。

RAG 系统通常遵循以下标准流程：

提示：用户通过用户界面（例如，人工智能驱动聊天机器人）提交提示。 查询：信息检索模型将提示转换为嵌入，并在数据库中查询相似数据。 检索：检索模型从数据库中检索相关数据。 生成：RAG 系统将检索到的数据与用户查询相结合，并将其提交给 LLM，LLM 随即生成响应。 交付： RAG 系统将生成的响应返回给用户。

RAG 的名称，源于其系统检索相关数据，并复用这些数据增强 LLM 所生成响应的方式。更复杂的 RAG 系统会引入更多组件，以优化流程并进一步提升响应质量。