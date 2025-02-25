高级 RAG 以基于步骤的顺序流程运行，如下所示：

1. 查询处理：收到用户查询后，使用嵌入模型将其转换为高维矢量，以捕获查询的语义。

2. 文档检索：编码后的查询会遍历一个庞大的知识数据库，该数据库通过使用密集矢量搜索和稀疏检索（即语义相似性和基于关键词的搜索）提供混合检索。因此，其结果会将语义关键字匹配引入到检索文件中。

3. 对检索到的文档重新排名：检索器会根据上下文并结合检索文档的查询给出最终分数。

4. 上下文融合生成：由于每个文档的编码都不同，解码器会融合所有编码上下文，以确保生成的回复与编码查询一致。

5. 响应生成：高级 RAG 的生成器（通常是 LLM），例如 IBM Granite™ 模型或 Llama，会根据检索到的文档提供答案。

6. 反馈循环：由于高级 RAG 使用主动学习、强化学习和检索器-生成器协同训练等各种技术来不断提高其性能。在此阶段会发生隐性信号，例如点击检索到的文档，从而推断相关性，并引发显性反馈，包括更正或评分，以便在生成中进一步应用。因此，多年来，这些策略改进了检索和响应生成过程，从而生成更准确、更相关的答案6。