优化知识库，促进检索增强生成

您可以调整知识库中的内容，使其更容易被检索增强生成（RAG）模式的人工智能生成模型访问。通过调整内容以适应生成式人工智能，您可以提高从内容中生成的人工智能响应的质量。根据您的内容和 RAG 解决方案，您可以弥补工具的限制或消除对某些类型处理的需求。

您可以通过在 RAG 解决方案中测试内容和制定指南来调整知识库内容。

您可以创建主动式指南，为人工智能准备好内容；也可以创建被动式指南，在人工智能回答不充分时修复内容。下表总结了创建和实施准则以准备或修复内容的不同之处。

为人工智能方法调整内容的比较
指导原则的目的	制定准则的方法	内容更新的范围	内容更新的时间安排
为人工智能准备内容	在 RAG 解决方案中测试您的内容。	- 所有现有内容或关键内容 - 所有新内容	- 在将 RAG 解决方案投入生产之前 - 在编写新内容期间
为人工智能修复内容	收集用户对 RAG 解决方案的反馈意见	- 特定主题或段落 - 相似主题或段落	收到用户对人工智能答案的负面反馈后

重要：地基模型在不断改进。您今天制定的准则将来可能不再需要。更新 RAG 解决方案后，重新测试指导原则。

为人工智能内容编写指南

通过创建和应用为人工智能准备内容的指南，您可以为人类和人工智能提高内容质量。

为了制定指导原则，请使用生成式人工智能对内容进行测试。使用消耗知识库的 RAG 解决方案进行测试，可以获得最准确的结果。如果您使用与最终 RAG 解决方案不同的系统测试内容，结果可能会有所不同，您可能需要重新测试并调整指导原则。

为人工智能内容的准备工作制定指导原则：

收集有代表性的问题和回答这些问题的主题。为了达到最佳效果，请收集用户提出的问题，而不是猜测用户可能会问什么。客户问题可帮助您锁定 RAG 解决方案最有可能检索到的内容。您不需要测试每篇内容、每种类型的内容或每种内容格式。
测试模型是否能根据您的内容生成足够的问题答案。为获得最佳效果，请直接在 RAG 溶液中进行测试。或者，您也可以在提示符中输入问题和内容中的适用文本，然后检查生成的答案。
当人工智能的答案不充分时，可以尝试调整内容，直到获得充分的答案。见适应技术。
根据趋势制定指导方针。参见指导原则范例。

为人工智能准备内容的适应技术

如果您发现 RAG 解决方案生成的问题答案不够充分，而您的知识库中已有答案，请尝试调整该内容。例如，您可以尝试以下技巧来改进答案：

更改内容格式或重新排列内容。例如，你可以尝试用项目符号列表代替长段落或简化表格。
澄清概念或改进关键术语的定义。
添加上下文，以明确主题或内容范围。例如，您可以添加章节标题。
添加长内容摘要。
用特定名词替换模糊代词。例如，确保每个带有代词的句子都包含其所指代的名词。

提示：计划重新格式化内容时要谨慎。例如，如果您的 LLM 不能很好地处理表格，就不要计划删除表格。表格对人类读者非常有用，当您更换表格时，您的 RAG 解决方案可能已经能够处理它们了。只有在能提高内容整体质量的情况下，才进行大范围修改。

为人工智能准备内容的指南范例

以下关于为人工智能准备内容的指导原则示例可能适用于您的内容：

解释文本中的概念图形: 通过用文字清晰地解释概念图形，可以澄清图形中的模糊之处，避免从图像到文字模型的花费。使用图形来说明文字，但不能取代文字。图形可能会过度简化概念，因为它们省略了信息或没有明确指出哪些项目是可选的。通过在文本中解释一个过程或概念，就好像你没有图形一样，这样可以避免读者和法律硕士产生混淆。
在文本中包含图标名称: 通过在文本中包含图标和其他用户界面元素的名称，而不是只显示它们的图像，可以为人工智能提供完整的句子。例如，如果没有图标的图像，"要编辑资产，请单击 "这句话就不完整。不过，"要编辑资产，请单击编辑图标 "这句话在没有图标图像的情况下还是可以理解的。
总结冗长的程序和教程: 如果您的程序或教程较长，法律硕士可能无法在答案中容纳全部内容。添加步骤摘要有助于法律硕士回答问题。摘要还为用户设定了期望值。
为列表添加清晰的引导句: 如果没有引导句，法律硕士可能很难确定列表的主题。
删除非常简短的主题: 非常简短的题目可能无法提供足够的信息，让法律硕士对问题做出适当的回答。例如，一个非常简短的父主题可以用来组织目录中的子主题，但包含的有价值内容却很少。非常简短的主题可能会导致人工智能无法提供充分的答案，并使访问这些主题的用户感到失望。您可以删除非常简短的主题，或者为其添加有价值的内容。

制定人工智能内容修复指南

最好的办法是通过实施反馈机制，确定如何修正人工智能导致答案不充分的内容。您的人工用户可以指出答案的错误之处。存储反馈、问题、答案和检索到的主题。

制定指导方针：

收集用户对人工智能答案的负面反馈。
确定答案不充分的原因。
如果合适，更新目标主题，直到人工智能给出更好的答案。用原题的几个变式来测试你的改动。参见 " 技术适应 "。
当您看到您更新的主题的趋势时，请创建一个指南。参见指导原则范例。

为人工智能修复内容的适应技术

要修复您的内容，您可以对其进行更改或添加。

下表介绍了一些修复导致人工智能回答不充分的内容的技巧。

解决答案不充分问题的办法
问题	解决方案
内容不存在。	不要添加不属于知识库的内容。
内容是存在的，但法律硕士没有找到。	尝试更新主题标题、章节标题和主题中的术语。
法学硕士不了解内容。	更新主题中的信息，以明确内容。更新信息的格式。
法律硕士提供了部分答案。	尝试重新调整信息的格式，或提供冗长内容的摘要。

当用户对人工智能答案提出负面反馈时，你不能总是通过修改内容来解决。您可能会发现导致答案不充分的其他原因，但这些原因并不容易或不可能解决。用户提出的问题可能不够清晰、完整或格式化，法律硕士无法理解。例如，用户问题就可能存在这类问题：

拼写错误的单词
没有足够信息的模糊问题
语法错误
术语不正确
与您的知识库无关的主题

提示：谨慎更改内容。不要试图解决每一个不恰当的回答或负面反馈。根据趋势制定指导方针。

人工智能内容修复指南范例

以下关于人工智能内容修复指南的示例可能适用于您的内容：

澄清容易混淆的内容: 您可以澄清含糊不清、细节过多或缺乏上下文的内容。
为缺失信息添加内容: 您可以添加内容来弥补文档中的不足，或提及缺失功能的替代方案。例如，假设客户经常向植物苗圃询问购买蔬菜种子的事宜，而苗圃并不出售蔬菜种子。育苗聊天机器人会用 "不知道 "或 "不 "回答有关种子的问题。苗圃工作人员可以在知识库中加入这样一句话："我们不卖种子，但我们有大量的蔬菜秧苗可供选择" 这样，法律硕士就能提供有用的答案。
添加或更改术语: 用户使用的术语可能与您在文档中使用的不同。如果您发现了一种趋势，您可以提及替代术语，以便法律硕士找到它。例如，可以说 "法律硕士的错误回答有时被称为幻觉"。