优化知识库,促进检索增强生成

您可以调整知识库中的内容,使其更容易被检索增强生成(RAG)模式的人工智能生成模型访问。 通过调整内容以适应生成式人工智能,您可以提高从内容中生成的人工智能响应的质量。 根据您的内容和 RAG 解决方案,您可以弥补工具的限制或消除对某些类型处理的需求。

您可以通过在 RAG 解决方案中测试内容和制定指南来调整知识库内容。

您可以创建主动式指南,为人工智能准备好内容;也可以创建被动式指南,在人工智能回答不充分时修复内容。 下表总结了创建和实施准则以准备或修复内容的不同之处。

为人工智能方法调整内容的比较
指导原则的目的 制定准则的方法 内容更新的范围 内容更新的时间安排
为人工智能准备内容 在 RAG 解决方案中测试您的内容。 - 所有现有内容或关键内容
- 所有新内容
- 在将 RAG 解决方案投入生产之前
- 在编写新内容期间
为人工智能修复内容 收集用户对 RAG 解决方案的反馈意见 - 特定主题或段落
- 相似主题或段落
收到用户对人工智能答案的负面反馈后
重要: 地基模型在不断改进。 您今天制定的准则将来可能不再需要。 更新 RAG 解决方案后,重新测试指导原则。

为人工智能内容编写指南

通过创建和应用为人工智能准备内容的指南,您可以为人类和人工智能提高内容质量。

为了制定指导原则,请使用生成式人工智能对内容进行测试。 使用消耗知识库的 RAG 解决方案进行测试,可以获得最准确的结果。 如果您使用与最终 RAG 解决方案不同的系统测试内容,结果可能会有所不同,您可能需要重新测试并调整指导原则。

为人工智能内容的准备工作制定指导原则:

  1. 收集有代表性的问题和回答这些问题的主题。 为了达到最佳效果,请收集用户提出的问题,而不是猜测用户可能会问什么。 客户问题可帮助您锁定 RAG 解决方案最有可能检索到的内容。 您不需要测试每篇内容、每种类型的内容或每种内容格式。
  2. 测试模型是否能根据您的内容生成足够的问题答案。 为获得最佳效果,请直接在 RAG 溶液中进行测试。 或者,您也可以在提示符中输入问题和内容中的适用文本,然后检查生成的答案。
  3. 当人工智能的答案不充分时,可以尝试调整内容,直到获得充分的答案。 见适应技术
  4. 根据趋势制定指导方针。 参见指导原则范例

为人工智能准备内容的适应技术

如果您发现 RAG 解决方案生成的问题答案不够充分,而您的知识库中已有答案,请尝试调整该内容。 例如,您可以尝试以下技巧来改进答案:

  • 更改内容格式或重新排列内容。 例如,你可以尝试用项目符号列表代替长段落或简化表格。
  • 澄清概念或改进关键术语的定义。
  • 添加上下文,以明确主题或内容范围。 例如,您可以添加章节标题。
  • 添加长内容摘要。
  • 用特定名词替换模糊代词。 例如,确保每个带有代词的句子都包含其所指代的名词。
提示: 计划重新格式化内容时要谨慎。 例如,如果您的 LLM 不能很好地处理表格,就不要计划删除表格。 表格对人类读者非常有用,当您更换表格时,您的 RAG 解决方案可能已经能够处理它们了。 只有在能提高内容整体质量的情况下,才进行大范围修改。

为人工智能准备内容的指南范例

以下关于为人工智能准备内容的指导原则示例可能适用于您的内容:

解释文本中的概念图形
通过用文字清晰地解释概念图形,可以澄清图形中的模糊之处,避免从图像到文字模型的花费。 使用图形来说明文字,但不能取代文字。 图形可能会过度简化概念,因为它们省略了信息或没有明确指出哪些项目是可选的。 通过在文本中解释一个过程或概念,就好像你没有图形一样,这样可以避免读者和法律硕士产生混淆。
在文本中包含图标名称
通过在文本中包含图标和其他用户界面元素的名称,而不是只显示它们的图像,可以为人工智能提供完整的句子。 例如,如果没有图标的图像,"要编辑资产,请单击 编辑图标的图像"这句话就不完整。 不过,"要编辑资产,请单击编辑图标 "这句话在没有图标图像的情况下还是可以理解的。
总结冗长的程序和教程
如果您的程序或教程较长,法律硕士可能无法在答案中容纳全部内容。 添加步骤摘要有助于法律硕士回答问题。 摘要还为用户设定了期望值。
为列表添加清晰的引导句
如果没有引导句,法律硕士可能很难确定列表的主题。
删除非常简短的主题
非常简短的题目可能无法提供足够的信息,让法律硕士对问题做出适当的回答。 例如,一个非常简短的父主题可以用来组织目录中的子主题,但包含的有价值内容却很少。 非常简短的主题可能会导致人工智能无法提供充分的答案,并使访问这些主题的用户感到失望。 您可以删除非常简短的主题,或者为其添加有价值的内容。

制定人工智能内容修复指南

最好的办法是通过实施反馈机制,确定如何修正人工智能导致答案不充分的内容。 您的人工用户可以指出答案的错误之处。 存储反馈、问题、答案和检索到的主题。

制定指导方针:

  1. 收集用户对人工智能答案的负面反馈。
  2. 确定答案不充分的原因。
  3. 如果合适,更新目标主题,直到人工智能给出更好的答案。 用原题的几个变式来测试你的改动。 参见 " 技术适应 "。
  4. 当您看到您更新的主题的趋势时,请创建一个指南。 参见指导原则范例

为人工智能修复内容的适应技术

要修复您的内容,您可以对其进行更改或添加。

下表介绍了一些修复导致人工智能回答不充分的内容的技巧。

解决答案不充分问题的办法
问题 解决方案
内容不存在。
不要添加不属于知识库的内容。
内容是存在的,但法律硕士没有找到。 尝试更新主题标题、章节标题和主题中的术语。
法学硕士不了解内容。 更新主题中的信息,以明确内容。
更新信息的格式。
法律硕士提供了部分答案。 尝试重新调整信息的格式,或提供冗长内容的摘要。

当用户对人工智能答案提出负面反馈时,你不能总是通过修改内容来解决。 您可能会发现导致答案不充分的其他原因,但这些原因并不容易或不可能解决。 用户提出的问题可能不够清晰、完整或格式化,法律硕士无法理解。 例如,用户问题就可能存在这类问题:

  • 拼写错误的单词
  • 没有足够信息的模糊问题
  • 语法错误
  • 术语不正确
  • 与您的知识库无关的主题
提示: 谨慎更改内容。 不要试图解决每一个不恰当的回答或负面反馈。 根据趋势制定指导方针。

人工智能内容修复指南范例

以下关于人工智能内容修复指南的示例可能适用于您的内容:

澄清容易混淆的内容
您可以澄清含糊不清、细节过多或缺乏上下文的内容。
为缺失信息添加内容
您可以添加内容来弥补文档中的不足,或提及缺失功能的替代方案。 例如,假设客户经常向植物苗圃询问购买蔬菜种子的事宜,而苗圃并不出售蔬菜种子。 育苗聊天机器人会用 "不知道 "或 "不 "回答有关种子的问题。 苗圃工作人员可以在知识库中加入这样一句话:"我们不卖种子,但我们有大量的蔬菜秧苗可供选择" 这样,法律硕士就能提供有用的答案。
添加或更改术语
用户使用的术语可能与您在文档中使用的不同。 如果您发现了一种趋势,您可以提及替代术语,以便法律硕士找到它。 例如,可以说 "法律硕士的错误回答有时被称为幻觉"。