优化知识库,促进检索增强生成
您可以调整知识库中的内容,使其更容易被检索增强生成(RAG)模式的人工智能生成模型访问。 通过调整内容以适应生成式人工智能,您可以提高从内容中生成的人工智能响应的质量。 根据您的内容和 RAG 解决方案,您可以弥补工具的限制或消除对某些类型处理的需求。
您可以通过在 RAG 解决方案中测试内容和制定指南来调整知识库内容。
您可以创建主动式指南,为人工智能准备好内容;也可以创建被动式指南,在人工智能回答不充分时修复内容。 下表总结了创建和实施准则以准备或修复内容的不同之处。
| 指导原则的目的 | 制定准则的方法 | 内容更新的范围 | 内容更新的时间安排 |
|---|---|---|---|
| 为人工智能准备内容 | 在 RAG 解决方案中测试您的内容。 | - 所有现有内容或关键内容 - 所有新内容 |
- 在将 RAG 解决方案投入生产之前 - 在编写新内容期间 |
| 为人工智能修复内容 | 收集用户对 RAG 解决方案的反馈意见 | - 特定主题或段落 - 相似主题或段落 |
收到用户对人工智能答案的负面反馈后 |
为人工智能内容编写指南
通过创建和应用为人工智能准备内容的指南,您可以为人类和人工智能提高内容质量。
为了制定指导原则,请使用生成式人工智能对内容进行测试。 使用消耗知识库的 RAG 解决方案进行测试,可以获得最准确的结果。 如果您使用与最终 RAG 解决方案不同的系统测试内容,结果可能会有所不同,您可能需要重新测试并调整指导原则。
为人工智能内容的准备工作制定指导原则:
- 收集有代表性的问题和回答这些问题的主题。 为了达到最佳效果,请收集用户提出的问题,而不是猜测用户可能会问什么。 客户问题可帮助您锁定 RAG 解决方案最有可能检索到的内容。 您不需要测试每篇内容、每种类型的内容或每种内容格式。
- 测试模型是否能根据您的内容生成足够的问题答案。 为获得最佳效果,请直接在 RAG 溶液中进行测试。 或者,您也可以在提示符中输入问题和内容中的适用文本,然后检查生成的答案。
- 当人工智能的答案不充分时,可以尝试调整内容,直到获得充分的答案。 见适应技术。
- 根据趋势制定指导方针。 参见指导原则范例。
为人工智能准备内容的适应技术
如果您发现 RAG 解决方案生成的问题答案不够充分,而您的知识库中已有答案,请尝试调整该内容。 例如,您可以尝试以下技巧来改进答案:
- 更改内容格式或重新排列内容。 例如,你可以尝试用项目符号列表代替长段落或简化表格。
- 澄清概念或改进关键术语的定义。
- 添加上下文,以明确主题或内容范围。 例如,您可以添加章节标题。
- 添加长内容摘要。
- 用特定名词替换模糊代词。 例如,确保每个带有代词的句子都包含其所指代的名词。
为人工智能准备内容的指南范例
以下关于为人工智能准备内容的指导原则示例可能适用于您的内容:
- 解释文本中的概念图形
- 通过用文字清晰地解释概念图形,可以澄清图形中的模糊之处,避免从图像到文字模型的花费。 使用图形来说明文字,但不能取代文字。 图形可能会过度简化概念,因为它们省略了信息或没有明确指出哪些项目是可选的。 通过在文本中解释一个过程或概念,就好像你没有图形一样,这样可以避免读者和法律硕士产生混淆。
- 在文本中包含图标名称
- 通过在文本中包含图标和其他用户界面元素的名称,而不是只显示它们的图像,可以为人工智能提供完整的句子。 例如,如果没有图标的图像,"要编辑资产,请单击
"这句话就不完整。 不过,"要编辑资产,请单击编辑图标 "这句话在没有图标图像的情况下还是可以理解的。
- 总结冗长的程序和教程
- 如果您的程序或教程较长,法律硕士可能无法在答案中容纳全部内容。 添加步骤摘要有助于法律硕士回答问题。 摘要还为用户设定了期望值。
- 为列表添加清晰的引导句
- 如果没有引导句,法律硕士可能很难确定列表的主题。
- 删除非常简短的主题
- 非常简短的题目可能无法提供足够的信息,让法律硕士对问题做出适当的回答。 例如,一个非常简短的父主题可以用来组织目录中的子主题,但包含的有价值内容却很少。 非常简短的主题可能会导致人工智能无法提供充分的答案,并使访问这些主题的用户感到失望。 您可以删除非常简短的主题,或者为其添加有价值的内容。
制定人工智能内容修复指南
最好的办法是通过实施反馈机制,确定如何修正人工智能导致答案不充分的内容。 您的人工用户可以指出答案的错误之处。 存储反馈、问题、答案和检索到的主题。
制定指导方针:
- 收集用户对人工智能答案的负面反馈。
- 确定答案不充分的原因。
- 如果合适,更新目标主题,直到人工智能给出更好的答案。 用原题的几个变式来测试你的改动。 参见 " 技术适应 "。
- 当您看到您更新的主题的趋势时,请创建一个指南。 参见指导原则范例。
为人工智能修复内容的适应技术
要修复您的内容,您可以对其进行更改或添加。
下表介绍了一些修复导致人工智能回答不充分的内容的技巧。
| 问题 | 解决方案 |
|---|---|
| 内容不存在。 | 不要添加不属于知识库的内容。 |
| 内容是存在的,但法律硕士没有找到。 | 尝试更新主题标题、章节标题和主题中的术语。 |
| 法学硕士不了解内容。 | 更新主题中的信息,以明确内容。 更新信息的格式。 |
| 法律硕士提供了部分答案。 | 尝试重新调整信息的格式,或提供冗长内容的摘要。 |
当用户对人工智能答案提出负面反馈时,你不能总是通过修改内容来解决。 您可能会发现导致答案不充分的其他原因,但这些原因并不容易或不可能解决。 用户提出的问题可能不够清晰、完整或格式化,法律硕士无法理解。 例如,用户问题就可能存在这类问题:
- 拼写错误的单词
- 没有足够信息的模糊问题
- 语法错误
- 术语不正确
- 与您的知识库无关的主题
人工智能内容修复指南范例
以下关于人工智能内容修复指南的示例可能适用于您的内容:
- 澄清容易混淆的内容
- 您可以澄清含糊不清、细节过多或缺乏上下文的内容。
- 为缺失信息添加内容
- 您可以添加内容来弥补文档中的不足,或提及缺失功能的替代方案。 例如,假设客户经常向植物苗圃询问购买蔬菜种子的事宜,而苗圃并不出售蔬菜种子。 育苗聊天机器人会用 "不知道 "或 "不 "回答有关种子的问题。 苗圃工作人员可以在知识库中加入这样一句话:"我们不卖种子,但我们有大量的蔬菜秧苗可供选择" 这样,法律硕士就能提供有用的答案。
- 添加或更改术语
- 用户使用的术语可能与您在文档中使用的不同。 如果您发现了一种趋势,您可以提及替代术语,以便法律硕士找到它。 例如,可以说 "法律硕士的错误回答有时被称为幻觉"。