DSPy 可以在几种不同类型的工作流和场景中发挥作用。其中最常用的一些是检索增强生成、多跳问题解答和文档摘要。

思维链

思维链(CoT) 提示通过要求模型将复杂任务分解为一系列逻辑步骤，最终实现解决方案，以模拟类似人类的推理过程。这些推理步骤被输入到模型的上下文窗口中，为其提供手头任务的更多基础，即使在复杂的场景中也通常会产生更好的响应。DSPy 通过让语言模型生成思维链提示和策略，并使用语言模型对其进行测试，以生成给定模型的最有效 CoT 提示来提供帮助。

检索增强生成

检索增强生成 (RAG) 是一种方法，它允许 LLM 利用来自各个来源的大量知识库，查询其知识存储，以查找相关段落或内容并产生完善的响应。RAG 确保 LLM 即使没有在主题上进行原始训练，也能动态使用实时知识并给出正确答案。这种额外的能力会导致设置 RAG 管道时变得更加复杂。DSPy 提供了一种无缝的方法来设置提示管道，无论是生成有效提示（提示调整）还是在较小模型的情况下，微调模型权重本身。

DSPy 可以通过两种方式优化 RAG 管道：使用标记示例或使用引导法示例。标记示例是预先存在的、手动标记的示例，直接用于训练学生模型。在 DSPy 的上下文中，引导法意味着在教师和学生范式中使用语言模式。教师根据用户提供的几个提示生成新的训练示例。然后，这些引导示例与手动标记的示例一起使用或代替手动标记的示例来训练学生模块，直到它提供正确的答案。然后，生成正确响应的提示将在整个 DSPy 管道中迭代更新。

多跳问题解答

很多时候，单一的搜索查询不足以完成复杂的问题解答任务。流行的 HotPot Question Answering 数据集包含需要多次问题解析和检索才能回答的问题。例如：“Bill Nelson 作为有效载荷专家乘坐的航天飞机首次发射是在哪一年？”这个答案需要知道 Bill Nelson 乘坐的是哥伦比亚号航天飞机，然后能够确定哥伦比亚号首次飞行是在 1981 年。

在检索增强文献中，应对这一挑战的标准方法是构建多跳搜索系统。这些系统读取检索到的结果，然后在必要时生成额外的查询以收集额外的信息，直到得出最终答案。使用 DSPy，您可以通过几行代码以可靠的方式创建相同的系统，允许您更新模型并轻松地重新运行管道。

摘要

摘要将较长的文本压缩成较短的版本，同时仍然保留关键信息和主要观点。对于 LLM 来说，这是一项很强的技能，应用范围很广，从创建文章摘要到从冗长的文档中生成简洁的报告。

评估语言模型生成摘要的质量提出了重大挑战。与具有明确正确或错误答案的任务不同，摘要质量往往是主观的并且依赖于上下文。该模型需要平衡信息保留与简洁性，同时保留原始文本的语气和意图，并确保事实准确，不引入错误。适应不同类型的源材料和摘要目的构成了额外的挑战。DSPy 允许您使用标记的数据来调整摘要提示，以获得尽可能好的响应。