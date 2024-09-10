Think 时事通讯
超越提示思考，全面了解背景
通过 Think 时事通讯，随时了解最新的行业新闻、AI 工具以及提示工程领域的新兴趋势。此外，还可以访问新的阅读解释器、教程和专家洞察分析，我们会将这些内容直接发送到您的收件箱。请参阅 IBM 隐私声明。
零样本提示是一种提示工程方法，它依赖于大语言模型 (LLM) 的预训练来推断适当的响应。与其他提示工程技术（如少样本提示）不同，在使用零样本技术时，模型不会获得输出示例。1
基础模型的承诺之一是，它们可以在不需要额外训练数据的情况下适应多种用例。在零样本提示中，模型被提示生成响应，而无需接收用例所需输出的示例。零样本提示是零样本学习的一种应用，这是一种机器学习模式，要求模型在没有训练数据的情况下进行预测。
在下面的示例中，IBM Granite 系列中的 granite-3-8b-instruct 模型通过零样本提示用于分类用例。2 在此示例中，模型被要求将一个 IT 问题分类为“高”或“低”，表示 问题的紧急程度。在此示例中，模型推断出提示的分类标签为“高”（如粗体输出所示），这是上下文中的适当响应。
注意：该提示在 IBM watsonx.ai Prompt Lab 中使用“自由形式”模式执行。
为描述的问题设置类别名称，选择高、中或低。仅预测最后一个问题的类别名称。简要说明选择该类别名称的原因。
类别名称: 高
描述：业务成本高、影响许多用户或两者兼有的问题。
类别名称：中
描述：介于高低之间的问题。
类别名称: 低
描述：对少数用户有影响，没有高业务成本或两者兼有的问题。
问题：用户报告他们无法上传文件。
类别：高
描述：此问题被认为是高优先级，因为它影响许多用户并且有很高的业务成本。无法上传文件可能会阻止用户完成任务，从而导致延迟和工作效率下降。此外，此问题可能会影响多个部门或团队，从而进一步增加业务成本。
当向模型提出新问题时，零样本提示策略通常是默认的提示工程策略。1此示例演示了模型如何在没有任何明确的响应示例的情况下生成适当的推理。零样本提示场景模拟了人类学习，即运用先前知识解决新问题。3
尽管模型没有获得示例提示，但它获得了关于如何完成任务的详细信息：1
指令： 首先，向模型提供的指令是“为所描述的问题设置类别名称……”
上下文： 接下来，模型的上下文包括类别名称的描述。
输入数据：模型接收输入数据以运行分类任务，提示为“问题：用户报告他们无法上传文件”。
输出指示符：或者，模型可以接收一个输出指示符，在本示例中为文本 “类别：” ，提示模型使用问题的类别名称进行响应。输出指示符向模型指示为特定类型的响应生成什么类型的输出。
此提示的定制格式适用于当前的分类问题。其他用例可能需要不同的提示格式，并且可能不包含相同的指令、上下文、输入数据和输出指示符组件。1 不同的模型可能需要不同的提示格式。请务必遵循有关如何为特定模型格式化提示的任何说明。在此示例中，由于模型的预训练以及使用这些组件精心设计的提示，模型对该任务产生了适当的输出。
与零样本提示不同，少样本提示为模型提供了任务的预期输入和输出示例。1 上图展示了零样本提示和少样本提示之间的区别，其中单样本提示也作为特例显示。
通过使用相同的 IBM granite-3-8b-instruct 模型，提供了此任务的“问题”及其对应“类别”的示例。2所提供的三个输入和输出示例说明了少样本提示策略。为了响应此提示，模型对类别“中”（以粗体突出显示）进行了合理的预测。
注意：该提示在 IBM watsonx.ai Prompt Lab 中使用“自由形式”模式执行。
为描述的问题设置类别名称，选择高、中或低。我已经提供了一些问题及其对应的类别名称示例。仅预测最后一个问题的类别名称。简要说明选择该类别名称的原因。
类别名称: 高
描述：业务成本高、影响许多用户或两者兼有的问题。
类别名称: 中
描述：介于高低之间的问题。
等级名称: 低
描述：对少数用户有影响，没有高业务成本或两者兼有的问题。
问题：新用户报告称他们无法创建帐户。
类别：高
问题：用户报告称，标签在应用程序的分析功能中呈现重叠。
等级：低
问题：美国用户报告称，在尝试进行购买时，应用程序会崩溃。
类别：高
问题：用户报告应用程序中未加载图像。
类别：中
解释：应用程序中图像无法加载的问题影响了用户体验，可能会引起用户的挫败感，但它没有高的业务成本或影响许多用户。因此，它被归类为中类别的问题。
少样本提示是一种从少样本学习范式中衍生出来的策略，通常用于在任务中提高模型相对于零样本提示的性能。1 在此示例中，AI 模型在零样本和少样本场景中都产生了有用的推断。在决定使用零样本还是少样本提示时，应考虑问题的限制以及两种策略的表现。Reynolds 和 McDonell (2021) 发现，随着提示结构的改进，零样本提示在某些场景下可以胜过少样本提示。4Schulhoff 等人（2024）在比较几种提示策略的表现时发现了不同的结果。5
优势
限制
LLM 训练方法的进步改进了模型在各种用例中的零样本提示输出。7
Think 时事通讯
通过 Think 时事通讯，随时了解最新的行业新闻、AI 工具以及提示工程领域的新兴趋势。此外，还可以访问新的阅读解释器、教程和专家洞察分析，我们会将这些内容直接发送到您的收件箱。请参阅 IBM 隐私声明。
零样本提示依赖于基础模型的预训练知识及其适应请求提示并提供适当响应的灵活性。1
在零样本场景中改进响应是研究人员关注的焦点。1零样本提示的准确性通常用于在测试新模型训练方法时作为衡量模型性能的基准。7两项改进使得零样本提示表现更好，分别是指令调整和基于人类反馈的强化学习（RLHF）。8、9
在指令调整中，模型通过在包含各种任务的指令和相应结果的数据集上进行监督学习来进行微调。该数据集包括文本摘要、转换和阅读理解等任务。通过使用指令数据集进行微调的策略，使得模型在这些类别的新任务上零样本提示表现更好。8
另一个通过微调来改善零样本提示结果的例子是 RLHF 微调，在这种微调中， 强化学习 学习一种引导模型产生更好输出的策略。在这个三步过程中，首先，模型通过使用包含人类提供的目标响应的指令数据集进行微调。然后，模型将输出投射到由人类排名的多个提示上。最后，使用这些排名的输出来训练一个强化学习模型，该模型学习一种基于人类提供的排名选择最佳输出的策略。12
最后一步则利用强化学习的能力，利用行动（决策或采取的路径）的后果（奖励或惩罚）来学习制定良好决策的策略（或政策）。在此用例中，问题空间是模型在选择良好输出作为其响应时可能使用的所有潜在策略。9
与传统的自然语言处理（NLP）监督学习相比，零样本提示无需标记训练数据。人工智能从业者和数据科学家可以在零样本提示场景中将大型语言模型的生成式 AI 技术用于各种用例，包括：10
文本分类
如前面的例子所示，使用 IBM 的 granite-3-8b-instruct 模型对 IT 问题的优先级进行分类，模型可以在没有不同类别先前示例的情况下实现分类。这种能力非常适合在有限或没有标记训练数据的情况下使用。这个零样本分类教程展示了此用例的实现。
信息提取
给定一段文本和一个问题，LLM 可以根据提示提取所需的信息。
问题解答
使用模型的预训练知识，用户可以提示对问题的响应。
文本摘要
给定文本和文本摘要的指令，大型语言模型可以在零样本提示场景中运行此任务，而无需其他文本的示例摘要。
生成
LLM 为指定的用例生成文本、代码、图像等形式的数据。
对话
LLM 通常使用专为聊天调整的模型（例如著名的 chat-GPT 系列），可以在聊天模式下与用户交互，从而完成上述的许多用例。
对于复杂的多步骤推理任务等复杂用例，零样本提示和少样本提示可能都无法从模型中产生适当的响应。在这些情况下，包括思维链和思维树在内的高级提示技术可能更成功。
思维链： 思维链 (CoT) 提示是一种策略，它通过将较大任务分解为一系列需要解决的离散步骤来向模型提出任务。这种对中间步骤的阐述提高了模型生成正确响应的能力。因为中间步骤得到了阐明，CoT 还可以提高解决问题过程的透明度。这种提示工程技术在提高客服聊天机器人性能、帮助整理研究人员和作者的想法，以及为数学和科学教育问题生成逐步描述等领域，均取得了成功。11
思维树： 思维树 (ToT) 提示生成一个分支文本树，其中包含潜在的后续步骤和相应的问题可能解决方案。这种树状结构允许模型探索多条路径，并在必要时，在某条路径无法找到可接受的解决方案时进行回溯。其设计目的是在比较通往解决方案的潜在路径时，模拟近似于人类的推理策略。 常见的探索解决方案的策略包括广度优先搜索（BFS）和深度优先搜索（DFS），以及启发式搜索和强化学习方法。研究人员已使用此应用解决诸如数独和24点游戏等谜题。12、 13
与 IBM 携手参与网络研讨会，在此期间我们将展示如何通过智能体 AI 计划实现真正的投资回报率，并提供跨行业、用例的示例，甚至还有 IBM 自身的成功案例。
IBM® Granite® 是一系列开放、高性能且值得信赖的 AI 模型，专为企业量身定制，并经过优化以扩展您的 AI 应用程序。深入了解语言、代码、时间序列和防护措施选项。
使用面向 AI 构建器的新一代企业级开发平台 IBM watsonx.ai，可以训练、验证、调整和部署生成式 AI、基础模型和机器学习功能。使用一小部分数据，即可在很短的时间内构建 AI 应用程序。
借助 IBM 业界领先的 AI 专业知识和解决方案组合，让 AI 在您的业务中发挥作用。
IBM Consulting AI 服务有助于重塑企业利用 AI 实现转型的方式。
通过使用 AI，IBM Concert 可揭示有关运营的重要洞察分析，并提供特定于应用程序的改进建议。了解 Concert 如何推动您的业务向前发展。
1. E. Saravia. "Prompt Engineering Guide." https://github.com/dair-ai/Prompt-Engineering-Guide (accessed Oct 2024).
2. "Granite 3.0 Language Models," IBM Research, Yorktown Heights, NY, Oct 2024. https://github.com/ibm-granite/granite-3.0-language-models/blob/main/paper.pdf
3. B. Romera-Paredes, P. Torr, "An embarrassingly simple approach to zero-shot learning," in ICML, 2015, pp. 2152–2161, https://proceedings.mlr.press/v37/romera-paredes15.pdf.
4. L. Reynolds, K. McDonell, "Prompt Programming for Large Language Models: Beyond the Few-Shot Paradigm", Feb 2021, https://doi.org/10.48550/arXiv.2102.07350.
5. S. Schulhoff, M. Ilie, N. Balepur, K. Kahadze, A. Liu, C. Si, Y. Li, A. Gupta, H. Han, S. Schulhoff, P. S. Dulepet, S. Vidyadhara, D. Ki, S. Agrawal, C. Pham, G. Kroiz, F. Li, H. Tao, A. Srivastava et al. "The Prompt Report: A Systematic Survey of Prompting Techniques," Dec 2024, https://doi.org/10.48550/arXiv.2406.06608.
6. Y. Li, Yinheng, "A Practical Survey on Zero-shot Prompt Design for In-context Learning," in RANLP, July 2023, pp. 641‑647, https://acl-bg.org/proceedings/2023/RANLP%202023/pdf/2023.ranlp-1.69.pdf.
7. H. Touvron, T. Lavril, G. Izacard, X. Martinet, M.-A. Lachaux, T. Lacroix, B. Rozi`ere, N. Goyal, E. Hambro, F. Azhar, A. Rodriguez, A. Joulin, E. Grave and G. Lample, “LLaMA: Open and efficient foundation language models,” Feb 2023, https://doi.org/10.48550/arXiv.2302.13971.
8. J. Wei, M. Bosma, V. Y. Zhao, K. Guu, A. W. Yu, B. Lester, N. Du, A. M. Dai and Q. V. Le, "Finetuned Language Models are Zero-Shot Learners," in ICLR, 2022, https://doi.org/10.48550/arXiv.2109.01652.
9. L. Ouyang, J. Wu, X. Jiang, D. Almeida, C. L. Wainwright, P. Mishkin, C. Zhang, S. Agarwal, K. Slama, A. Ray, J. Schulman, J. Hilton, F. Kelton, L. Miller, M. Simens, A. Askell, P. Welinder, P. Christiano, J. Leike, and R. Lowe, “Training language models to follow instructions with human feedback,” in NeurIPS, 2022, https://proceedings.neurips.cc/paper_files/paper/2022/file/b1efde53be364a73914f58805a001731-Paper-Conference.pdf.
10. P. Liu, W. Yuan, J. Fu, Z. Jiang, H. Hayashi, and G. Neubig, “Pre-train, prompt and predict: A systematic survey of prompting methods in Natural Language Processing,” ACM Computing Surveys, vol. 55, no. 9, pp. 1–35, Jan. 2023, https://dl.acm.org/doi/pdf/10.1145/3560815.
11. J. Wei, X. Wang, D. Schuurmans, M. Bosma, B. Ichter, F. Xia, E. Chi, Q. Le, and D. Zhou, “Chain-of-thought prompting elicits reasoning in large language models,” Jan 2023, https://doi.org/10.48550/arXiv.2201.11903.
12. J. Long, "Large Language Model Guided Tree-of-Thought," May 2023, https://doi.org/10.48550/arXiv.2305.08291.
13. S. Yao, D. Yu, J. Zhao, I. Shafran, T. L. Griffiths, Y. Cao, and K. Narasimhan, "Tree of Thoughts: Deliberate Problem Solving with Large Language Models," Dec 2023, https://doi.org/10.48550/arXiv.2305.10601.