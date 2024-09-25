Think 时事通讯
少样本提示是指向 AI 模型提供一些任务实例来指导其执行任务的过程。这种方法在无法获取大量训练数据的情况下特别有用。
在生成式 AI 中，少样本学习在收集大量标记数据具有挑战性的情况下至关重要。提示方法可将文本输入转换为结构化格式，允许 IBM granite 系列、Meta 的 Llama 模型以及 OpenAI 的 GPT-3 和 GPT-4 等模型以适当的响应来填补空白，无需大量标记数据集即可有效执行任务。 [1]该技术还通过具体实例引导模型，确保所需结构的一致性和准确性，从而支持获得预定义的输出格式。
在人工智能 (AI)、机器学习 (ML) 和自然语言处理 (NLP) 快速发展的领域中，少样本提示作为一种强大的技术脱颖而出。这种方法允许模型在只有少量示例的情况下执行任务，使其与其他提示方法（如零样本和单样本提示）区分开来。要充分发挥 OpenAI 的 GPT-3/GPT-4 和其他大型语言模型 (LLM) （如 IBM Granite 模型或 Meta 的 Llama 模型）等先进 AI 系统的潜力，理解少样本提示至关重要。
图 1 展示了一个使用大型语言模型进行情感分类的少样本学习过程。该提示提供了标记为“正面”或“负面”的文本示例。在看到这些标记的示例后，模型的任务是将一段新文本（“该产品性价比很高”）分类为“正面”。这表明少样本学习如何使模型能够从少量示例中泛化，以执行特定任务。
少样本提示通过在提示中向模型展示几个期望任务的示例来运作。该技术充分利用大型语言模型（LLM）的预训练知识，即使在数据有限的情况下，也能高效地执行特定任务。
用户查询： 该流程从用户查询开始，例如“该产品性价比很高”。
矢量存储：所有示例都存储在矢量存储中，这是一个针对语义搜索优化的数据库。当收到用户查询时，系统执行语义匹配，从矢量存储中找到最相关的示例。
检索相关示例：只检索最相关的示例并用于形成提示。在此示例中，检索增强生成 (RAG) 用于从矢量存储中检索示例，这有助于根据特定查询定制提示。虽然 RAG 并非少样本提示所必需，但它可以通过确保使用最相关的上下文示例，显著增强该流程，从而在某些场景中提高模型的性能。
形成提示：根据检索到的示例和用户查询构建提示。例如，提示可能如下所示：
LLM 处理：构建的提示随后被输入到 LLM 中。该模型处理提示并生成输出，在本例中，是对用户查询的情感进行分类。
输出：LLM 输出分类结果，如给定示例的“负面”分类。
研究表明，少样本学习方法减少了对广泛提示工程的依赖，效果显著。与传统的微调不同，微调是指在提示前使用大量数据集调整模型参数，而少样本设置中的微调是指直接在提示中使用少量示例来适应预训练模型。这种方法允许模型更有效地利用其现有的知识，而无需在大型数据集上进行额外训练。[2]这项研究表明，即使使用“空提示”，即不包含任何特定于任务的模板或标记示例的提示，该模型仍然可以在各种任务中实现具有竞争力的准确性。例如，空提示可能只是提出一个问题，例如“以下文本的情感是什么？”而不提供任何具体示例或关于如何分类情感的指示。尽管缺乏结构，但该模型仍能表现良好，展示了少样本学习的稳健性。
总的来说，研究表明少样本学习是一种非常有效的策略，特别是在使用结构化提示时。虽然空提示可以产生良好的结果，但添加一些精心选择的示例可以进一步提高模型的性能，使其成为一种多功能且高效的解决方案，特别是在标记数据有限的情况下。[1]
少样本提示是一种强大的自然语言处理（NLP）技术，允许模型在只有少量示例的情况下执行任务。这种方法有多个优势和局限性，影响其有效性和适用性。
优势
限制
因此，小样本提示在各种应用的效率、灵活性和性能方面具有显著的优势。然而，其对提示质量的依赖、计算复杂性、泛化挑战和有限的零样本能力突显了需要进一步发展以最大化其潜力的领域。
事实证明，小样本提示是一种多功能且强大的工具，在各种应用中都有大量示例，它利用大型语言模型的优势，用有限的示例执行复杂的任务。它在内容创作或上下文学习等创意型生成式 AI 用例中很受欢迎。下面详细介绍一些典型用例：
情感分析
少样本提示在情感分析中特别有用，模型可以根据有限的标记数据对文本的情感进行分类。如图 2 所示，少样本提示与语义匹配的整合就是一个例子。它允许模型根据矢量存储中的相关示例准确地对情感进行分类。[1]
视频中的动作识别
少样本提示也已应用于视频中的动作识别。Yuheng Shi 等人引入了知识提示，充分利用外部资源中的常识性知识来提示视觉语言模型。这种方法在只有少量监督的情况下有效分类视频中的动作，实现了最先进的性能，同时显著减少了训练开销。[8]
基于上下文的对话生成
在基于上下文的对话生成或聊天机器人中，少样本提示通过整合外部信息源增强了对话模型。这项研究表明，少样本提示方法可以显著提高对话模型的性能，使其更加连贯和上下文相关。[9]
Named Entity Recognition (NER)
少样本提示可提供有助于模型对文本中的实体进行识别和分类的示例，从而增强 NER 任务。以下引用研究的作者开发了一种用于问答任务的基于实体感知提示的小样本学习方法，该方法可适用于 NER 任务，从而显着提高模型性能。 [10]
代码生成任务
少样本提示还适用于与代码相关的任务，例如测试断言生成和程序修复。Noor Nashid 等人在研究中开发了一种自动检索代码演示的技术，以创建有效的提示，结果表明任务准确性大大提高。 [11]
这些用例展示了少样本提示在不同领域和任务中的广泛适用性和有效性，展示了其在 AI 和 NLP 应用中推动创新和提高效率的潜力。
少样本提示代表了 AI 和 NLP 领域的重大飞跃，它通过有限的示例提供了效率、灵活性和增强的性能。随着技术的发展，它将在各种应用中发挥关键作用，推动多个领域的创新和效率。
