什么是单样本提示?

作者:

Vrunda Gadesha

AI Advocate | Technical Content Author

什么是单样本提示?

单样本提示是指为模型提供单个示例或提示来执行任务的方法。与其他提示工程技术不同,零样本提示不提供任何示例,少样本提示提供少量示例,单样本提示依赖于一个精心设计的提示来实现期望的输出。这种方法利用像 OpenAI 的 GPT-3/GPT-4(生成式预训练转换器 )模型或 IBM Granite 模型之类的大型语言模型(LLM),以最少的输入理解并生成类似人类的文本。

单样本提示在收集大量训练数据不切实际的情况下特别有用。例如,在像思维链提示、少样本提示和零样本提示这样的应用中,由于缺乏或没有标记数据,单样本提示通过让模型从一个示例中泛化,提供了显著的优势。图 1 显示了单样本提示的形成过程。

在快速发展的人工智能(AI)自然语言处理领域,特别是在生成式 AI领域,提示工程已成为一项关键技术。各种提示类型中,单样本提示以其高效性和有效性脱颖而出。本文探讨了单样本提示的概念、机制、应用、优势、局限性和未来前景。

提示是 AI 中用来引导语言模型生成期望输出的技术。提示有不同类型,包括零样本、少样本和单样本提示。每种类型在向模型提供的用于执行特定任务的数据量和示例方面都各不相同。提示工程涉及精心设计这些提示,以优化模型的性能。

单样本提示背后的机制

单样本提示利用先进的大型语言模型 (LLM) 的功能,从一个示例提示中生成连贯且符合上下文的响应。这种效率得益于几个底层机制,包括知识提示、视觉上下文提示和自适应特征投影。虽然其中一些机制(例如知识提示和自适应功能投影)是通用的,可以应用于文本、图像和视频等各种数据类型,但其他机制(例如视觉上下文提示)则专门设计用于处理图像或视频数据。

视觉上下文提示允许模型根据视觉提示进行解释和响应,这对于图像识别或视频分析等任务至关重要。相比之下,知识提示和自适应特征投影增强了模型在不同类型的输入中理解和生成响应的能力,使其在多个领域中具有通用性。

例如,您需要将法语文档制作成英语摘要,并为特定 API 格式化输出。使用单样本提示,您可以提供单个示例提示,例如:“使用 {Title}、{Key Points}、{Summary} API 模板将这段法语文本制作成英语摘要。”LLM 利用其多语言能力和自适应特征投影来生成期望的输出格式。在 Python 中,可以通过将生成式 AI 模型的响应集成到 API 工作流中来自动化这一过程。

知识提示

这种方法涉及利用外部知识库或预先存在的特定领域的语料库,以增强模型的上下文理解和决策能力。通过整合富含行动相关信息或任务特定信息的结构化知识图谱或文本提案,该模型可有效检索相关信息,从而支持更准确的推断。例如,嵌入与行动相关的语料库,如一系列与领域相关的任务或事件,可以让模型在单样本学习场景中更好地泛化到新任务。这种方法使模型能够使用预定义的信息存储库填补知识空白,从而提高其适应和生成更适合上下文的响应的能力。[1]当与大规模 LLM 结合时,这种技术特别强大,因为它减少了对大量特定任务训练数据的需求,同时仍然提供强大的输出。

可视化上下文提示

该技术利用分割掩码、边界框或关键点等视觉提示,引导模型更有效地理解和处理图像或视频数据。在可视化上下文提示中,模型会获得一张参考图像或一组突出显示特定感兴趣区域的图像片段,允许模型在推理过程中专注于关键视觉特征。通过使用这些可视化提示,模型可以更好地理解图像内的空间关系、物体边界和上下文元素,显著提高其在视觉任务上的性能。事实证明,在物体检测、图像分类和分割等各种基于视觉的应用中,这种方法能使模型从最小的示例中进行泛化,从而增强零样本和单样本学习的能力。[2]此外,该技术使模型能够通过最少的数据动态适应新的可视化上下文,使其在标记训练示例有限的场景下非常有效。

自适应特征投影

在单样本动作识别中,自适应特征投影通过在时间上对齐和细化提取的特征,解决了视频数据中的时间变化挑战。该方法涉及预训练和微调基础网络,以学习一组通用特征,然后应用特征适应技术,使模型能够根据视频的时间进程动态调整其内部特征表征。通过将输入特征投影到一个捕获空间和时间模式的空间中,模型可以更好地处理动作序列中的变化,例如动作速度的变化或物体的交互。这种方法显著提高了模型从单个训练视频中识别动作的能力,增强了其在新的、未见过的视频序列中识别复杂动作的泛化性和准确性。[3]自适应特征投影在处理基于视频的任务的细粒度时间动态时特别有用,使其成为高性能单样本动作识别的关键组成部分。

注意力聚焦

这种策略加强了单样本学习的效果,使模型的注意力逐步集中到输入中最相关的区域。 在动作检测任务中,通过支持集和查询集之间的交叉注意力机制来实现注意力聚焦。这种方法允许模型比较和支持视频(包含动作示例)与查询视频(需要检测动作)之间的特征。通过专注于最有可能包含相关动作的特定时间或空间区域,模型生成高质量的动作建议。这种交叉注意力机制使模型能够有效地“聚焦”输入的关键部分,减少噪声和无关信息,从而提高其在单样本学习场景中的性能。[4]该技术有助于缩小复杂的输入空间,即使在训练示例最少的情况下,也能高效处理查询集,同时保持准确性。

这些机制通过具体实例说明了单样本提示在不同领域的适应性和稳健性。通过利用先进的提示技术并整合外部知识和视觉提示,单样本提示可以在最少的数据输入下实现高准确性和高效率。

单样本提示的优势和局限性

单样本提示提供了显著的优势和一些挑战,使其成为 AI 和机器学习领域一项引人注目但又复杂的技术。以下是对其优势和局限性的深入分析:

优势

  • 效率 - 减少训练数据:与传统机器学习模型相比,单样本提示需要的训练数据显著减少。这种效率减少了训练所需的计算资源和时间。例如,在单样本动作识别应用中,模型可以用最少的输入数据实现高准确率。[3]
  • 速度 - 更快的部署:单样本提示允许快速部署 AI 模型。这在动态环境中特别有益,因为快速适应新任务至关重要。从单个示例生成高质量响应的能力加快了部署过程。 [5]
  • 灵活性 - 适应各种应用:单样本提示高度适应从客户服务聊天机器人到个性化推荐的各种应用。这种灵活性使其适用于多种用例,包括少样本和零样本学习场景。[1]

限制

  • 潜在偏见从预训练数据继承的偏差=见:单样本提示的重大挑战之一是潜在的偏见。由于模型严重依赖预训练数据集,它们可能会继承并延续训练数据集中存在的偏见。这会影响模型输出的公平性和准确性。[6]
  • 准确性性能变异:虽然单样本提示可能非常有效,但可能无法总是达到与使用大量训练数据的方法相同的准确性。需要详细理解和上下文的复杂任务可能对单样本提示模型构成挑战,导致性能变异。[7]

超越提示思考,全面了解背景

通过 Think 时事通讯,随时了解最新的行业新闻、AI 工具以及提示工程领域的新兴趋势。此外,还可以访问新的阅读解释器、教程和专家洞察分析,我们会将这些内容直接发送到您的收件箱。请参阅 IBM 隐私声明

谢谢!您已订阅。

用例

单样本提示是一种强大的技术,可以在广泛的行业和场景中找到大量的例子和应用程序。通过利用先进的大语言模型 (LLM) 的能力和复杂的提示方法,单样本提示可以显著提高各种任务的效率和性能。以下是一些值得注意的用例:

1. 客户服务和聊天机器人

单样本提示可以显著提高聊天机器人和虚拟助理在客户服务环境中的性能。通过提供一个精心制作的示例,聊天机器人可以训练用于处理复杂的询问,提供个性化响应,并提高整体客户满意度。该方法减少了对大量训练数据的需求,从而能够快速部署并适应不同的客户服务场景。[6]

2. 内容创作和自动化

在内容创作和自动化领域,单样本提示可用于以最少的输入生成高质量的文章、报告和创意内容。这对于需要高效生产大量内容的营销人员、作家和内容创作者特别有用。通过提供单一提示,模型可以生成多样化且与上下文相关的内容,从而节省时间和资源。 [1]

3. 个性化推荐

单样本提示可根据有限的输入生成量身定制的建议,从而增强推荐系统的功能。例如,电子商务平台可以使用单样本提示来提供个性化的产品推荐,改善购物体验并提高销售额。该方法充分利用最少的数据来生成高度准确和相关的建议。[7]

4. 视频中的动作识别

在视频分析中,单样本提示可用于动作识别任务,例如在监控录像或运动分析中识别特定动作。通过提供单个示例视频,模型可以学会在新视频中识别相似的动作,即使在不同条件下也能做到。这在安全、运动表现分析和自动视频编辑等应用中尤其有价值。 [3]

因此,单样本提示是 AI 领域的一项重大进步,提供了跨多个领域的高效和灵活的解决方案。随着研究继续解决其局限性,该技术的潜在应用和优势将会扩大,为智能系统的发展做出贡献。

AI 学院

成为 AI 专家

获取相关知识,以确定 AI 投资的优先级,从而推动业务增长。立即开始观看我们的免费 AI 学院视频,引领 AI 在组织中的未来应用。

相关解决方案
IBM® watsonx.ai

使用面向 AI 构建器的新一代企业级开发平台 IBM watsonx.ai,可以训练、验证、调整和部署生成式 AI、基础模型和机器学习功能。使用一小部分数据,即可在很短的时间内构建 AI 应用程序。

深入了解 watsonx.ai
人工智能 (AI) 解决方案

借助 IBM 业界领先的 AI 专业知识和解决方案组合,让 AI 在您的业务中发挥作用。

深入了解人工智能解决方案
人工智能 (AI) 咨询服务

IBM Consulting AI 服务有助于重塑企业利用 AI 实现转型的方式。

深入了解人工智能服务
采取下一步行动

通过使用 AI,IBM Concert 可揭示有关运营的重要洞察分析,并提供特定于应用程序的改进建议。了解 Concert 如何推动您的业务向前发展。

深入了解 Concert 深入了解业务流程自动化解决方案