快速入门: 评估并跟踪提示模板
学习本教程以了解如何评估和跟踪提示模板。 您可以评估项目或部署空间中的提示模板,以度量基础模型任务的性能,并了解模型如何生成响应。 然后,您可以在 AI 用例中跟踪提示模板,以捕获和共享有关资产的事实,从而帮助您实现监管和合规性目标。
- 必需的服务
- watsonx.ai
- watsonx.governance
基本工作流程包含以下任务:
- 打开包含要评估的提示模板的项目。 您可以在项目中与他人协作以使用资产。
- 使用测试数据评估提示模板。
- 查看 AI Factsheet 上的结果。
- 在 AI 用例中跟踪评估的提示模板。
- 部署并测试评估的提示模板。
阅读提示模板
通过 watsonx.governance,您可以评估项目中的提示模板,以度量基础模型为以下任务类型生成响应的效率:
- 分类
- 汇总
- 代次
- 问题回答
- 实体抽取
观看有关评估和跟踪提示模板的视频
观看此视频以预览本教程中的步骤。 视频中显示的用户界面可能存在细微差异。 该视频旨在与编写的教程相伴。
此视频提供了一种可视方法来学习本文档中的概念和任务。
尝试有关评估和跟踪提示模板的教程
在本教程中,您将完成以下任务:
- 任务 1:创建工作空间
- 任务 2:创建清单和人工智能用例
- 任务 3: 评估样本提示模板
- 任务 4: 开始跟踪提示模板
- 任务 5:导入跟踪的资产以进行验证
- 任务 6: 验证提示模板
- 任务 7: 部署提示模板
完成本教程的提示
以下是成功完成本教程的一些提示。
在社区中获取帮助
如果需要本教程的帮助,您可以在 Cloud Pak for Data 社区讨论论坛中提出问题或找到答案。
设置浏览器窗口
为了获得完成本教程的最佳体验,请在一个浏览器窗口中打开 Cloud Pak for Data ,并在另一个浏览器窗口中保持本教程页面处于打开状态,以便在两个应用程序之间轻松切换。 请考虑将两个浏览器窗口并排排列,以便更轻松地进行后续操作。

完成先决条件
要完成本教程,必须设置以下前提条件。
分配Platform assets catalog的访问权限
您必须至少拥有对Platform assets catalog 编辑访问权限,人工智能用例和库存都存储在该目录中。 有关详细信息,请参阅管理平台连接上的协作者主题。
设置Watson OpenScale
本教程需要Watson OpenScale。 请按照以下步骤使用 自动设置 选项设置 Watson OpenScale 或参考 Watson OpenScale 的设置选项 查看其他设置选项:
- 从导航菜单
中,选择服务 > 实例。
- 在"实例"页面上,针对Watson OpenScale或watsonx.governance实例,单击 "溢出"菜单
,然后选择 "打开"。
- 显示模型评估页面时,单击自动设置。
任务 1:创建工作空间
要完成本教程,您需要三个工作区:
- 开发阶段:一个开发项目,用于存储您开发、评估和跟踪的资产。
- 验证阶段:验证项目用于存储准备验证的资产。
- 运行阶段: 生产部署空间用于存储经过验证的资产和部署。
任务 1a: 根据样本创建开发项目
您需要一个项目来存储提示模板和评估。 执行以下步骤以根据样本创建项目:
从导航菜单
中,选择项目 > 所有项目。
在项目页面上,单击新建项目。
选择 本地文件。
将先前下载的 ZIP 文件拖到页面上。
在 " 创建项目 " 页面上,复制并粘贴项目名称,并添加项目的可选描述。
Getting started with watsonx.governace单击创建。
单击 查看新项目 以验证是否已成功创建项目和资产。
单击 资产 选项卡以查看项目的资产。
检查您的进度
下图显示了开发项目 "资产 "选项卡。 现在您可以创建清单和人工智能用例了。

任务 1b: 创建验证项目
通常,提示工程师使用测试数据评估提示,验证工程师验证提示。 验证工程师有权访问提示工程师可能没有的验证数据。 在这种情况下,验证数据发生在另一个项目中。 按照以下步骤创建一个空项目。 之后,您可以将资产从开发项目导入验证项目。
从导航菜单
中,选择项目 > 所有项目。
在项目页面上,单击新建项目。
项目名称请键入
Validation project单击创建。
检查您的进度
下图显示了空验证项目

任务 1c: 创建部署空间
您现在需要创建一个部署空间,以便稍后将提示模板推广到该部署空间。 按照以下步骤创建部署空间:
从导航菜单
中选择部署。
单击新建部署空间。
对于 空间名称,复制并粘贴以下文本:
Insurance claims deployment space对于 部署阶段,选择 生产。
重要:如果您希望将部署从 Evaluation 阶段移动到 Operation 阶段,则必须为 Production 选择 Deployment 阶段。单击创建。
创建空间后,单击 查看新空间。
检查您的进度
下图显示了部署空间

任务 2:创建清单和人工智能用例
清单用于存储和审查人工智能用例。 AI 用例收集组织跟踪的 AI 资产的监管事实。 您可以在清单中查看所有 AI 用例。
任务 2a: 创建清单
请按照以下步骤创建清单:
从导航菜单
,选择人工智能治理 > 人工智能用例。
管理库存:
- 如果您有现有库存,那么可以跳至 创建新的 AI 用例 以使用该库存。
- 如果没有任何库存,请单击 管理库存。
单击 新建库存。
对于名称,复制并粘贴以下文本:
Golden Bank Insurance Inventory对于描述,请复制并粘贴以下文本:
Inventory for insurance related processing清除 创建后添加合作者 选项。 您可以在库存和 AI 用例级别限制访问权。
单击创建。
关闭 " 管理库存 " 页面。
检查您的进度
下图显示了清单。 现在,您已准备好创建 AI 用例。

任务 2b: 创建一个人工智能用例
本教程使用 OpenPages 来创建和管理 AI 用例。 如果不使用 OpenPages, 则请参阅 设置 AI 用例,了解在不使用 OpenPages 的情况下创建用例的步骤。
AI 用例是您可以借助 AI 解决的已定义业务问题。 通常,这些定义是在开发任何 AI 资产之前定义的。 请按照以下步骤使用 OpenPages: 创建人工智能用例
单击 新建 AI 用例。
对于 名称,复制并粘贴以下文本:
Insurance claims processing AI use case对于 所有者 字段,选择您的用户名。
在 Description 和 Purpose 中键入:
Use case for evaluating the prompt templates for insurance claims processing for Golden Bank对于 主业务实体,单击 添加。
选择 目录。
单击完成。
单击保存。
在 Third Party Link 字段中,单击链接以在 Cloud Pak for Data 用户界面中打开人工智能用例。
检查您的进度
下图显示了 AI 用例。 现在,您已准备好跟踪提示模板。

任务 2c: 将工作区与用例关联起来
请按照以下步骤将工作区与该用例关联起来:
- 滚动到 Associated workspaces 部分。
- 在开发阶段下,单击关联工作区。
- 选择 Getting started with watsonx.governance 项目。
- 单击保存。
- 在 Validate 阶段下,单击 关联工作区。
- 选择 验证项目。
- 单击保存。
- 在 Operate 阶段下,单击 关联工作区。
- 选择 保险索赔部署空间。
- 单击保存。
检查您的进度
下图显示了包含所有相关工作区的人工智能用例

任务 3: 评估样本提示模板
样本项目包含一些用作测试数据的提示模板和 CSV 文件。 请按照以下步骤审查和评估其中一个提示模板示例:
任务 3a: 在Prompt Lab中编辑示例提示模板
查看提示模板,了解其结构。
从导航菜单
中,选择项目 > 所有项目。
选择 Getting started with watsonx.governance 项目。
单击“资产”选项卡。
单击保险索赔汇总在 Prompt Lab 中打开提示模板,然后单击编辑。
点击提示变量图标
。
注: 要运行评估,必须至少创建一个提示变量。滚动到 试用 部分。 请注意 输入 字段中的
{input}变量。 必须包含提示变量作为用于测试提示的输入。 提示变量是一个占位符关键字,在创建时包含在提示符的静态文本中,在运行时动态替换为文本。
检查您的进度
下图显示了 " Prompt Lab "。

任务 3b: 评估提示模板
现在,您可以对提示模板进行评估了。
- 单击 "评估"图标
。
- 如果出现提示,请单击 关联服务实例 以选择要用于评估的服务。
- 选择相应的服务。
- 单击 关联。
- 展开 生成 AI 质量 部分以查看维度列表。 可用度量取决于提示的任务类型。 例如,汇总具有与分类不同的度量。
- 单击下一步。
- 选择测试数据:
- 单击 从项目中选择。
- 选择 项目文件 > 保险索赔汇总测试 data.csv 。
- 单击选择。
- 对于 输入列,选择 Insurance_Claim。
- 对于 参考输出列,选择 摘要。
- 单击下一步。
- 单击 评估。 评估完成后,您将在 评估 选项卡上看到测试结果。
- 单击 AI Factsheet 选项卡。
- 查看选项卡上每个部分的信息。
- 单击 Development > Getting started with watsonx.governance > Test results 再次查看测试结果。
检查您的进度
下图显示了评估结果。 现在,您可以开始在 AI 用例中跟踪提示模板。

任务 4: 开始跟踪提示模板
您可以在 AI 用例中跟踪提示模板,以向同级报告开发和测试过程。 执行以下步骤以开始跟踪提示模板:
- 在 AI Factsheet 选项卡上,单击 监管 页面。
- 单击 跟踪 AI 用例。
- 请注意,相关的人工智能用例是 保险理赔处理人工智能用例。
- 选择方法。 方法是 AI 用例所代表的业务问题解决方案的一个方面。 例如,您可以创建方法来跟踪用例中的多个提示模板。
- 单击下一步。
- 如果使用 OpenPages, 将提示您定义资产记录。 选择 "新建资产记录",然后单击 "下一步"。

- 对于模型版本,选择 实验。
- 接受版本号的缺省值。
- 单击下一步。
- 查看信息,然后单击 跟踪资产。
- 模型跟踪成功开始后,单击 "查看详情"图标
打开人工智能用例。
- 单击 Lifecycle 选项卡,查看提示模板是否处于 Development 阶段。 随着提示模板在人工智能生命周期中的移动,它将经历这些阶段:
- 开发阶段:在项目环境中开发的人工智能资产。
- 验证阶段:已部署到空间或项目中进行验证的人工智能资产。
- 运行阶段:在空间中部署人工智能资产进行操作。
检查您的进度
下图显示了人工智能用例中的生命周期选项卡和开发阶段的提示模板。 现在您可以继续进入验证阶段。

任务 5:导入跟踪资产进行验证
如任务 1 所述,通常情况下,提示工程师利用测试数据对提示进行评估,而验证工程师则对提示进行验证。 验证工程师有权访问提示工程师可能没有的验证数据。 在这种情况下,验证数据发生在另一个项目中。 请按照以下步骤导出开发项目,并将这些资产导入在任务 1 中创建的验证项目,以便将资产移入人工智能生命周期的 验证阶段:
任务 5a: 导出示例项目
请按照以下步骤导出开发项目:
- 从导航菜单
中,选择项目 > 所有项目。
- 选择 Getting started with watsonx.governance 项目。
- 单击导入/导出图标
>导出项目。
- 选中此框以选择所有资产。
- 单击导出。
- 单击 继续导出以确认资产可能包含凭证。
- 等待提示输入项目文件名,然后键入
validation-project.zip,然后单击 Save 。 - 项目导出完成后,单击 返回到项目。
检查您的进度
下图显示了导出项目页面。

任务 5b: 将资产导入验证项目
请按照以下步骤将资产从开发项目导入验证项目:
- 从导航菜单
中,选择项目 > 所有项目。
- 打开 验证项目。
- 单击导入/导出图标
>导入项目。
- 单击 浏览。
- 选择 validation-project.zip 并单击 打开。
- 选择选项表示同意:我知道某些类型的资产会覆盖具有相同名称和类型的现有资产。
- 单击导入。
- 成功导入资产后,单击刷新图标
查看导入的资产。
检查您的进度
下图显示了验证项目 "资产" 选项卡。 现在,您已准备好评估验证项目中的样本提示模板。

任务 6: 验证提示模板
现在,您已准备好使用与以前相同的评估过程来评估此验证项目中的提示模板。 使用相同的测试数据集进行评估。 并选择与之前相同的 "输入" 和 "输出" 列。 执行以下步骤以验证提示模板:
- 单击 验证项目中的 资产 选项卡。
- 从保险索赔摘要提示模板的溢出菜单
中,选择 "评估"。
- 单击 Evaluate 开始评估。
- 重复任务3a:评估提示模板中的步骤,以评估验证项目中的索赔处理汇总提示模板。
- 评估完成后,单击 AI Factsheet 选项卡。
- 查看这两组测试结果:
- 单击 Development > Getting started with watsonx.governance > Test results。
- 单击 验证 > 验证项目 > 测试结果。
检查您的进度
下图显示了验证测试结果。 现在,您已准备好将提示模板提升到部署空间,然后部署提示模板。

任务 7: 部署提示模板
要部署提示模板,需要将其推广到任务 1 中创建的部署空间。 然后,在部署空间中,可以创建部署并测试已部署的提示模板。
任务 7a: 将提示模板提升到部署空间
将提示模板提升到部署空间以准备部署该模板。 请按照以下步骤推广提示模板:
单击导航路径中的验证项目项目,返回资产选项卡。

从保险索赔摘要提示模板的溢出菜单
中,选择 "推广到空间"。
对于目标空间,从列表中选择保险理赔部署空间部署空间。
选中 提升提示模板后转至空间选项。
单击提升。
检查您的进度
下图显示了部署空间中的提示模板。 现在,您已准备好创建部署。

任务 7b: 部署提示模板
现在,您可以从部署空间内部创建提示模板的联机部署。 执行以下步骤以创建部署:
从部署空间中的 " 保险索赔摘要 " 资产页面中,选择 新建部署。
对于部署名称,复制并粘贴以下文本:
Insurance claims summarization deployment单击创建。
检查您的进度
下图显示了已部署的提示模板。

任务 7c: 查看已部署的提示模板
执行以下步骤以在其生命周期的当前阶段中查看已部署的提示模板:
- 准备就绪时查看部署。 API 参考 选项卡为您提供在应用程序中使用提示模板部署的信息。
- 单击测试选项卡。 测试 选项卡允许您提交指示信息和输入以测试部署。
- 单击 生成。 关闭结果窗口。
- 单击 AI Factsheet 选项卡。
- 向下滚动到 AI Factsheet 页面的底部,然后单击箭头以获取更多详细信息。
- 查看开发、验证和运行阶段的AI 概况介绍中的信息,以了解已部署的提示模板。
- 滚动到页面顶部,单击 "查看详情"图标
打开人工智能用例。
- 在用例中,单击 Lifecycle 选项卡。 您可以看到,提示模板现在处于 操作阶段。
- 单击 操作阶段中的保险索赔汇总提示模板。 完成后,单击 取消。
- 单击 操作阶段中的保险索赔汇总部署提示模板部署。 完成后,单击 取消。
检查您的进度
下图显示了生命周期运行阶段的提示模板。

后续步骤
尝试其他教程之一:
其他资源
- 观看更多视频。
父主题: 快速入门教程