快速入门: 调整基础模型
调整基础模型有几个原因。 通过在许多已标记的示例上调整模型,您可以提高模型性能,而不只是提示工程。 通过调整基本模型以与同一模型系列中的较大模型相似,您可以通过部署该较小模型来降低成本。
- 必需的服务
- Watson Studio
- Watson Machine Learning
- watsonx.ai
基本工作流程包含以下任务:
- 打开项目。 项目是您与其他人协作处理数据的地方。
- 将您的数据添加到项目中。 您可以上载数据文件,也可以通过连接从远程数据源添加数据。
- 在项目中创建调整试验。 调整试验使用 Tuning Studio 试验构建器。
- 查看试验结果和调整后的模型。 结果包括 "损失函数" 图表和已调整模型的详细信息。
- 部署并测试调整后的模型。 在 Prompt Lab 中测试您的模型。
阅读有关调整基础模型的信息
提示调整将调整传递到模型的提示的内容。 未编辑底层基础模型及其参数。 仅更改提示输入。 您可以使用 Tuning Studio 来调整模型,以指导 AI 基础模型返回所需的输出。
观看此视频,了解何时以及为何应该调整基础模型。
此视频提供了一种可视方法来学习本文档中的概念和任务。
观看有关调整基础模型的视频
观看此视频以预览本教程中的步骤。 视频中显示的用户界面可能存在细微差异。 该视频旨在与编写的教程相伴。
此视频提供了一种可视方法来学习本文档中的概念和任务。
尝试教程以调整基础模型
在本教程中,您将完成以下任务:
- 任务 1: 打开项目
- 任务 2: 测试基本模型
- 任务 3: 将数据添加到项目
- 任务 4: 在项目中创建调整试验
- 任务 5: 配置调整试验
- 任务 6: 将调整后的模型部署到部署空间
- 任务 7: 测试调整后的模型
完成本教程的提示
以下是成功完成本教程的一些提示。
在社区中获取帮助
如果需要本教程的帮助,您可以在 Cloud Pak for Data 社区讨论论坛中提出问题或找到答案。
设置浏览器窗口
为了获得完成本教程的最佳体验,请在一个浏览器窗口中打开 Cloud Pak for Data ,并在另一个浏览器窗口中保持本教程页面处于打开状态,以便在两个应用程序之间轻松切换。 请考虑将两个浏览器窗口并排排列,以便更轻松地进行后续操作。

任务 1: 打开项目
您需要一个项目来存储调整试验。 观看视频,了解如何创建沙箱项目并关联服务。 然后,执行以下步骤以验证您是否具有现有项目或创建项目。
验证现有项目或创建新项目
- 从 快速导航中,单击 所有项目。
- 打开现有项目或创建新项目:
- 在 " 项目 " 页面上单击 新建项目 。
- 选择创建空项目。
- 在 " 创建项目 " 屏幕上,输入项目的名称和可选描述。
- 单击创建。
要获取更多信息或观看视频,请参阅创建项目。
检查进度
下图显示了项目概述页面。 现在,您已准备好将样本 Notebook 添加到项目中。

任务 2: 测试基本模型
您可以在 Prompt Lab 中测试调整后的模型。 遵循以下步骤来测试调整后的模型:
单击项目中的 资产 选项卡。
点击新资产 > 使用基础模型进行聊天和构建提示。
选择调整后的模型。
- 单击模型下拉列表,然后选择 查看所有基础模型。
- 选择 flan-t5-xl-3b 模型。
- 单击 选择模型。
在 " 结构化方式 " 页面上,输入 指示信息:
Summarize customer complaints提供示例和测试输入。
示例输入和输出 示例输入 示例输出 我在最初的日期忘了我在使用 Capital One ,这个债务在他们手里,从来没有做过。 收债,子产品: 信用卡债务,发行: 采取或威胁采取消极或法律行动子问题 我是身份盗窃的受害者,这笔债务不属于我。 请看身份盗窃报告和法律宣誓书。 收债, dub-product ,我不知道,发行。 试图讨还未欠下的债务。 次发行债务是身份盗窃造成的 在 尝试 文本字段中,复制并粘贴以下提示:
After I reviewed my credit report, I am still seeing information that is reporting on my credit file that is not mine. please help me in getting these items removed from my credit file.单击 生成,然后查看结果。
单击 保存工作> 另存为。
选择 提示模板。
对于名称,输入
Base model prompt。选择 保存后在项目中查看。
单击保存。
检查进度
下图显示了 Prompt Lab 中的结果。

任务 3: 将数据添加到项目
您需要将训练数据添加到项目中。 执行以下步骤以下载数据集:
下载 客户投诉训练数据 (150KB) 并将其解压缩。
从项目中,单击 将资产上载到项目 图标
。
在打开的侧面板中,浏览以选择 customer-complaints-training-data.json 文件,然后单击 打开。 请停留在该页面,直至装入完成为止。
customer-complaints-training-data.json文件将作为数据资产添加到项目中。
检查进度
下图显示了添加到项目的数据资产。 下一步是创建 Tuning 试验。

任务 4: 在项目中创建调整试验
现在,您已准备好在沙箱项目中创建一个使用刚刚添加到项目的数据集的调整试验。 遵循以下步骤来创建 Tuning 试验:
来自资产选项卡,点击新资产 > 使用标记数据调整基础模型。
对于名称,请输入:
Summarize customer complaints tuned model对于描述,请输入:
Tuning Studio experiment to tune a foundation model to handle customer complaints.单击创建。 这将显示 Tuning Studio 。
检查进度
下图显示了在 Tuning Studio中打开的 Tuning 试验。 现在,您已准备好配置调整试验。

任务 5: 配置调整试验
在 Tuning Studio中,可以配置调整试验。 为您完成要调整的基础模型。 遵循以下步骤来配置调整试验:
对于要调整的基础模型,请选择 flan-t5-xl-3b。
为用于初始化提示的方法选择 文本 。 存在两个选项:
- 文本: 使用您指定的文本。
- 随机: 使用在调整试验中为您生成的值。
对于 文本 字段,输入:
Summarize the complaint provided into one sentence.下表显示了每种任务类型的示例文本:
标题 任务类型 示例 分类 分类每条评论的观点是 "正面" 还是 "负面" 代次 提出允许员工每周几天在家办公的理由 汇总 从会议记录中总结要点 对于与您希望模型执行的操作最匹配的任务类型,请选择 摘要 。 有三种任务类型:
- 摘要 生成描述以文本主体表示的主要构想的文本。
- 生成 将生成文本,例如促销电子邮件。
- 分类 预测特征中的分类标签。 例如,给定一组客户注释,您可能希望将每个语句标记为问题或问题。 使用分类任务时,需要列出希望模型使用的类标签。 指定在调整训练数据中使用的相同标签。
从项目中选择训练数据。
- 单击 从项目中选择。
- 单击 数据资产。
- 选择 客户投诉培训 data.json 文件。
- 单击 选择资产。
- 单击 开始调整。
检查进度
下图显示了已配置的调整试验。 接下来,您将复审结果并部署调整后的模型。

任务 6: 将调整后的模型部署到部署空间
当实验运行完成时,您会看到调整后的模型和 Loss 函数图。 损失函数用于衡量每次训练运行时预测结果与实际结果之间的差异。 执行以下步骤以查看损失函数图和调整后的模型:
查看 "损失" 函数图。 向下倾斜曲线意味着模型在生成预期输出时越来越好。

在图表下方,单击 汇总客户投诉 调整后的模型。
滚动浏览模型详细信息。
单击部署。
对于名称,请输入:
Summarize customer complaints tuned model对于 部署容器,选择 部署空间。
对于 目标部署空间,选择现有部署空间。 如果您没有现有部署空间,请执行以下步骤:
- 对于 目标部署空间,选择 创建新的部署空间。
- 对于部署空间名称,请输入:
Foundation models deployment space- 单击创建。
- 单击关闭。
- 对于 目标部署空间,验证是否选择了 Foundation 模型部署空间 。
选中 在创建后查看部署空间中的部署 选项。
单击创建。
在 " 部署 " 页面上,单击 汇总客户投诉调整模型 部署以查看详细信息。
检查您的进度
下图显示了部署空间中的部署。 现在,您已准备好测试已部署的模型。

任务 7: 测试调整后的模型
您可以在 Prompt Lab 中测试调整后的模型。 遵循以下步骤来测试调整后的模型:
在模型部署页面中,单击 在提示实验室中打开,然后选择沙箱项目。 Prompt Lab 显示。
选择调整后的模型。
- 单击模型下拉列表,然后选择 查看所有基础模型。
- 选择 汇总客户投诉调整模型 模型。
- 单击 选择模型。
在 " 结构化方式 " 页面上,输入 指示信息:
Summarize customer complaints在 " 结构化方式 " 页面上,提供示例和测试输入。
示例输入和输出 示例输入 示例输出 我在最初的日期忘了我在使用 Capital One ,这个债务在他们手里,从来没有做过。 收债,子产品: 信用卡债务,发行: 采取或威胁采取消极或法律行动子问题 我是身份盗窃的受害者,这笔债务不属于我。 请看身份盗窃报告和法律宣誓书。 收债, dub-product ,我不知道,发行。 试图讨还未欠下的债务。 次发行债务是身份盗窃造成的 在 尝试 文本字段中,复制并粘贴以下提示:
After I reviewed my credit report, I am still seeing information that is reporting on my credit file that is not mine. please help me in getting these items removed from my credit file.单击 生成,然后查看结果。
检查您的进度
下图显示了 Prompt Lab 中的结果。

后续步骤
请尝试以下其他教程:
其他资源
观看更多视频。
父主题: 快速入门教程