为智能体选择AI模型

选择正确的人工智能模型可帮助您的代理理解用户意图、推理任务并生成可靠的响应。 您的选择直接影响精度、性能和成本。

准备工作

在选择型号之前:

  • 确定代理必须支持的用例,包括准确性、延迟和成本预期。

  • 回顾选择人工智能模型的注意事项 ,了解模型特征如何影响性能。

  • 查看“可用 AI 模型 ”以确认您所在的地区和云服务提供商支持哪些模型。

  • 确保您有一个现有的代理或准备创建一个代理。

  • 请确认您的租户已启用模型选择功能。 管理员可以控制此设置。 如需更多信息,请参阅 “管理模型选择设置”

分配模型

注:

如果管理员禁用了模型选择功能,则 AI 模型下拉菜单将被禁用,并显示当前选定的模型。 除非该模型已被废弃或不可用,否则您无法更改它。 如果您需要选择其他型号,请联系管理员。 如需更多信息,请参阅 “管理模型选择设置”

为您的代理分配一个人工智能模型:

  1. 创建新代理或打开现有代理。

  2. 在代理设置中找到人工智能模型下拉列表。

  3. 查看可用的模型 ,并选择符合您任务需求的模型。

    • 考虑任务复杂度、输入类型和性能要求。

  4. 若可用模型超过五个,请点击 “查看所有基础模型 ”以查看完整列表。

  5. 模型选择部分,搜索您需要的模型。

    • 将鼠标悬停在模型名称上以查看详细信息。

  6. 选择模型并点击保存

选择模型后,继续通过自定义提示或添加知识来配置代理。

型号的供应情况和状态

人工智能模型下拉列表包括以下模型

  • 默认由 watsonx Orchestrate 提供

  • 针对您所在地区的建议

  • 通过代理开发工具包(ADK)添加

  • 通过人工智能网关连接

模型状态标签

某些模型会显示状态标签,用于指示可用性或生命周期状态。

状态

描述

需要操作

缺省值

当未选择模型时自动使用的模型。

除非您想更改模型,否则无需采取任何行动。

已弃用 不推荐图标

该模型目前受支持,但可能在未来的版本中被移除。

计划迁移至另一种受支持的模型。

暂无 "错误"图标

该模型已不可用或在租户中不可访问。

部署前请选择另一款受支持的机型。

重要说明:
  • 当您使用第三方模型时,该模型将依据其自身的许可协议提供,且不受 IBM 的约束。 使用前请查看许可条款。 请阅读条款

  • 如果您选择了带有“不可用”标签的模型,部署前摘要中将显示一条错误信息。 选择另一个受支持的模型来部署代理。

列表中模型的排序

AI模型下拉列表按以下顺序显示模型:

  1. 当前选定的模型。

  2. 默认模型(如果尚未被选中)。

  3. 在ADK中列为推荐的模型(如果数据中心中可用)。

  4. 通过AI网关添加的外部模型,按字母顺序排列。

  5. 通过ADK配置的模型策略。 如需更多信息,请参阅 “配置模型策略 ”。

下一步操作