watsonx.ai支持的基础模型

您可以在 IBM watsonx.ai.You 中使用第三方和 IBM 的基础模型,可以使用 IBM 提供的基础模型并立即投入使用,也可以按需部署基础模型,专供您的组织使用。

如何选择车型

如需查看有助于您选择型号的因素,例如支持的任务和语言,请参阅选择型号基金会型号基准

有关 watsonx.ai 提供的用于文本嵌入和重新排序的基础模型,请参阅支持的编码器模型

通过模型网关访问其他提供商的模型

您可以通过模型网关安全地访问来自多个模型提供商的基底模型并与之交互。 该模型网关提供了一个 OpenAI-compatible API,用于将请求路由到这些基础模型。 利用模型网关,通过统一接口对请求进行路由和格式化,从而在多个模型提供商之间高效切换。 您可以利用这些模型构建并部署 AI 代理、RAG 模式等。

如需更多信息,请参阅 “模型网关 ”。

注:

基础模型的可用性因数据中心位置而异。 有关详情,请参阅地基型号的地区可用性

按部署方法划分的基金会模型

根据部署方法,您可以直接在多租户硬件上使用基础模型,也可以在专用硬件上部署模型,供您的组织使用。 要了解有关部署模型的各种方法的更多信息,请参阅基础模型部署方法

表 1. 按部署方法划分的基金会模型
提供者 提供 watsonx.ai
(按令牌付费)
按需部署
(按小时付费)
IBM granite-4-h-small
granite-guardian-3-8b
granite-3-8b-base
granite-3-8b-instruct (已弃用)
granite-8b-code-instruct
granite-4-h-small
granite-4-h-tiny
granite-4-h-micro
granite-vision-3-3-2b
granite-3-3-8b-instruct
granite-3-3-2b-instruct
granite-3-2-8b-instruct
granite-3-1-8b-instruct
granite-3-1-8b-base
granite-7b-lab
granite-8b-japanese
granite-13b-chat-v2
granite-20b-multilingual
granite-3b-code-instruct
granite-8b-code-instruct
granite-20b-code-instruct
granite-34b-code-instruct
granite-20b-code-base-schema-linking
granite-20b-code-base-sql-gen
Meta - llama-4-maverick-17b-128e-instruct-fp8
- llama-3-3-70b-instruct
- llama-3-2-11b-vision-instruct
- llama-3-2-90b-vision-instruct (已弃用)
- - llama-guard-3-11b-vision-instruct
- llama-3-405b-instruct (已废弃)
llama-4-scout-17b-16e-instruct-fp8-dynamic
llama-3-2-90b-vision-instruct
llama-3-1-405b-instruct-fp8
llama-4-maverick-17b-128e-instruct-int4
llama-4-maverick-17b-128e-instruct-fp8
llama-3-1-70b-gptq
llama-3-1-70b
llama-3-2-11b-vision-instruct
llama-3-3-70b-instruct
llama-3-3-70b-instruct-hf
llama-3-1-70b-instruct
llama-2-70b-chat
llama-3-8b-instruct
llama-3-70b-instruct
llama-3-1-8b
llama-3-1-8b-instruct
Mistral AI mistral-large
-2512• mistral-medium-2505
ministral-3b-instruct-2512
ministral-8b-instruct-2512
mistral-large
-2512• mistral-small-3-2-24b-instruct-2506
mistral-medium-2508
mistral-small-3-1-24b-instruct-2503
mistral-medium-2505
codestral-2501
• • ministral-8b-instruct-2410
mistral-large-instruct-2407
mistral-nemo-instruct-2407
mistral-large-instruct-2411
mixtral-8x7b-base

mixtral-8x7b-instruct-v01pixtral-12b
BigScience mt0-xxl-13b
Code Llama codellama-34b-instruct-hf
DeepSeek 人工智能 deepseek-r1-distill-llama-8b
deepseek-r1-distill-llama-70b
SDAIA allam-1-13b-instruct allam-1-13b-instruct
扩展现实统一转录和翻译(UTTER)项目 - eurollm-1-7b-instruct
- eurollm-9b-instruct
LumiOpen poro-34b-chat
OpenAI gpt-oss-120b
gpt-oss-20b
gpt-oss-120b

提供可直接使用的原型模型

在 IBM watsonx.ai中部署了一组开放式源代码和 IBM 基础模型。 您可以在提示Prompt Lab或通过编程提示这些基础模型。

有关 watsonx.ai 中基础模型推断的计量详情,请参阅基础模型推断的计费率。 有关 IBM watsonx.ai 与各种云提供商的服务说明的更多信息,请参阅:

您可以使用以下类型的基础模型:

IBM 基础车型

下表列出了 IBM 为推理提供的受支持的 IBM 基础模型。

您还可以从第三方资源库(如 Hugging Face )访问一些 IBM 基础模型。 IBM 您从第三方资源库获得的基础模型不在 的赔偿之列。 IBM 只有您从 watsonx.ai 访问的 IBM 基金会模型才受到 IBM 的赔偿。 有关 IBM 赔偿相关合同保护的更多信息,请参阅 IBM 客户关系协议

注:如果您的 watsonx 区域是 IBM Cloud 上的达拉斯数据中心,您可以按照模型卡链接进行操作。 否则,请在资源中心搜索型号名称。 该模式可能不适用于所有地区或云平台。
表 2a. IBM 基础模型提供 用于推断 watsonx.ai
模型名称 API 模型 ID 输入价格
USD/1,000代币)
输出价格
USD/1,000代币)
上下文窗口
(输入 + 输出标记)
更多信息
granite-4-h-small ibm/granite-4-h-small $0.0000636 $0.000265 131,072 - 模型卡
- 网站
granite-3-8b-instruct ibm/granite-3-8b-instruct $0.000212 $0.000212 131,072 - 模型卡
-网站
-研究论文
granite-guardian-3-8b ibm/granite-guardian-3-8b $0.0002 $0.0002 131,072 模特卡
网站
granite-8b-code-instruct ibm/granite-8b-code-instruct $0.000636 $0.000636 128,000 - 模型卡
-网站
-研究论文

 

表 2b. IBM 时间序列基础模型通过 watsonx.ai 提供,用于预测未来值
模型名称 API 模型 ID 输入价格
( USD/1,000 数据点)
输出价格
( USD/1,000 数据点)
上下文长度
最小数据点
更多信息
granite-ttm-512-96-r2 ibm/granite-ttm-512-96-r2 $0.0001378 $0.0004028 512 - 模型卡
--网站
--研究论文
granite-ttm-1024-96-r2 ibm/granite-ttm-1024-96-r2 $0.0001378 $0.0004028 1,024 - 模型卡
--网站
--研究论文
granite-ttm-1536-96-r2 ibm/granite-ttm-1536-96-r2 $0.0001378 $0.0004028 1536 - 模型卡
--网站
--研究论文

 

第三方基金会车型

下表列出了 watsonx.ai 支持的第三方基础模型。

注:如果您的 watsonx 区域是 IBM Cloud 上的达拉斯数据中心,您可以按照模型卡链接进行操作。 否则,请在资源中心搜索型号名称。 该模式可能不适用于所有地区或云平台。
表 3. 中支持的第三方基础模型 watsonx.ai
模型名称 API 模型 ID 提供者 输入价格
USD/1,000代币)
输出价格
USD/1,000代币)
上下文窗口
(输入 + 输出标记)
更多信息
allam-1-13b-instruct sdaia/allam-1-13b-instruct 国家人工智能中心和沙特数据和人工智能管理局 $0.001908 $0.001908 4,096 - 模型卡
gpt-oss-120b openai/gpt-oss-120b OpenAI $0.000159 $0.000636 131,072 - 模型卡
- OpenAI 博客
llama-4-maverick-17b-128e-instruct-fp8 meta-llama/llama-4-maverick-17b-128e-instruct-fp8 Meta $0.000371 $0.001484 131,072 模型卡
Meta AI博客
llama-3-3-70b-instruct meta-llama/llama-3-3-70b-instruct Meta $0.0007526 $0.0007526 131,072 模型卡
Meta AI博客
llama-3-2-11b-vision-instruct meta-llama/llama-3-2-11b-vision-instruct Meta $0.000371 $0.000371 131,072 模型卡
Meta AI博客
研究论文
llama-3-2-90b-vision-instruct meta-llama/llama-3-2-90b-vision-instruct Meta $0.00212 $0.00212 131,072 模型卡
Meta AI博客
研究论文
llama-guard-3-11b-vision meta-llama/llama-guard-3-11b-vision Meta $0.000371 $0.000371 131,072 模型卡
Meta AI博客
研究论文
llama-3-405b-instruct meta-llama/llama-3-405b-instruct Meta $0.0053 $0.01696 16,384 模型卡
Meta AI博客
mistral-large-2512 mistralai/mistral-large-2512 Mistral AI $0.000636 $0.001908 256,000 模特卡片
Mistral Large 3 专属博客文章
mistral-medium-2505 mistralai/mistral-medium-2505 Mistral AI $0.00337 $0.01007 131,072 - 模型卡
- Mistral Medium 3 的博文
mistral-small-3-1-24b-instruct-2503 mistralai/mistral-small-3-1-24b-instruct-2503 Mistral AI $0.000106 $0.000318 131,072 模型卡
Mistral 3.1 博客文章
mt0-xxl-13b bigscience/mt0-xxl BigScience $0.001908 $0.001908 4,096 - 示范卡
-研究论文

按需部署基础模型

您可以使用一组 IBM 精选模型中的基础模型,部署为您的组织专用。

您可以选择按需部署以下基础模型:

注:

通过指定部署配置大小来按需部署模型的做法已被弃用。 使用 GPU 硬件配置来部署新机型,并计算托管机型的价格。 有关模型托管环境和按需部署模型的定价详情,请参阅生成式人工智能资产的计费详情

IBM 按需部署基础模型

下表列出了您可以按需部署的 IBM 基础模型。

一些 IBM 基础模型也可从第三方资源库获取,如 Hugging Face。 IBM 您从第三方资源库获得的基础模型不在 的赔偿之列。 IBM 只有您从 watsonx.ai 访问的 IBM 基金会模型才受到 IBM 的赔偿。 有关 IBM 赔偿相关合同保护的更多信息,请参阅 IBM 客户关系协议

表 4. IBM 基础模型可按需部署在 watsonx.ai
模型名称 部署配置大小
上下文窗口
(输入 + 输出标记)
granite-vision-3-3-2b 131,072
granite-3-3-8b-instruct 小型 131,072
granite-3-3-2b-instruct 小型 131,072
granite-3-2-8b-instruct 小型 131,072
granite-3-1-8b-base 小型 131,072
granite-8b-japanese 小型 4,096
granite-20b-multilingual 小型 8,192
granite-13b-chat-v2 小型 8,192
granite-3b-code-instruct 小型 128,000
granite-8b-code-instruct 小型 128,000
granite-20b-code-instruct 小型 8,192
granite-34b-code-instruct 小型 8,192
granite-20b-code-base-schema-linking 小型 8,192
granite-20b-code-base-sql-gen 小型 8,192
granite-3-8b-base 小型 4,096

 

第三方按需部署基础模型

注:当您部署某些专用基础模型时,需要支付每小时的访问费。 托管这些按需部署基础模型的总价格是访问价格和托管价格的和。

GPU托管每小时价格(美元)+ 访问费每小时(美元)= 总每小时价格(美元)

有关 GPU 配置定价的详细信息,请参阅按需部署模型的按小时计费成本

下表列出了您可以按需部署的第三方基金会模型。

表 5. 第三方基础模型可按需部署在 watsonx.ai
模型名称 提供者 每小时使用费(美元 部署配置大小
上下文窗口
(输入 + 输出标记)
allam-1-13b-instruct 国家人工智能中心和沙特数据和人工智能管理局 小型 4,096
codellama-34b-instruct-hf Code Llama 中等 16,384
deepseek-r1-distill-llama-8b DeepSeek 人工智能 小型 131,072
deepseek-r1-distill-llama-70b DeepSeek 人工智能 大型 131,072
eurollm-1-7b-instruct 项目 小型 4,096
eurollm-9b-instruct 项目 小型 4,096
gpt-oss-20b OpenAI 131,072
gpt-oss-120b OpenAI 131,072
llama-2-13b-chat Meta 小型 4,096
llama-2-70b-chat Meta 大型 4,096
llama-3-8b-instruct Meta 小型 8,192
llama-3-70b-instruct Meta 大型 8,192
llama-3-1-8b Meta 小型 131,072
llama-3-1-70b Meta 大型 131,072
llama-3-1-8b-instruct Meta 小型 131,072
llama-3-1-70b-instruct Meta 大型 131,072
llama-3-1-70b-gptq Meta 131,072
llama-3-1-405b-instrcut-fp8 Meta 131,072
llama-3-2-11b-vision-instruct Meta 小型 131,072
llama-3-2-90b-vision-instruct Meta 131,072
llama-3-3-70b-instruct Meta 中等 131,072
llama-3-3-70b-instruct-hf Meta 大型 131,072
llama-4-maverick-17b-128e-instruct-fp8 Meta 131,072
llama-4-maverick-17b-128e-instruct-int4 Meta 131,072
llama-4-scout-17b-16e-instruct-fp8-dynamic Meta 131,072
codestral-2501 Meta $34.30 65,536
ministral-3b-instruct-2512 Mistral AI 262,144
ministral-8b-instruct-2512 Mistral AI 262,144
ministral-8b-instruct-2410 Mistral AI $8.60 131,072
mistral-large-2512 Mistral AI 256,000
mistral-large-instruct-2407 Mistral AI $34.30 大型 131,072
mistral-large-instruct-2411 Mistral AI $34.30 大型 131,072
mistral-medium-2505 Mistral AI $34.30 131,072
mistral-medium-2508 Mistral AI $34.30 131,072
mistral-nemo-instruct-2407 Mistral AI 小型 131,072
mistral-small-3-1-24b-instruct-2503 Mistral AI 131,072
mistral-small-3-2-24b-instruct-2506 Mistral AI 131,072
mixtral-8x7b-base Mistral AI 中等 32,768
mixtral-8x7b-instruct-v01 Mistral AI 中等 32,768
mt0-xxl-13b BigScience 小型 4,096
pixtral-12b Mistral AI 128,000
poro-34b-chat LumiOpen 中等 2,048

 

了解更多