watsonx.ai支持的基础模型

您可以在 IBM watsonx.ai.You 中使用第三方和 IBM 的基础模型，可以使用 IBM 提供的基础模型并立即投入使用，也可以按需部署基础模型，专供您的组织使用。

如何选择车型

如需查看有助于您选择型号的因素，例如支持的任务和语言，请参阅选择型号和基金会型号基准。

有关 watsonx.ai 提供的用于文本嵌入和重新排序的基础模型，请参阅支持的编码器模型。

通过模型网关访问其他提供商的模型

您可以通过模型网关安全地访问来自多个模型提供商的基底模型并与之交互。该模型网关提供了一个 OpenAI-compatible API，用于将请求路由到这些基础模型。利用模型网关，通过统一接口对请求进行路由和格式化，从而在多个模型提供商之间高效切换。您可以利用这些模型构建并部署 AI 代理、RAG 模式等。

如需更多信息，请参阅 “模型网关 ”。

注：

基础模型的可用性因数据中心位置而异。有关详情，请参阅地基型号的地区可用性。

按部署方法划分的基金会模型

根据部署方法，您可以直接在多租户硬件上使用基础模型，也可以在专用硬件上部署模型，供您的组织使用。要了解有关部署模型的各种方法的更多信息，请参阅基础模型部署方法。

表 1. 按部署方法划分的基金会模型
提供者	提供 watsonx.ai （按令牌付费）	按需部署（按小时付费）
IBM	• granite-4-h-small • granite-guardian-3-8b • granite-3-8b-base • granite-3-8b-instruct (已弃用) • granite-8b-code-instruct	• granite-4-h-small • granite-4-h-tiny • granite-4-h-micro • granite-vision-3-3-2b • granite-3-3-8b-instruct • granite-3-3-2b-instruct • granite-3-2-8b-instruct • granite-3-1-8b-instruct • granite-3-1-8b-base • granite-7b-lab • granite-8b-japanese • granite-13b-chat-v2 • granite-20b-multilingual • granite-3b-code-instruct • granite-8b-code-instruct • granite-20b-code-instruct • granite-34b-code-instruct • granite-20b-code-base-schema-linking • granite-20b-code-base-sql-gen
Meta	- llama-4-maverick-17b-128e-instruct-fp8 - llama-3-3-70b-instruct - llama-3-2-11b-vision-instruct - llama-3-2-90b-vision-instruct (已弃用) - - llama-guard-3-11b-vision-instruct - llama-3-405b-instruct (已废弃)	• llama-4-scout-17b-16e-instruct-fp8-dynamic • llama-3-2-90b-vision-instruct • llama-3-1-405b-instruct-fp8 • llama-4-maverick-17b-128e-instruct-int4 • llama-4-maverick-17b-128e-instruct-fp8 • llama-3-1-70b-gptq • llama-3-1-70b • llama-3-2-11b-vision-instruct • llama-3-3-70b-instruct • llama-3-3-70b-instruct-hf • llama-3-1-70b-instruct • llama-2-70b-chat • llama-3-8b-instruct • llama-3-70b-instruct • llama-3-1-8b • llama-3-1-8b-instruct
Mistral AI	• mistral-large -2512• mistral-medium-2505	• ministral-3b-instruct-2512 • ministral-8b-instruct-2512 • mistral-large -2512• mistral-small-3-2-24b-instruct-2506 • mistral-medium-2508 • mistral-small-3-1-24b-instruct-2503 mistral-medium-2505 • codestral-2501 • • ministral-8b-instruct-2410 • mistral-large-instruct-2407 • mistral-nemo-instruct-2407 mistral-large-instruct-2411 • mixtral-8x7b-base mixtral-8x7b-instruct-v01 • pixtral-12b
BigScience		• mt0-xxl-13b
Code Llama		• codellama-34b-instruct-hf
DeepSeek 人工智能		• deepseek-r1-distill-llama-8b • deepseek-r1-distill-llama-70b
SDAIA	• allam-1-13b-instruct	• allam-1-13b-instruct
扩展现实统一转录和翻译（UTTER）项目		- eurollm-1-7b-instruct - eurollm-9b-instruct
LumiOpen		• poro-34b-chat
OpenAI	• gpt-oss-120b	• gpt-oss-20b • gpt-oss-120b

提供可直接使用的原型模型

在 IBM watsonx.ai中部署了一组开放式源代码和 IBM 基础模型。您可以在提示Prompt Lab或通过编程提示这些基础模型。

有关 watsonx.ai 中基础模型推断的计量详情，请参阅基础模型推断的计费率。有关 IBM watsonx.ai 与各种云提供商的服务说明的更多信息，请参阅：

您可以使用以下类型的基础模型：

IBM 基础车型
第三方基金会车型

IBM 基础车型

下表列出了 IBM 为推理提供的受支持的 IBM 基础模型。

您还可以从第三方资源库（如 Hugging Face ）访问一些 IBM 基础模型。 IBM 您从第三方资源库获得的基础模型不在的赔偿之列。 IBM 只有您从 watsonx.ai 访问的 IBM 基金会模型才受到 IBM 的赔偿。有关 IBM 赔偿相关合同保护的更多信息，请参阅 IBM 客户关系协议。

注：

如果您的 watsonx 区域是 IBM Cloud 上的达拉斯数据中心，您可以按照模型卡链接进行操作。否则，请在资源中心搜索型号名称。该模式可能不适用于所有地区或云平台。

表 2a. IBM 基础模型提供用于推断 watsonx.ai
模型名称	API 模型 ID	输入价格 USD/1,000代币）	输出价格 USD/1,000代币）	上下文窗口（输入 + 输出标记）	更多信息
granite-4-h-small	`ibm/granite-4-h-small`	$0.0000636	$0.000265	131,072	- 模型卡 - 网站
granite-3-8b-instruct	`ibm/granite-3-8b-instruct`	$0.000212	$0.000212	131,072	- 模型卡 -网站 -研究论文
granite-guardian-3-8b	`ibm/granite-guardian-3-8b`	$0.0002	$0.0002	131,072	• 模特卡 • 网站
granite-8b-code-instruct	`ibm/granite-8b-code-instruct`	$0.000636	$0.000636	128,000	- 模型卡 -网站 -研究论文

表 2b. IBM 时间序列基础模型通过 watsonx.ai 提供，用于预测未来值
模型名称	API 模型 ID	输入价格 ( USD/1,000 数据点)	输出价格 ( USD/1,000 数据点)	上下文长度最小数据点	更多信息
granite-ttm-512-96-r2	`ibm/granite-ttm-512-96-r2`	$0.0001378	$0.0004028	512	- 模型卡 --网站 --研究论文
granite-ttm-1024-96-r2	`ibm/granite-ttm-1024-96-r2`	$0.0001378	$0.0004028	1,024	- 模型卡 --网站 --研究论文
granite-ttm-1536-96-r2	`ibm/granite-ttm-1536-96-r2`	$0.0001378	$0.0004028	1536	- 模型卡 --网站 --研究论文

第三方基金会车型

下表列出了 watsonx.ai 支持的第三方基础模型。

注：

表 3. 中支持的第三方基础模型 watsonx.ai
模型名称	API 模型 ID	提供者	输入价格 USD/1,000代币）	输出价格 USD/1,000代币）	上下文窗口（输入 + 输出标记）	更多信息
allam-1-13b-instruct	`sdaia/allam-1-13b-instruct`	国家人工智能中心和沙特数据和人工智能管理局	$0.001908	$0.001908	4,096	- 模型卡
gpt-oss-120b	`openai/gpt-oss-120b`	OpenAI	$0.000159	$0.000636	131,072	- 模型卡 - OpenAI 博客
llama-4-maverick-17b-128e-instruct-fp8	`meta-llama/llama-4-maverick-17b-128e-instruct-fp8`	Meta	$0.000371	$0.001484	131,072	• 模型卡 • Meta AI博客
llama-3-3-70b-instruct	`meta-llama/llama-3-3-70b-instruct`	Meta	$0.0007526	$0.0007526	131,072	• 模型卡 • Meta AI博客
llama-3-2-11b-vision-instruct	`meta-llama/llama-3-2-11b-vision-instruct`	Meta	$0.000371	$0.000371	131,072	• 模型卡 • Meta AI博客 • 研究论文
llama-3-2-90b-vision-instruct	`meta-llama/llama-3-2-90b-vision-instruct`	Meta	$0.00212	$0.00212	131,072	• 模型卡 • Meta AI博客 • 研究论文
llama-guard-3-11b-vision	`meta-llama/llama-guard-3-11b-vision`	Meta	$0.000371	$0.000371	131,072	• 模型卡 • Meta AI博客 • 研究论文
llama-3-405b-instruct	`meta-llama/llama-3-405b-instruct`	Meta	$0.0053	$0.01696	16,384	• 模型卡 • Meta AI博客
mistral-large-2512	`mistralai/mistral-large-2512`	Mistral AI	$0.000636	$0.001908	256,000	• 模特卡片 • Mistral Large 3 专属博客文章
mistral-medium-2505	`mistralai/mistral-medium-2505`	Mistral AI	$0.00337	$0.01007	131,072	- 模型卡 - Mistral Medium 3 的博文
mistral-small-3-1-24b-instruct-2503	`mistralai/mistral-small-3-1-24b-instruct-2503`	Mistral AI	$0.000106	$0.000318	131,072	• 模型卡 • Mistral 3.1 博客文章
mt0-xxl-13b	`bigscience/mt0-xxl`	BigScience	$0.001908	$0.001908	4,096	- 示范卡 -研究论文

按需部署基础模型

您可以使用一组 IBM 精选模型中的基础模型，部署为您的组织专用。

您可以选择按需部署以下基础模型：

IBM 按需部署基础模型
第三方按需部署基础模型

注：

通过指定部署配置大小来按需部署模型的做法已被弃用。使用 GPU 硬件配置来部署新机型，并计算托管机型的价格。有关模型托管环境和按需部署模型的定价详情，请参阅生成式人工智能资产的计费详情。

IBM 按需部署基础模型

下表列出了您可以按需部署的 IBM 基础模型。

一些 IBM 基础模型也可从第三方资源库获取，如 Hugging Face。 IBM 您从第三方资源库获得的基础模型不在的赔偿之列。 IBM 只有您从 watsonx.ai 访问的 IBM 基金会模型才受到 IBM 的赔偿。有关 IBM 赔偿相关合同保护的更多信息，请参阅 IBM 客户关系协议。

表 4. IBM 基础模型可按需部署在 watsonx.ai
模型名称	部署配置大小	上下文窗口（输入 + 输出标记）
granite-vision-3-3-2b	–	131,072
granite-3-3-8b-instruct	小型	131,072
granite-3-3-2b-instruct	小型	131,072
granite-3-2-8b-instruct	小型	131,072
granite-3-1-8b-base	小型	131,072
granite-8b-japanese	小型	4,096
granite-20b-multilingual	小型	8,192
granite-13b-chat-v2	小型	8,192
granite-3b-code-instruct	小型	128,000
granite-8b-code-instruct	小型	128,000
granite-20b-code-instruct	小型	8,192
granite-34b-code-instruct	小型	8,192
granite-20b-code-base-schema-linking	小型	8,192
granite-20b-code-base-sql-gen	小型	8,192
granite-3-8b-base	小型	4,096

第三方按需部署基础模型

注：

当您部署某些专用基础模型时，需要支付每小时的访问费。托管这些按需部署基础模型的总价格是访问价格和托管价格的和。

GPU托管每小时价格（美元）+ 访问费每小时（美元）= 总每小时价格（美元）

有关 GPU 配置定价的详细信息，请参阅按需部署模型的按小时计费成本。

下表列出了您可以按需部署的第三方基金会模型。

表 5. 第三方基础模型可按需部署在 watsonx.ai
模型名称	提供者	每小时使用费（美元	部署配置大小	上下文窗口（输入 + 输出标记）
allam-1-13b-instruct	国家人工智能中心和沙特数据和人工智能管理局	–	小型	4,096
codellama-34b-instruct-hf	Code Llama	–	中等	16,384
deepseek-r1-distill-llama-8b	DeepSeek 人工智能	–	小型	131,072
deepseek-r1-distill-llama-70b	DeepSeek 人工智能	–	大型	131,072
eurollm-1-7b-instruct	项目	–	小型	4,096
eurollm-9b-instruct	项目	–	小型	4,096
gpt-oss-20b	OpenAI	–	–	131,072
gpt-oss-120b	OpenAI	–	–	131,072
llama-2-13b-chat	Meta	–	小型	4,096
llama-2-70b-chat	Meta	–	大型	4,096
llama-3-8b-instruct	Meta	–	小型	8,192
llama-3-70b-instruct	Meta	–	大型	8,192
llama-3-1-8b	Meta	–	小型	131,072
llama-3-1-70b	Meta	–	大型	131,072
llama-3-1-8b-instruct	Meta	–	小型	131,072
llama-3-1-70b-instruct	Meta	–	大型	131,072
llama-3-1-70b-gptq	Meta	–	–	131,072
llama-3-1-405b-instrcut-fp8	Meta	–	–	131,072
llama-3-2-11b-vision-instruct	Meta	–	小型	131,072
llama-3-2-90b-vision-instruct	Meta	–	–	131,072
llama-3-3-70b-instruct	Meta	–	中等	131,072
llama-3-3-70b-instruct-hf	Meta	–	大型	131,072
llama-4-maverick-17b-128e-instruct-fp8	Meta	–	–	131,072
llama-4-maverick-17b-128e-instruct-int4	Meta	–	–	131,072
llama-4-scout-17b-16e-instruct-fp8-dynamic	Meta	–	–	131,072
codestral-2501	Meta	$34.30	–	65,536
ministral-3b-instruct-2512	Mistral AI	–	–	262,144
ministral-8b-instruct-2512	Mistral AI	–	–	262,144
ministral-8b-instruct-2410	Mistral AI	$8.60	–	131,072
mistral-large-2512	Mistral AI	–	–	256,000
mistral-large-instruct-2407	Mistral AI	$34.30	大型	131,072
mistral-large-instruct-2411	Mistral AI	$34.30	大型	131,072
mistral-medium-2505	Mistral AI	$34.30	–	131,072
mistral-medium-2508	Mistral AI	$34.30	–	131,072
mistral-nemo-instruct-2407	Mistral AI	–	小型	131,072
mistral-small-3-1-24b-instruct-2503	Mistral AI	–	–	131,072
mistral-small-3-2-24b-instruct-2506	Mistral AI	–	–	131,072
mixtral-8x7b-base	Mistral AI	–	中等	32,768
mixtral-8x7b-instruct-v01	Mistral AI	–	中等	32,768
mt0-xxl-13b	BigScience	–	小型	4,096
pixtral-12b	Mistral AI	–	–	128,000
poro-34b-chat	LumiOpen	–	中等	2,048

了解更多

IBM 基础车型
第三方基金会车型
关于每个区域数据中心提供的车型列表，请参阅基础车型的区域可用性。
有关基础模型定价的详细信息，请参阅生成AI资产的计费详情。
有关定价和费率限制的信息，请参阅watsonx.aiRuntime 计划。