watsonx.ai支持的基础模型
您可以在 IBM watsonx.ai.You 中使用第三方和 IBM 的基础模型,可以使用 IBM 提供的基础模型并立即投入使用,也可以按需部署基础模型,专供您的组织使用。
如何选择车型
如需查看有助于您选择型号的因素,例如支持的任务和语言,请参阅选择型号和基金会型号基准。
有关 watsonx.ai 提供的用于文本嵌入和重新排序的基础模型,请参阅支持的编码器模型。
通过模型网关访问其他提供商的模型
您可以通过模型网关安全地访问来自多个模型提供商的基底模型并与之交互。 该模型网关提供了一个 OpenAI-compatible API,用于将请求路由到这些基础模型。 利用模型网关,通过统一接口对请求进行路由和格式化,从而在多个模型提供商之间高效切换。 您可以利用这些模型构建并部署 AI 代理、RAG 模式等。
如需更多信息,请参阅 “模型网关 ”。
基础模型的可用性因数据中心位置而异。 有关详情,请参阅地基型号的地区可用性。
按部署方法划分的基金会模型
根据部署方法,您可以直接在多租户硬件上使用基础模型,也可以在专用硬件上部署模型,供您的组织使用。 要了解有关部署模型的各种方法的更多信息,请参阅基础模型部署方法。
提供可直接使用的原型模型
在 IBM watsonx.ai中部署了一组开放式源代码和 IBM 基础模型。 您可以在提示Prompt Lab或通过编程提示这些基础模型。
有关 watsonx.ai 中基础模型推断的计量详情,请参阅基础模型推断的计费率。 有关 IBM watsonx.ai 与各种云提供商的服务说明的更多信息,请参阅:
您可以使用以下类型的基础模型:
IBM 基础车型
下表列出了 IBM 为推理提供的受支持的 IBM 基础模型。
您还可以从第三方资源库(如 Hugging Face )访问一些 IBM 基础模型。 IBM 您从第三方资源库获得的基础模型不在 的赔偿之列。 IBM 只有您从 watsonx.ai 访问的 IBM 基金会模型才受到 IBM 的赔偿。 有关 IBM 赔偿相关合同保护的更多信息,请参阅 IBM 客户关系协议。
| 模型名称 | API 模型 ID | 输入价格 USD/1,000代币) |
输出价格 USD/1,000代币) |
上下文窗口 (输入 + 输出标记) |
更多信息 |
|---|---|---|---|---|---|
| granite-4-h-small | ibm/granite-4-h-small |
$0.0000636 | $0.000265 | 131,072 | - 模型卡 - 网站 |
| granite-3-8b-instruct | ibm/granite-3-8b-instruct |
$0.000212 | $0.000212 | 131,072 | - 模型卡 -网站 -研究论文 |
| granite-guardian-3-8b | ibm/granite-guardian-3-8b |
$0.0002 | $0.0002 | 131,072 | • 模特卡 • 网站 |
| granite-8b-code-instruct | ibm/granite-8b-code-instruct |
$0.000636 | $0.000636 | 128,000 | - 模型卡 -网站 -研究论文 |
| 模型名称 | API 模型 ID | 输入价格 ( USD/1,000 数据点) |
输出价格 ( USD/1,000 数据点) |
上下文长度 最小数据点 |
更多信息 |
|---|---|---|---|---|---|
| granite-ttm-512-96-r2 | ibm/granite-ttm-512-96-r2 |
$0.0001378 | $0.0004028 | 512 | - 模型卡 --网站 --研究论文 |
| granite-ttm-1024-96-r2 | ibm/granite-ttm-1024-96-r2 |
$0.0001378 | $0.0004028 | 1,024 | - 模型卡 --网站 --研究论文 |
| granite-ttm-1536-96-r2 | ibm/granite-ttm-1536-96-r2 |
$0.0001378 | $0.0004028 | 1536 | - 模型卡 --网站 --研究论文 |
第三方基金会车型
下表列出了 watsonx.ai 支持的第三方基础模型。
| 模型名称 | API 模型 ID | 提供者 | 输入价格 USD/1,000代币) |
输出价格 USD/1,000代币) |
上下文窗口 (输入 + 输出标记) |
更多信息 |
|---|---|---|---|---|---|---|
| allam-1-13b-instruct | sdaia/allam-1-13b-instruct |
国家人工智能中心和沙特数据和人工智能管理局 | $0.001908 | $0.001908 | 4,096 | - 模型卡 |
| gpt-oss-120b | openai/gpt-oss-120b |
OpenAI | $0.000159 | $0.000636 | 131,072 | - 模型卡 - OpenAI 博客 |
| llama-4-maverick-17b-128e-instruct-fp8 | meta-llama/llama-4-maverick-17b-128e-instruct-fp8 |
Meta | $0.000371 | $0.001484 | 131,072 | • 模型卡 • Meta AI博客 |
| llama-3-3-70b-instruct | meta-llama/llama-3-3-70b-instruct |
Meta | $0.0007526 | $0.0007526 | 131,072 | • 模型卡 • Meta AI博客 |
| llama-3-2-11b-vision-instruct | meta-llama/llama-3-2-11b-vision-instruct |
Meta | $0.000371 | $0.000371 | 131,072 | • 模型卡 • Meta AI博客 • 研究论文 |
| llama-3-2-90b-vision-instruct | meta-llama/llama-3-2-90b-vision-instruct |
Meta | $0.00212 | $0.00212 | 131,072 | • 模型卡 • Meta AI博客 • 研究论文 |
| llama-guard-3-11b-vision | meta-llama/llama-guard-3-11b-vision |
Meta | $0.000371 | $0.000371 | 131,072 | • 模型卡 • Meta AI博客 • 研究论文 |
| llama-3-405b-instruct | meta-llama/llama-3-405b-instruct |
Meta | $0.0053 | $0.01696 | 16,384 | • 模型卡 • Meta AI博客 |
| mistral-large-2512 | mistralai/mistral-large-2512 |
Mistral AI | $0.000636 | $0.001908 | 256,000 | • 模特卡片 • Mistral Large 3 专属博客文章 |
| mistral-medium-2505 | mistralai/mistral-medium-2505 |
Mistral AI | $0.00337 | $0.01007 | 131,072 | - 模型卡 - Mistral Medium 3 的博文 |
| mistral-small-3-1-24b-instruct-2503 | mistralai/mistral-small-3-1-24b-instruct-2503 |
Mistral AI | $0.000106 | $0.000318 | 131,072 | • 模型卡 • Mistral 3.1 博客文章 |
| mt0-xxl-13b | bigscience/mt0-xxl |
BigScience | $0.001908 | $0.001908 | 4,096 | - 示范卡 -研究论文 |
按需部署基础模型
您可以使用一组 IBM 精选模型中的基础模型,部署为您的组织专用。
您可以选择按需部署以下基础模型:
通过指定部署配置大小来按需部署模型的做法已被弃用。 使用 GPU 硬件配置来部署新机型,并计算托管机型的价格。 有关模型托管环境和按需部署模型的定价详情,请参阅生成式人工智能资产的计费详情。
IBM 按需部署基础模型
下表列出了您可以按需部署的 IBM 基础模型。
一些 IBM 基础模型也可从第三方资源库获取,如 Hugging Face。 IBM 您从第三方资源库获得的基础模型不在 的赔偿之列。 IBM 只有您从 watsonx.ai 访问的 IBM 基金会模型才受到 IBM 的赔偿。 有关 IBM 赔偿相关合同保护的更多信息,请参阅 IBM 客户关系协议。
| 模型名称 | 部署配置大小 |
上下文窗口 (输入 + 输出标记) |
|---|---|---|
| granite-vision-3-3-2b | – | 131,072 |
| granite-3-3-8b-instruct | 小型 | 131,072 |
| granite-3-3-2b-instruct | 小型 | 131,072 |
| granite-3-2-8b-instruct | 小型 | 131,072 |
| granite-3-1-8b-base | 小型 | 131,072 |
| granite-8b-japanese | 小型 | 4,096 |
| granite-20b-multilingual | 小型 | 8,192 |
| granite-13b-chat-v2 | 小型 | 8,192 |
| granite-3b-code-instruct | 小型 | 128,000 |
| granite-8b-code-instruct | 小型 | 128,000 |
| granite-20b-code-instruct | 小型 | 8,192 |
| granite-34b-code-instruct | 小型 | 8,192 |
| granite-20b-code-base-schema-linking | 小型 | 8,192 |
| granite-20b-code-base-sql-gen | 小型 | 8,192 |
| granite-3-8b-base | 小型 | 4,096 |
第三方按需部署基础模型
GPU托管每小时价格(美元)+ 访问费每小时(美元)= 总每小时价格(美元)
有关 GPU 配置定价的详细信息,请参阅按需部署模型的按小时计费成本。
下表列出了您可以按需部署的第三方基金会模型。
| 模型名称 | 提供者 | 每小时使用费(美元 | 部署配置大小 |
上下文窗口 (输入 + 输出标记) |
|---|---|---|---|---|
| allam-1-13b-instruct | 国家人工智能中心和沙特数据和人工智能管理局 | – | 小型 | 4,096 |
| codellama-34b-instruct-hf | Code Llama | – | 中等 | 16,384 |
| deepseek-r1-distill-llama-8b | DeepSeek 人工智能 | – | 小型 | 131,072 |
| deepseek-r1-distill-llama-70b | DeepSeek 人工智能 | – | 大型 | 131,072 |
| eurollm-1-7b-instruct | 项目 | – | 小型 | 4,096 |
| eurollm-9b-instruct | 项目 | – | 小型 | 4,096 |
| gpt-oss-20b | OpenAI | – | – | 131,072 |
| gpt-oss-120b | OpenAI | – | – | 131,072 |
| llama-2-13b-chat | Meta | – | 小型 | 4,096 |
| llama-2-70b-chat | Meta | – | 大型 | 4,096 |
| llama-3-8b-instruct | Meta | – | 小型 | 8,192 |
| llama-3-70b-instruct | Meta | – | 大型 | 8,192 |
| llama-3-1-8b | Meta | – | 小型 | 131,072 |
| llama-3-1-70b | Meta | – | 大型 | 131,072 |
| llama-3-1-8b-instruct | Meta | – | 小型 | 131,072 |
| llama-3-1-70b-instruct | Meta | – | 大型 | 131,072 |
| llama-3-1-70b-gptq | Meta | – | – | 131,072 |
| llama-3-1-405b-instrcut-fp8 | Meta | – | – | 131,072 |
| llama-3-2-11b-vision-instruct | Meta | – | 小型 | 131,072 |
| llama-3-2-90b-vision-instruct | Meta | – | – | 131,072 |
| llama-3-3-70b-instruct | Meta | – | 中等 | 131,072 |
| llama-3-3-70b-instruct-hf | Meta | – | 大型 | 131,072 |
| llama-4-maverick-17b-128e-instruct-fp8 | Meta | – | – | 131,072 |
| llama-4-maverick-17b-128e-instruct-int4 | Meta | – | – | 131,072 |
| llama-4-scout-17b-16e-instruct-fp8-dynamic | Meta | – | – | 131,072 |
| codestral-2501 | Meta | $34.30 | – | 65,536 |
| ministral-3b-instruct-2512 | Mistral AI | – | – | 262,144 |
| ministral-8b-instruct-2512 | Mistral AI | – | – | 262,144 |
| ministral-8b-instruct-2410 | Mistral AI | $8.60 | – | 131,072 |
| mistral-large-2512 | Mistral AI | – | – | 256,000 |
| mistral-large-instruct-2407 | Mistral AI | $34.30 | 大型 | 131,072 |
| mistral-large-instruct-2411 | Mistral AI | $34.30 | 大型 | 131,072 |
| mistral-medium-2505 | Mistral AI | $34.30 | – | 131,072 |
| mistral-medium-2508 | Mistral AI | $34.30 | – | 131,072 |
| mistral-nemo-instruct-2407 | Mistral AI | – | 小型 | 131,072 |
| mistral-small-3-1-24b-instruct-2503 | Mistral AI | – | – | 131,072 |
| mistral-small-3-2-24b-instruct-2506 | Mistral AI | – | – | 131,072 |
| mixtral-8x7b-base | Mistral AI | – | 中等 | 32,768 |
| mixtral-8x7b-instruct-v01 | Mistral AI | – | 中等 | 32,768 |
| mt0-xxl-13b | BigScience | – | 小型 | 4,096 |
| pixtral-12b | Mistral AI | – | – | 128,000 |
| poro-34b-chat | LumiOpen | – | 中等 | 2,048 |
了解更多
- IBM 基础车型
- 第三方基金会车型
- 关于每个区域数据中心提供的车型列表,请参阅基础车型的区域可用性。
- 有关基础模型定价的详细信息,请参阅生成AI资产的计费详情。
- 有关定价和费率限制的信息,请参阅watsonx.aiRuntime 计划。