基础模型 - IBM watsonx.ai

选择所需模型

选择最适合您业务的 IBM Granite、开源或第三方模型，并在本地或云端进行部署。

IBM 关于 AI 模型的观点

选择合适的基础模型

基础模型库

选择最适合您的具体用例、预算考虑因素、地区利益和风险状况的模型。

查看嵌入模型库

IBM 模型

IBM Granite 系列专为企业量身定制，具有开放性、高性能和值得信赖的模型，能够以具有竞争力的价格提供卓越性能，同时又不影响安全性。

查看 IBM 模型库

深入了解 Granite

Meta Llama 模型

Llama 模型是开放、高效的大型语言模型，旨在实现各种自然语言任务的多功能性和强大性能。

查看 Meta 模型库

详细了解我们的合作关系

Mistral AI 模型

Mistral 模型是快速、高性能、开放权重的语言模型，专为模块化而设计，并针对文本生成、推理和多语言应用程序进行了优化。

查看 Mistral 模型库

其他第三方模型提供商

watsonx.ai 上有多种来自其他提供商的基础模型可供使用。

查看模型库

客户案例

当您使用自身独特的数据训练强大的 AI 模型时，会发生什么呢？利用 AI 改进客户体验，并加速实现价值。探索成功案例，了解其背后的原因。

温布尔登

温布尔登网球公开赛使用 watsonx.ai 基础模型训练 AI，以创建网球解说。

阅读成功案例

Recording Academy

Recording Academy（美国录音学院）使用 IBM watsonx 的 “AI Stories”（AI 故事）功能，快速生成并扩充与格莱美奖提名者有关的文字内容。

阅读公告

大师

大师赛使用 watsonx.ai 将人工智能驱动的球洞洞察分析与专家意见引入数字平台。

阅读公告

AddAI.Life

AddAI.Life 使用 watsonx.ai 访问选定的开源大型语言模型，构建更高质量的虚拟助理。

阅读成功案例

IBM 基础模型

查看 Granite 模型训练方法 (PDF)

深入了解 Granite

模型名称

提供商

用例

上下文长度

价格

美元/百万个词元*

gpt-oss-120b

OpenAI

私有本地部署或边缘部署、推理工作流、工具使用（如搜索、代码执行）、可定制思维链、结构化输出、可调节推理强度

128k

输入 0.15 个令牌
输出 0.60 个令牌

granite-3-3-8b-instruct

新兴型

特色模型

IBM

支持推理和规划、问答（Q&A）、中间内容填充、汇总、分类、生成、提取、RAG 和编码任务。

128k

0.20

granite-3-2-8b-instruct

IBM

支持推理和规划、问答、汇总、分类、生成、提取、RAG 和编码任务。

128k

0.20

granite-vision-3-2-2b

IBM

支持图像转文本用例，包括图表分析、信息图解析及上下文问答功能。

16,384

0.10

granite-3-2b-instruct (v3.1)

IBM

支持问答、汇总、分类、生成、提取、RAG 和编码任务。

128k

0.10

granite-3-8b-instruct (v3.1)

特色模型

IBM

支持问答、汇总、分类、生成、提取、RAG 和编码任务。

128k

0.20

granite-guardian-3-8b (v3.1)

IBM

支持检测 HAP 或 PII、越狱、偏见、暴力和其他有害内容。

128k

0.20

granite-guardian-3-2b (v3.1)

已弃用

IBM

支持检测 HAP 或 PII、越狱、偏见、暴力和其他有害内容。

128k

0.10

granite-13b-instruct

已弃用

IBM

支持 Q&A、摘要、分类、生成、提取和 RAG 任务。

8192

0.60

granite-8b-code-instruct

IBM

通过自然语言提示生成、说明和翻译代码，为代码创建任务专用模型。

128k

0.60

granite-8b-japanese

已弃用

IBM

支持日语 Q&A、摘要、分类、生成、提取、翻译和 RAG 任务。

4096

0.60

*所示价格仅供参考，可能会因国家或地区而异，不含任何适用税款和关税，并视当地产品供应情况而定。

元模型

详细了解我们的合作关系

模型名称

提供商

用例

上下文长度

价格

美元/百万个词元*

llama-4-scout-17b-16e-instruct

新兴型

Meta

多模态推理、长上下文处理（1000 万词元）、代码生成和分析、多语言运营（支持 200 种语言）、STEM 和逻辑推理。

128k

免费预览

llama-4-maverick-17b-128e-instruct-fp8

新兴型

Meta

多模态推理、长上下文处理（1000 万词元）、代码生成和分析、多语言运营（支持 200 种语言）、STEM 和逻辑推理。

128k

输入：0.35/输出：1.40

llama-3-3-70b-instruct

Meta

支持英语、德语、法语、意大利语、葡萄牙语、印地语、西班牙语和泰语的 Q&A、摘要、生成、编码、分类、提取、翻译和 RAG 任务。

128k

0.71

llama-3-2-90b-vision-instruct

Meta

支持图像字幕、包括手写在内的图像到文本转录 (OCR)、数据提取和处理、上下文问答和对象识别。

128k

2.00

llama-3-2-11b-vision-instruct

Meta

支持图像字幕、包括手写在内的图像到文本转录 (OCR)、数据提取和处理、上下文问答和对象识别。

128k

0.35

llama-guard-3-11b-vision

Meta

支持图像过滤、HAP 或 PII 检测和有害内容过滤。

128k

0.35

llama-3-2-1b-instruct

Meta

支持英语、德语、法语、意大利语、葡萄牙语、印地语、西班牙语和泰语的 Q&A、摘要、生成、编码、分类、提取、翻译和 RAG 任务。

128k

0.10

llama-3-2-3b-instruct

Meta

支持英语、德语、法语、意大利语、葡萄牙语、印地语、西班牙语和泰语的 Q&A、摘要、生成、编码、分类、提取、翻译和 RAG 任务。

128k

0.15

llama-3-405b-instruct

Meta

支持英语、德语、法语、意大利语、葡萄牙语、印地语、西班牙语和泰语的 Q&A、摘要、生成、编码、分类、提取、翻译和 RAG 任务。

128k

输入：5.00/输出：16.00

*所示价格仅供参考，可能会因国家或地区而异，不含任何适用税款和关税，并视当地产品供应情况而定。

Mistral 模型

模型名称

提供商

用例

上下文长度

价格

美元/百万个词元*

mistral-medium-2505

新兴型

Mistral AI

支持编码、图像字幕、图像到文本转录、函数调用、数据提取和处理、上下文问答和数学推理

128k

输入：3.00/输出：10.00

mistral-small-3-1-24b-instruct-2503

新兴型

Mistral AI

支持图像字幕、图像到文本转录、函数调用、数据提取和处理、上下文问答和对象识别

128k

输入：0.10/输出：0.30

pixtral-12b

已弃用

Mistral AI

支持图像字幕、包括手写在内的图像到文本转录 (OCR)、数据提取和处理、上下文问答和对象识别。

128k

0.35

mistral-large-2

已弃用

Mistral AI

支持法语、德语、意大利语、西班牙语和英语的 Q&A、摘要、生成、编码、分类、提取、翻译和 RAG 任务。

128k*

输入：3.00/输出：10.00

*所示价格仅供参考，可能会因国家或地区而异，不含任何适用税款和关税，并视当地产品供应情况而定。

第三方基础模型

模型名称

提供商

用例

上下文长度

价格

美元/百万个词元*

allam-1-13b-instruct

SDAIA

支持阿拉伯语的问答、汇总、分类、生成、提取、RAG 和翻译任务。

4096

1.80

jais-13b-chat（阿拉伯语）

core42

支持阿拉伯语的 Q&A、摘要、分类、生成、提取和翻译任务。

2048

1.80

flan-t5-xl-3b

已弃用

Google

支持 Q&A、摘要、分类、生成、提取和 RAG 任务。可用于提示微调。

4096

0.60

flan-t5-xxl-11b

已弃用

Google

支持 Q&A、摘要、分类、生成、提取和 RAG 任务。

4096

1.80

flan-ul2-20b

已弃用

Google

支持 Q&A、摘要、分类、生成、提取和 RAG 任务。

4096

5.00

elyza-japanese-llama-2-7b-instruct

已弃用

ELYZA

支持 Q&A、摘要、RAG、分类、生成、提取和翻译任务。

4096

1.80

*所示价格仅供参考，可能会因国家或地区而异，不含任何适用税款和关税，并视当地产品供应情况而定。

嵌入模型库

使用 IBM 开发的开放源代码嵌入模型，部署在 IBM watsonx.ai 中，用于检索增强生成、语义搜索和文档比较任务。或选择第三方嵌入模型提供商。

IBM 嵌入模型

模型名称

提供商

用例

上下文长度

价格

美元/百万个词元*

granite-embedding-107m-multilingual

新兴型

IBM

检索增强生成、语义搜索和文档比较任务。

512

0.10

granite-embedding-278m-multilingual

IBM

检索增强生成、语义搜索和文档比较任务。

512

0.10

slate-125m-english-rtrvr-v2

IBM

检索增强生成、语义搜索和文档比较任务。

512

0.10

slate-125m-english-rtrvr

IBM

检索增强生成、语义搜索和文档比较任务。

512

0.10

slate-30m-english-rtrvr-v2

IBM

检索增强生成、语义搜索和文档比较任务。

512

0.10

slate-30m-english-rtrvr

IBM

检索增强生成、语义搜索和文档比较任务。

512

0.10

*所示价格仅供参考，可能会因国家或地区而异，不含任何适用税款和关税，并视当地产品供应情况而定。

第三方嵌入式模型

模型名称

提供商

用例

上下文长度

价格

美元/百万个词元*

all-mini-l6-v2

新兴型

Microsoft

检索增强生成、语义搜索和文档比较任务。

256

0.10

all-minilm-l12-v2

OS-NLP-CV

检索增强生成、语义搜索和文档比较任务。

256

0.10

multilingual-e5-large

Intel

检索增强生成、语义搜索和文档比较任务。

512

0.10

*所示价格仅供参考，可能会因国家或地区而异，不含任何适用税款和关税，并视当地产品供应情况而定。

资源

如何选择合适的 AI 基础模型

查看完整的 Granite 指南

面向企业的生成式 AI 和 ML

Hugging Face 和 IBM 启动开源代码合作

知识产权

IBM 相信，AI 模型的创建、部署和运用能够负责任地推进整个企业的创新。IBM watsonx AI 产品组合具有构建和测试基础模型和生成式 AI 的端到端流程。对于 IBM 开发的模型，我们在模型训练之前就搜索并删除重复项，使用 URL 拦截列表技术、令人反感的内容和文件质量过滤器以及语句拆分和标记技术。

在数据训练过程中，我们力求防止模型输出失准，并使用监督微调来改善指令跟踪，以便借助提示工程将模型用于企业任务。我们将继续朝着多个方向开发 Granite 模型，包括其他模态、行业专用内容和用于训练的数据注释，同时针对 IBM 开发的模型部署定期、持续的数据保护措施。

鉴于生成式 AI 技术的日新月异，我们端到端的流程有望不断发展和完善。作为 IBM 在其基础模型开发和测试中投入的严谨性证明，IBM 为其开发的模型提供标准的合同知识产权赔偿，类似于为 IBM 硬件和软件产品提供的赔偿。

与其他一些大语言模型提供商不同，IBM 不要求客户因使用 IBM 开发的模型而赔偿 IBM，这是 IBM 的标准赔偿惯例。此外，IBM 对自身开发的模型未设置赔偿责任上限，这也符合 IBM 的一贯赔偿义务做法。

受上述保护的 watsonx 模型目前包括：

(1) Slate 系列纯编码器模型

(2) Granite 系列纯解码器模型

了解更多 Granite 模型许可信息 (PDF)

采取下一步行动

立即免费试用产品或预约功能演示，开启生成式 AI 与机器学习的商业落地与规模化应用。

开始免费试用

预约实时演示

更多探索方式

与 IBM 社区建立联系

阅读 SaaS 文档

阅读软件文档

寻求支持

脚注

^* 上下文长度受模型供应商支持，但平台实际上下文长度有限制。有关更多信息，请参阅文档。

推理以资源单位计费。1 个资源单位等于 1,000 个词元。输入词元和输出词元采用相同费率。1,000 个词元通常相当于 750 个词语。

并非所有模型在所有地区都可售。请参阅我们的文档，了解详情。

上下文长度以词元表示。

IBM 可自行决定更改或撤销有关公司计划、方向和意图的声明，恕不另行通知。请参阅定价了解更多详细信息。除非软件定价中另有规定，否则所有特性、功能和潜在更新仅限 SaaS。IBM 不保证 SaaS 和软件具备相同的特性和功能。

watsonx.ai 中的基础模型

选择所需模型

最新消息

基础模型库

客户案例

IBM 基础模型

元模型

Mistral 模型

第三方基础模型

嵌入模型库

IBM 嵌入模型

第三方嵌入式模型

资源

知识产权

脚注