watsonx.ai 中的基础模型 

探索 watsonx.ai 工作室提供的 IBM AI 模型库
watsonx.ai 基础模型的产品屏幕截图

选择所需模型

选择最适合您业务的 IBM Granite、开源或第三方模型,并在本地或云端进行部署。

IBM 关于 AI 模型的观点 选择合适的基础模型

最新消息

Granite 3.3 现已纳入 watsonx 基础模型库。
Mistral Medium 3 现已接入 watsonx.ai
新模型功能
Meta Llama 4 Maverick 和 Llama 4 Scout 现已入驻 watsonx.ai
新模型功能
新的 Granite 3.3 模型具有语音转文本功能并改进了语言模型性能
新模型功能

基础模型库

选择最适合您的具体用例、预算考虑因素、地区利益和风险状况的模型。

查看嵌入模型库
IBM 徽标
IBM 模型

IBM Granite 系列专为企业量身定制,具有开放性、高性能和值得信赖的模型,能够以具有竞争力的价格提供卓越性能,同时又不影响安全性。

查看 IBM 模型库 深入了解 Granite
Meta 徽标
Meta Llama 模型

Llama 模型是开放、高效的大型语言模型,旨在实现各种自然语言任务的多功能性和强大性能。

查看 Meta 模型库 详细了解我们的合作关系
Mistral 徽标
Mistral AI 模型

Mistral 模型是快速、高性能、开放权重的语言模型,专为模块化而设计,并针对文本生成、推理和多语言应用程序进行了优化。

查看 Mistral 模型库
放大镜图标示意
其他第三方模型提供商

watsonx.ai 上有多种来自其他提供商的基础模型可供使用。

查看模型库
Gartner 公司徽标

IBM 获评数据科学与机器学习领域领导者

IBM 荣膺 2025 年 Gartner Magic Quadrant™ 数据科学和机器学习平台领导者称号。

获取报告

客户案例

当您使用自身独特的数据训练强大的 AI 模型时,会发生什么呢?利用 AI 改进客户体验,并加速实现价值。探索成功案例,了解其背后的原因。

温布尔登徽标
温布尔登

温布尔登网球公开赛使用 watsonx.ai 基础模型训练 AI,以创建网球解说。

阅读成功案例
Recording Academy 徽标
Recording Academy

Recording Academy(美国录音学院)使用 IBM watsonx 的 “AI Stories”(AI 故事)功能,快速生成并扩充与格莱美奖提名者有关的文字内容。

阅读公告
高尔夫大师赛标志
大师

大师赛使用 watsonx.ai 将人工智能驱动的球洞洞察分析与专家意见引入数字平台。

阅读公告
AddAI.Life 徽标
AddAI.Life

AddAI.Life 使用 watsonx.ai 访问选定的开源大型语言模型,构建更高质量的虚拟助理。

阅读成功案例
模型名称 提供商 用例 上下文长度 价格 美元/百万个词元*

gpt-oss-120b

OpenAI

私有本地部署或边缘部署、推理工作流、工具使用(如搜索、代码执行)、可定制思维链、结构化输出、可调节推理强度

128k

输入 0.15 个令牌 
输出 0.60 个令牌

granite-3-3-8b-instruct

新兴型
特色模型

IBM

支持推理和规划、问答(Q&A)、中间内容填充、汇总、分类、生成、提取、RAG 和编码任务。

128k

0.20

granite-3-2-8b-instruct

IBM

支持推理和规划、问答、汇总、分类、生成、提取、RAG 和编码任务。

128k

0.20

granite-vision-3-2-2b

IBM

支持图像转文本用例,包括图表分析、信息图解析及上下文问答功能。

16,384

0.10

granite-3-2b-instruct (v3.1)

IBM

支持问答、汇总、分类、生成、提取、RAG 和编码任务。

128k

0.10

granite-3-8b-instruct (v3.1)

特色模型

IBM

支持问答、汇总、分类、生成、提取、RAG 和编码任务。

128k

0.20

granite-guardian-3-8b (v3.1)

IBM

支持检测 HAP 或 PII、越狱、偏见、暴力和其他有害内容。

128k

0.20

granite-guardian-3-2b (v3.1)

已弃用

IBM

支持检测 HAP 或 PII、越狱、偏见、暴力和其他有害内容。

128k

0.10

granite-13b-instruct

已弃用

IBM

支持 Q&A、摘要、分类、生成、提取和 RAG 任务。

8192

0.60

granite-8b-code-instruct

IBM

通过自然语言提示生成、说明和翻译代码,为代码创建任务专用模型。

 

128k

0.60

granite-8b-japanese

已弃用

IBM

支持日语 Q&A、摘要、分类、生成、提取、翻译和 RAG 任务。

4096

0.60

*所示价格仅供参考,可能会因国家或地区而异,不含任何适用税款和关税,并视当地产品供应情况而定。

模型名称 提供商 用例 上下文长度 价格 美元/百万个词元*

llama-4-scout-17b-16e-instruct

新兴型

Meta

多模态推理、长上下文处理(1000 万词元)、代码生成和分析、多语言运营(支持 200 种语言)、STEM 和逻辑推理。

128k

免费预览

llama-4-maverick-17b-128e-instruct-fp8

新兴型

Meta

多模态推理、长上下文处理(1000 万词元)、代码生成和分析、多语言运营(支持 200 种语言)、STEM 和逻辑推理。

128k

输入:0.35/输出:1.40

llama-3-3-70b-instruct

Meta

支持英语、德语、法语、意大利语、葡萄牙语、印地语、西班牙语和泰语的 Q&A、摘要、生成、编码、分类、提取、翻译和 RAG 任务。

128k

0.71

llama-3-2-90b-vision-instruct

Meta

支持图像字幕、包括手写在内的图像到文本转录 (OCR)、数据提取和处理、上下文问答和对象识别。

128k

2.00

llama-3-2-11b-vision-instruct

Meta

支持图像字幕、包括手写在内的图像到文本转录 (OCR)、数据提取和处理、上下文问答和对象识别。

128k

0.35

llama-guard-3-11b-vision

Meta

支持图像过滤、HAP 或 PII 检测和有害内容过滤。

128k

0.35

llama-3-2-1b-instruct

Meta

支持英语、德语、法语、意大利语、葡萄牙语、印地语、西班牙语和泰语的 Q&A、摘要、生成、编码、分类、提取、翻译和 RAG 任务。

128k

0.10

llama-3-2-3b-instruct

Meta

支持英语、德语、法语、意大利语、葡萄牙语、印地语、西班牙语和泰语的 Q&A、摘要、生成、编码、分类、提取、翻译和 RAG 任务。

128k

0.15

llama-3-405b-instruct

Meta

支持英语、德语、法语、意大利语、葡萄牙语、印地语、西班牙语和泰语的 Q&A、摘要、生成、编码、分类、提取、翻译和 RAG 任务。

128k

输入:5.00/输出:16.00

*所示价格仅供参考,可能会因国家或地区而异,不含任何适用税款和关税,并视当地产品供应情况而定。

Mistral 模型

模型名称 提供商 用例 上下文长度 价格 美元/百万个词元*

mistral-medium-2505

新兴型

Mistral AI

支持编码、图像字幕、图像到文本转录、函数调用、数据提取和处理、上下文问答和数学推理

128k

输入:3.00/输出:10.00

mistral-small-3-1-24b-instruct-2503

新兴型

Mistral AI

支持图像字幕、图像到文本转录、函数调用、数据提取和处理、上下文问答和对象识别

128k

输入:0.10/输出:0.30

pixtral-12b

已弃用

Mistral AI

支持图像字幕、包括手写在内的图像到文本转录 (OCR)、数据提取和处理、上下文问答和对象识别。

128k

0.35

mistral-large-2

已弃用

Mistral AI

支持法语、德语、意大利语、西班牙语和英语的 Q&A、摘要、生成、编码、分类、提取、翻译和 RAG 任务。

128k*

输入:3.00/输出:10.00

*所示价格仅供参考,可能会因国家或地区而异,不含任何适用税款和关税,并视当地产品供应情况而定。

第三方基础模型

模型名称 提供商 用例 上下文长度 价格 美元/百万个词元*

allam-1-13b-instruct

SDAIA

支持阿拉伯语的问答、汇总、分类、生成、提取、RAG 和翻译任务。

4096

1.80

jais-13b-chat(阿拉伯语)

core42

支持阿拉伯语的 Q&A、摘要、分类、生成、提取和翻译任务。

2048

1.80

flan-t5-xl-3b

已弃用

Google

支持 Q&A、摘要、分类、生成、提取和 RAG 任务。可用于提示微调。

4096

0.60

flan-t5-xxl-11b

已弃用

Google

支持 Q&A、摘要、分类、生成、提取和 RAG 任务。

4096

1.80

flan-ul2-20b

已弃用

Google

支持 Q&A、摘要、分类、生成、提取和 RAG 任务。

4096

5.00

elyza-japanese-llama-2-7b-instruct

已弃用

ELYZA

支持 Q&A、摘要、RAG、分类、生成、提取和翻译任务。

4096

1.80

*所示价格仅供参考,可能会因国家或地区而异,不含任何适用税款和关税,并视当地产品供应情况而定。

嵌入模型库

使用 IBM 开发的开放源代码嵌入模型,部署在 IBM watsonx.ai 中,用于检索增强生成、语义搜索和文档比较任务。或选择第三方嵌入模型提供商。

IBM 嵌入模型

模型名称 提供商 用例 上下文长度 价格 美元/百万个词元*

granite-embedding-107m-multilingual

新兴型

IBM

检索增强生成、语义搜索和文档比较任务。

512

0.10

granite-embedding-278m-multilingual

IBM

检索增强生成、语义搜索和文档比较任务。

512

0.10

slate-125m-english-rtrvr-v2

IBM

检索增强生成、语义搜索和文档比较任务。

512

0.10

slate-125m-english-rtrvr

IBM

检索增强生成、语义搜索和文档比较任务。

512

0.10

slate-30m-english-rtrvr-v2

IBM

检索增强生成、语义搜索和文档比较任务。

512

0.10

slate-30m-english-rtrvr

IBM

检索增强生成、语义搜索和文档比较任务。

512

0.10

*所示价格仅供参考,可能会因国家或地区而异,不含任何适用税款和关税,并视当地产品供应情况而定。

第三方嵌入式模型

模型名称 提供商 用例 上下文长度 价格 美元/百万个词元*

all-mini-l6-v2

新兴型

Microsoft

检索增强生成、语义搜索和文档比较任务。

256

0.10

all-minilm-l12-v2

OS-NLP-CV

检索增强生成、语义搜索和文档比较任务。

256

0.10

multilingual-e5-large

Intel

检索增强生成、语义搜索和文档比较任务。

512

0.10

*所示价格仅供参考,可能会因国家或地区而异,不含任何适用税款和关税,并视当地产品供应情况而定。

知识产权

IBM 相信,AI 模型的创建、部署和运用能够负责任地推进整个企业的创新。IBM watsonx AI 产品组合具有构建和测试基础模型和生成式 AI 的端到端流程。对于 IBM 开发的模型,我们在模型训练之前就搜索并删除重复项,使用 URL 拦截列表技术、令人反感的内容和文件质量过滤器以及语句拆分和标记技术。

在数据训练过程中,我们力求防止模型输出失准,并使用监督微调来改善指令跟踪,以便借助提示工程将模型用于企业任务。我们将继续朝着多个方向开发 Granite 模型,包括其他模态、行业专用内容和用于训练的数据注释,同时针对 IBM 开发的模型部署定期、持续的数据保护措施。

鉴于生成式 AI 技术的日新月异,我们端到端的流程有望不断发展和完善。作为 IBM 在其基础模型开发和测试中投入的严谨性证明,IBM 为其开发的模型提供标准的合同知识产权赔偿,类似于为 IBM 硬件和软件产品提供的赔偿。

与其他一些大语言模型提供商不同,IBM 不要求客户因使用 IBM 开发的模型而赔偿 IBM,这是 IBM 的标准赔偿惯例。此外,IBM 对自身开发的模型未设置赔偿责任上限,这也符合 IBM 的一贯赔偿义务做法。

受上述保护的 watsonx 模型目前包括:

(1) Slate 系列纯编码器模型

(2) Granite 系列纯解码器模型

了解更多 Granite 模型许可信息 (PDF)

采取下一步行动

立即免费试用产品或预约功能演示,开启生成式 AI 与机器学习的商业落地与规模化应用。

开始免费试用 预约实时演示
更多探索方式 与 IBM 社区建立联系 阅读 SaaS 文档 阅读软件文档 寻求支持
脚注

* 上下文长度受模型供应商支持,但平台实际上下文长度有限制。有关更多信息,请参阅 文档

推理以资源单位计费。1 个资源单位等于 1,000 个词元。输入词元和输出词元采用相同费率。1,000 个词元通常相当于 750 个词语。

并非所有模型在所有地区都可售。请参阅我们的文档,了解详情

上下文长度以词元表示。

IBM 可自行决定更改或撤销有关公司计划、方向和意图的声明,恕不另行通知。请参阅定价了解更多详细信息。除非软件定价中另有规定,否则所有特性、功能和潜在更新仅限 SaaS。IBM 不保证 SaaS 和软件具备相同的特性和功能。