选择最适合您业务的 IBM Granite、开源或第三方模型,并在本地或云端进行部署。
选择最适合您的具体用例、预算考虑因素、地区利益和风险状况的模型。
IBM Granite 系列专为企业量身定制,具有开放性、高性能和值得信赖的模型,能够以具有竞争力的价格提供卓越性能,同时又不影响安全性。
Llama 模型是开放、高效的大型语言模型,旨在实现各种自然语言任务的多功能性和强大性能。
Mistral 模型是快速、高性能、开放权重的语言模型,专为模块化而设计,并针对文本生成、推理和多语言应用程序进行了优化。
watsonx.ai 上有多种来自其他提供商的基础模型可供使用。
当您使用自身独特的数据训练强大的 AI 模型时,会发生什么呢?利用 AI 改进客户体验,并加速实现价值。探索成功案例,了解其背后的原因。
温布尔登网球公开赛使用 watsonx.ai 基础模型训练 AI,以创建网球解说。
Recording Academy(美国录音学院)使用 IBM watsonx 的 “AI Stories”(AI 故事)功能,快速生成并扩充与格莱美奖提名者有关的文字内容。
大师赛使用 watsonx.ai 将人工智能驱动的球洞洞察分析与专家意见引入数字平台。
AddAI.Life 使用 watsonx.ai 访问选定的开源大型语言模型,构建更高质量的虚拟助理。
gpt-oss-120b
OpenAI
私有本地部署或边缘部署、推理工作流、工具使用(如搜索、代码执行)、可定制思维链、结构化输出、可调节推理强度
128k
输入 0.15 个令牌
输出 0.60 个令牌
granite-3-3-8b-instruct
IBM
支持推理和规划、问答(Q&A)、中间内容填充、汇总、分类、生成、提取、RAG 和编码任务。
128k
0.20
granite-3-2-8b-instruct
IBM
支持推理和规划、问答、汇总、分类、生成、提取、RAG 和编码任务。
128k
0.20
granite-vision-3-2-2b
IBM
支持图像转文本用例,包括图表分析、信息图解析及上下文问答功能。
16,384
0.10
granite-3-2b-instruct (v3.1)
IBM
支持问答、汇总、分类、生成、提取、RAG 和编码任务。
128k
0.10
granite-3-8b-instruct (v3.1)
IBM
支持问答、汇总、分类、生成、提取、RAG 和编码任务。
128k
0.20
granite-guardian-3-8b (v3.1)
IBM
支持检测 HAP 或 PII、越狱、偏见、暴力和其他有害内容。
128k
0.20
granite-guardian-3-2b (v3.1)
IBM
支持检测 HAP 或 PII、越狱、偏见、暴力和其他有害内容。
128k
0.10
granite-13b-instruct
IBM
支持 Q&A、摘要、分类、生成、提取和 RAG 任务。
8192
0.60
granite-8b-code-instruct
IBM
通过自然语言提示生成、说明和翻译代码,为代码创建任务专用模型。
128k
0.60
granite-8b-japanese
IBM
支持日语 Q&A、摘要、分类、生成、提取、翻译和 RAG 任务。
4096
0.60
*所示价格仅供参考,可能会因国家或地区而异,不含任何适用税款和关税,并视当地产品供应情况而定。
llama-4-scout-17b-16e-instruct
Meta
多模态推理、长上下文处理(1000 万词元)、代码生成和分析、多语言运营(支持 200 种语言)、STEM 和逻辑推理。
128k
免费预览
llama-4-maverick-17b-128e-instruct-fp8
Meta
多模态推理、长上下文处理(1000 万词元)、代码生成和分析、多语言运营(支持 200 种语言)、STEM 和逻辑推理。
128k
输入:0.35/输出:1.40
llama-3-3-70b-instruct
Meta
支持英语、德语、法语、意大利语、葡萄牙语、印地语、西班牙语和泰语的 Q&A、摘要、生成、编码、分类、提取、翻译和 RAG 任务。
128k
0.71
llama-3-2-90b-vision-instruct
Meta
支持图像字幕、包括手写在内的图像到文本转录 (OCR)、数据提取和处理、上下文问答和对象识别。
128k
2.00
llama-3-2-11b-vision-instruct
Meta
支持图像字幕、包括手写在内的图像到文本转录 (OCR)、数据提取和处理、上下文问答和对象识别。
128k
0.35
llama-guard-3-11b-vision
Meta
支持图像过滤、HAP 或 PII 检测和有害内容过滤。
128k
0.35
llama-3-2-1b-instruct
Meta
支持英语、德语、法语、意大利语、葡萄牙语、印地语、西班牙语和泰语的 Q&A、摘要、生成、编码、分类、提取、翻译和 RAG 任务。
128k
0.10
llama-3-2-3b-instruct
Meta
支持英语、德语、法语、意大利语、葡萄牙语、印地语、西班牙语和泰语的 Q&A、摘要、生成、编码、分类、提取、翻译和 RAG 任务。
128k
0.15
llama-3-405b-instruct
Meta
支持英语、德语、法语、意大利语、葡萄牙语、印地语、西班牙语和泰语的 Q&A、摘要、生成、编码、分类、提取、翻译和 RAG 任务。 |
128k
输入:5.00/输出:16.00
*所示价格仅供参考,可能会因国家或地区而异,不含任何适用税款和关税,并视当地产品供应情况而定。
mistral-medium-2505
Mistral AI
支持编码、图像字幕、图像到文本转录、函数调用、数据提取和处理、上下文问答和数学推理
128k
输入:3.00/输出:10.00
mistral-small-3-1-24b-instruct-2503
Mistral AI
支持图像字幕、图像到文本转录、函数调用、数据提取和处理、上下文问答和对象识别
128k
输入:0.10/输出:0.30
pixtral-12b
Mistral AI
支持图像字幕、包括手写在内的图像到文本转录 (OCR)、数据提取和处理、上下文问答和对象识别。
128k
0.35
mistral-large-2
Mistral AI
支持法语、德语、意大利语、西班牙语和英语的 Q&A、摘要、生成、编码、分类、提取、翻译和 RAG 任务。
128k*
输入:3.00/输出:10.00
*所示价格仅供参考,可能会因国家或地区而异,不含任何适用税款和关税,并视当地产品供应情况而定。
allam-1-13b-instruct
SDAIA
支持阿拉伯语的问答、汇总、分类、生成、提取、RAG 和翻译任务。
4096
1.80
jais-13b-chat(阿拉伯语)
core42
支持阿拉伯语的 Q&A、摘要、分类、生成、提取和翻译任务。
2048
1.80
flan-t5-xl-3b
支持 Q&A、摘要、分类、生成、提取和 RAG 任务。可用于提示微调。
4096
0.60
flan-t5-xxl-11b
支持 Q&A、摘要、分类、生成、提取和 RAG 任务。
4096
1.80
flan-ul2-20b
支持 Q&A、摘要、分类、生成、提取和 RAG 任务。
4096
5.00
elyza-japanese-llama-2-7b-instruct
ELYZA
支持 Q&A、摘要、RAG、分类、生成、提取和翻译任务。
4096
1.80
*所示价格仅供参考,可能会因国家或地区而异,不含任何适用税款和关税,并视当地产品供应情况而定。
使用 IBM 开发的开放源代码嵌入模型,部署在 IBM watsonx.ai 中,用于检索增强生成、语义搜索和文档比较任务。或选择第三方嵌入模型提供商。
granite-embedding-107m-multilingual
IBM
检索增强生成、语义搜索和文档比较任务。
512
0.10
granite-embedding-278m-multilingual
IBM
检索增强生成、语义搜索和文档比较任务。
512
0.10
slate-125m-english-rtrvr-v2
IBM
检索增强生成、语义搜索和文档比较任务。
512
0.10
slate-125m-english-rtrvr
IBM
检索增强生成、语义搜索和文档比较任务。
512
0.10
slate-30m-english-rtrvr-v2
IBM
检索增强生成、语义搜索和文档比较任务。
512
0.10
slate-30m-english-rtrvr
IBM
检索增强生成、语义搜索和文档比较任务。
512
0.10
*所示价格仅供参考,可能会因国家或地区而异,不含任何适用税款和关税,并视当地产品供应情况而定。
* 上下文长度受模型供应商支持,但平台实际上下文长度有限制。有关更多信息,请参阅 文档。
推理以资源单位计费。1 个资源单位等于 1,000 个词元。输入词元和输出词元采用相同费率。1,000 个词元通常相当于 750 个词语。
并非所有模型在所有地区都可售。请参阅我们的文档,了解详情。
上下文长度以词元表示。
IBM 可自行决定更改或撤销有关公司计划、方向和意图的声明,恕不另行通知。请参阅定价了解更多详细信息。除非软件定价中另有规定,否则所有特性、功能和潜在更新仅限 SaaS。IBM 不保证 SaaS 和软件具备相同的特性和功能。