IBM® watsonx 模型专为企业设计,并针对目标业务领域和用例进行了优化。通过 AI 开发平台 IBM® watsonx.ai,我们可提供一系列由 IBM 开发、具有成本效益的企业级基础模型、开源模型和来自第三方提供商的模型,以帮助客户和合作伙伴以最小的风险更快地扩展和实施人工智能 (AI)。您可以在工作负载所处的任何位置(本地和混合云)部署 AI 模型。
IBM 采用差异化方法来提供企业级基础模型:
IBM watsonx 基础模型库为您提供丰富的选项和灵活性,让您从专有、开源和第三方模型库中选择最适合您的业务需求、区域利益和风险状况的模型。
IBM Granite 是基于仅解码器的转换器架构的大型语言基础模型旗舰系列。Granite 语言模型经过互联网、学术、代码、法律和金融等领域的可信企业数据训练而成。
此类模型在内容生成、摘要、分类、洞察提取和检索增强生成 (RAG) 等常见用例中始终如一地提供改进性能。
IBM Granite 经过企业相关内容的训练,符合 IBM AI 道德准则以及首席隐私办公室定义和执行的严格数据治理、监管和风险标准。
通过聊天微调和模型对齐技术,实现了财务等目标企业业务领域和 RAG 等用例的准确性提升。
一款极具价格竞争力的模型,基础设施的要求较低,提供 IP 补偿和易于使用的工具包,用于模型定制和应用集成。
granite-13b-chat
IBM
支持问题解答 (Q&A)、摘要、分类、生成、提取和 RAG 任务。
8192
0.0006
granite-13b-instruct
IBM
支持 Q&A、摘要、分类、生成、提取和 RAG 任务。
8192
0.0006
granite-20b-multilingual
IBM
支持法语、德语、葡萄牙语、西班牙语和英语的常见问题解答、摘要、分类、生成、提取、翻译和 RAG 任务。
8190
0.0006
llama-2-70b-chat
Meta
支持 Q&A、摘要、分类、生成、提取和 RAG 任务。
4096
0.0018
llama-2-13b-chat
Meta
支持问答、摘要、分类、生成、提取和 RAG 任务。可用于提示微调。
4096
0.0006
codellama-34b-instruct
Meta
通过自然语言提示生成和翻译代码,为代码创建任务专用模型。
4096
0.0018
mixtral-8x7b-instruct
Mistral AI
支持 Q&A、摘要、分类、生成、提取、RAG 和代码生成任务。
32768
0.0006
granite-8b-japanese
IBM
支持日语 Q&A、摘要、分类、生成、提取、翻译和 RAG 任务。
4096
0.0006
flan-t5-xl-3b
支持 Q&A、摘要、分类、生成、提取和 RAG 任务。可用于提示微调。
4096
0.0006
flan-t5-xxl-11b
支持 Q&A、摘要、分类、生成、提取和 RAG 任务。
4096
0.0018
flan-ul2-20b
支持 Q&A、摘要、分类、生成、提取和 RAG 任务。
4096
0.005
elyza-japanese-llama-2-7b-instruct
ELYZA
支持 Q&A、摘要、RAG、分类、生成、提取和翻译任务。
4096
0.0018
mt0-xxl-13b
BigScience
支持 Q&A、摘要、分类和生成任务。
4096
0.0018
企业非常期待将来可以利用自己的数据,集中运用基础模型和 ML 来加快运行生成式 AI 工作负载。
IBM 相信,AI 模型的创建、部署和运用能够负责任地推进整个企业的创新。IBM watsonx AI 和数据平台具有构建和测试基础模型以及生成式 AI 的端到端流程。针对 IBM 开发的模型,我们会在模型训练之前搜索并删除重复项,并使用 URL 拦截列表技术、反感内容过滤和文件质量过滤以及语句拆分和标记技术。
在数据训练过程中,我们力求防止模型输出失准,并使用监督微调来改善指令跟踪,以便借助提示工程将模型用于企业任务。我们将继续朝着多个方向开发 Granite 模型,包括其他模态、行业专用内容和用于训练的数据注释,同时部署定期、持续的数据保护措施。
鉴于生成式 AI 技术的快速变化,我们的端到端流程需要不断发展和改进。作为 IBM 在其基础模型开发和测试中投入的严谨性证明,IBM 为其开发的模型提供标准的合同知识产权赔偿,类似于为 IBM 硬件和软件产品提供的赔偿。
与其他一些大型语言模型提供商不同,IBM 不要求客户因使用 IBM 开发的模型而赔偿 IBM,这是 IBM 的标准赔偿惯例。此外,IBM 对自身开发的模型未设置赔偿责任上限,这也符合 IBM 的一贯赔偿义务做法。
受上述保护的 watsonx 模型目前包括:
(1) Slate 系列纯编码器模型。
(2) Granite 系列纯解码器模型。
推理价格基于每 1,000 个词元(1 个资源单位)。输入词元和输出词元采用相同费率。1,000 个词元通常相当于 750 个词语。
并非所有模型在所有地区都可售,请参阅我们的文档,了解详情。
上下文长度以词元表示。
IBM 可自行决定更改或撤销有关公司计划、方向和意图的声明,恕不另行通知。请参阅定价了解更多详细信息。除非软件定价中另有规定,否则所有特性、功能和潜在更新仅限 SaaS。IBM 不保证 SaaS 和软件具备相同的特性和功能。