Granite

面向企业打造的开放式、高性能、可信 AI 模型。

彩色渐变分层几何形状插画
IBM Granite 4.0:新一代 Granite 模型
借助专为企业级可扩展 AI 应用设计的高效模型,降低成本并提升工作负载处理效率。
了解更多

了解 Granite

依托针对企业工作负载、成本效益与灵活部署优化的可定制开源模型,更快构建并扩展 AI 能力。

开放
Apache 2.0 下的开源 Granite 可确保透明度,同时在任何基础设施中实现完全的可定制性和部署灵活性。
性能良好
这一小模型系列性能出众,专为提升企业核心任务的处理效率与扩展能力而打造。
可信
通过实现训练数据和流程的透明化,设置损害检测功能和内置护栏,消除“黑匣”AI 的风险。

Granite 4.0 全新发布

模型概览

Granite 4.0 Nano
适用于计算与网络资源受限场景的轻量级本地及边缘 AI 任务
Granite 4.0 Micro & Tiny
适用于大批量低复杂性任务,优先保障速度、成本与运行效率
Granite 4.0 Small
无需投入顶级模型成本,即可满足高性能需求的企业工作流

统计数据

70%+
内存需求降低
2X
推理速度提升
Granite-Docling:用于文档转换的超紧凑模型
IBM Granite-Docling 是一款开源高效模型,可将文档转换为机器可读格式,且完整保留原有排版。
了解更多

Granite 系列小模型

小语言模型 (SLM)

具备推理能力的核心语言模型,针对 RAG 与智能体工作流进行了优化。

嵌入

可为语义搜索、RAG 与上下文多轮信息检索生成高质量文本嵌入向量的模型。

文档转换

超紧凑视觉语言模型,可将文档转换为结构化机器可读格式,保留排版、表格与公式。

愿景

面向文档与图像理解的高效视觉语言模型,支持 OCR、图表分析与企业内容提取。

语音

轻量级语音语言模型,支持 7 种语言的转录与翻译,兼顾高准确率与高效率。

时间序列

轻量级预训练模型,可快速精准完成时间序列预测,适配各类硬件环境的高效部署。

护栏

护栏模型可检测幻觉、偏见、有害内容与恶意提示规避行为,保障企业 AI 在各工作流中安全部署。

地理空间

NASA-IBM 模型用于地球观测,可基于大规模卫星数据预测生物量、气候、地表温度与洪水。

性能和效率

Granite 4.0 以高效为设计核心,占用内存更少,推理速度更快,性能表现更出众。这种均衡性可助力企业降低成本,在核心工作负载中更快实现方案扩展。

Granite 4.0 内存需求饼图

Granite 4.0 系列模型以“低耗高效”为设计理念。其内存占用大幅降低,较同类模型减少 70% 以上,组织可在高性价比硬件上运行高性能 AI。这意味着更低的基础设施成本、更优的运行性能,以及更便捷的企业级 AI 扩展能力。

Granite 4.0 吞吐量折线图

工作负载扩容时,Granite 4.0 可保持稳定高吞吐量,轻松处理大批量任务,而同类模型会出现性能下降。这保障企业可同时为海量用户服务、处理复杂任务,让应用程序保持稳定性能。

Granite 4.0 总体性能散点图

相较于竞品模型,Granite 4.0 即便模型体积更小,也能实现更高准确率,且内存需求更低。这种高效性可转化为成本节约,提升模型易用性,让企业 AI 的部署更广泛、更灵活。

Granite 4.0 RAG 评分
在 RAG 任务中,Granite 4.0 的表现优于同体积及更大体积的开源模型。Granite 无需额外基础设施即可实现高准确率,助力企业构建更可靠的知识驱动型应用程序,同时保障部署高效且经济。
Granite 4.0 IFEval 排行榜条形图

Granite 4.0 在开源模型中拥有业界领先的指令遵循性能,这是智能体工作流的核心能力。Granite 兼顾高准确率与小体积优势,以更低的基础设施成本,为企业复杂任务输出高质量结果。

Granite 4.0 内存需求饼图

Granite 4.0 系列模型以“低耗高效”为设计理念。其内存占用大幅降低,较同类模型减少 70% 以上,组织可在高性价比硬件上运行高性能 AI。这意味着更低的基础设施成本、更优的运行性能,以及更便捷的企业级 AI 扩展能力。

Granite 4.0 吞吐量折线图

工作负载扩容时,Granite 4.0 可保持稳定高吞吐量,轻松处理大批量任务,而同类模型会出现性能下降。这保障企业可同时为海量用户服务、处理复杂任务,让应用程序保持稳定性能。

Granite 4.0 总体性能散点图

相较于竞品模型,Granite 4.0 即便模型体积更小,也能实现更高准确率,且内存需求更低。这种高效性可转化为成本节约,提升模型易用性,让企业 AI 的部署更广泛、更灵活。

Granite 4.0 RAG 评分
在 RAG 任务中,Granite 4.0 的表现优于同体积及更大体积的开源模型。Granite 无需额外基础设施即可实现高准确率,助力企业构建更可靠的知识驱动型应用程序,同时保障部署高效且经济。
Granite 4.0 IFEval 排行榜条形图

Granite 4.0 在开源模型中拥有业界领先的指令遵循性能,这是智能体工作流的核心能力。Granite 兼顾高准确率与小体积优势,以更低的基础设施成本,为企业复杂任务输出高质量结果。

面向开发人员的 Granite 模型

开发方案:文档摘要生成

基于 IBM Granite 构建文档摘要工具,处理超出上下文窗口限制的文档。

基于 Langchain 的 RAG 方案

基于 Granite 构建 RAG 流水线,依托外部知识库响应查询。

开发方案:多模态 RAG

基于 Granite 与 Docling 构建多模态 RAG 管道,支持文本、表格与图像查询。

指南:开源模型

了解开源大语言模型如何实现自主化、降低成本,并辅助开发人员完成评估、调优与部署。

教程:时间序列预测

使用 Granite 时间序列模型完成零样本与微调式时间序列预测。

教程:语音翻译

基于 Granite 与 watsonx.ai®,通过自动语音识别 (ASR) 生成播客文字稿。

教程:本地 AI 辅助工具

基于 IBM Granite Code、Ollama 与 Continue 构建本地 AI 辅助工具。

查看完整的 Granite 指南

查看完整的 Granite 指南

使用 Granite 构建

Granite 模型为众多 IBM 产品与服务提供底层 AI 能力支撑。了解代码生成、应用程序开发与模型测试的一站式解决方案。全部能力由 IBM Granite 提供支持。

实时掌控 AI 资讯

博客 | Granite 3.2:全新推理和多模态能力

最新的 Granite 模型引入了新的推理功能、支持视觉的模型以及更高的效率,从而能以更低的成本提供富有竞争力的成果

播客 | DeepSeek 的事实与炒作、模型蒸馏与开源竞争

在《混合专家》第 40 集中,嘉宾组澄清了有关 DeepSeek R1 的误解,解释了模型蒸馏,并剖析了开源竞争态势。

AI Think 时事通讯 | 获取 AI 洞察分析

将精选的 AI 主题、趋势和研究直接发送到您的收件箱。

文章 |DeepSeek 的 AI 展示了小模型的威力

据该公司介绍,DeepSeek-R1 是一款数字助理,在某些涉及数学和编码任务的 AI 基准测试中,其表现可与 OpenAI 的 o1 相媲美,但训练时所采用的芯片数量却远远少于后者,且使用成本大约降低了 96%。

IBM 相信,AI 模型的创建、部署和运用能够负责任地推进整个企业的创新。IBM watsonx AI 和数据平台具有构建和测试基础模型以及生成式 AI 的端到端流程。针对 IBM 开发的模型,我们会在模型训练之前搜索并删除重复项,并使用 URL 拦截列表技术、不良内容和文档质量过滤器、句子分割和标记化技术。

在数据训练过程中,我们力求防止模型输出失准,并使用监督微调来改善指令跟踪,以便借助提示工程将模型用于企业任务。我们将继续朝着多个方向开发 Granite 模型,包括其他模态、特定行业内容和更多用于训练的数据注释,同时还将为 IBM 开发的模型部署定期、持续的数据保护措施。

鉴于生成式 AI 技术的日新月异,我们端到端的流程有望不断发展和完善。作为 IBM 在其基础模型开发和测试中投入的严谨性证明,IBM 为其开发的模型提供标准的合同知识产权赔偿,类似于为 IBM 硬件和软件产品提供的赔偿。

与其他一些大型语言模型提供商不同,IBM 不要求客户因使用 IBM 开发的模型而赔偿 IBM,这是 IBM 的标准赔偿惯例。此外,IBM 对自身开发的模型未设置赔偿责任上限,这也符合 IBM 的一贯赔偿义务做法。

受上述保护的 watsonx 模型目前包括:

(1) Slate 系列纯编码器模型。

(2) Granite 系列纯解码器模型。

了解有关 Granite 模型许可的更多信息

* 规模较小的行业定制 AI 模型如何提供更大的优点 
https://www.ft.com/partnercontent/ibm/how-smaller-industry-tailored-ai-models-can-offer-greater-benefits.html

1 IBM Research 将 Granite 模型与领先开放式模型在各项学术和企业基准测试中的性能表现进行比较 - https://ibm.com/new/ibm-granite-3-0-open-state-of-the-art-enterprise-models