选择合适的模型,参数从数亿到 340 亿,采用 Apache 2.0 开源许可。
不要为了降低成本而牺牲性能。在各种企业任务中,Granite 的表现均优于同类模型1。
构建具有全面的风险和危害检测功能、透明度和知识产权保护的负责任 AI。
为代理式工作流程、RAG、文本摘要、文本分析和提取、分类以及内容生成而设计的基础模型和指令微调语言模型,同时附带新的推理功能。
预训练模型专门用于文档和图像理解的视觉任务,支持一系列文件类型和分辨率,并旨在企业环境中进行高效部署。
专为代码生成任务(包括代码生成、代码解释和代码编辑)设计的纯解码器模型,使用了以 116 种编程语言编写的代码进行训练。
用于时间序列预测的轻量化预训练模型,可在一系列硬件配置上高效运行。
利用 Granite Guardian 保护 AI,确保企业数据安全并缓解多种用户提示和 LLM 回复的风险,并在 15 项以上安全基准测试中表现出一流性能。
NASA 和 IBM 联手利用大规模卫星和遥感数据,创建了地球观测 AI 基础模型。
旨在极大地提高对用户意图的理解,并在响应查询时提高信息和信息源的相关性。
将推理功能应用于 Granite 后,复杂指令遵循能力得到显著提高,同时依然具备常规的性能与安全特性,而同类模型在这些领域则表现不佳
Granite-3.2-8B-Instruct
DeepSeek-R1-Distill-Llama-8B
DeepSeek-R1-Distill-Qwen-7B
ArenaHard
55.23
17.17 |
10.36
Alpaca-Eval-2
61.16
21.85
15.35
IFEval
73.57
66.50
59.10
MMLU |
66.93
45.80
50.72
PopQA |
28.08
13.25
9.94
TruthfulQA |
66.37
47.43
47.14
BigBenchHard
65.60
65.71
65.04
DROP
50.73
44.46
42.76
GSM8K
83.09
72.18
78.47
HumanEval
89.47
67.54
79.89
HumanEval+
86.88
62.91
78.43
AttaQ
85.99
42.87
42.45
*所示价格仅供参考,可能会因国家或地区而异,不含任何适用税款和关税,并视当地产品供应情况而定。
“在 CrushBank,我们亲眼目睹了 IBM 的开放式高效 AI 模型如何为企业 AI 带来真正的价值—同时,它还在性能、成本效益和可扩展性之间实现了适度平衡。Granite 3.2 凭借新的推理功能实现了进一步飞跃,而我们也很高兴能在构建新的代理式解决方案时深入了解这些功能。”
David Tan
首席技术官
CrushBank
使用 IBM Docling 和开源 Granite 3.1 对各种文件类型执行文档视觉问答
了解如何构建回答问题的 AI 代理
在本教程中,您将使用现已在 watsonx.ai 上提供的 IBM Granite-3.0-8B-Instruct 来执行自定义函数调用。
以几种不同的方式量化预训练模型,以显示模型的大小并比较它们执行任务时的表现
使用 TinyTimeMixer (TTM) Granite 模型,通过学习预测未来
将文本转换为结构化表示形式,并生成语义正确的 SQL 查询
使用包含正面和负面客户评论的合成数据集,以 Python 对 Granite 模型进行提示微调。
查看完整的 Granite 指南
利用 Red Hat Enterprise Linux AI 和 watsonx 在生产环节通过开源 Granite 模型自信地大规模部署 AI。利用工具调用、12 种语言、思维链推理和多模态适配器等功能,更快地进行构建
最新的 Granite 模型引入了新的推理功能、支持视觉的模型以及更高的效率,从而能以更低的成本提供富有竞争力的成果
在《混合专家》第 40 集中,嘉宾组澄清了有关 DeepSeek R1 的误解,解释了模型蒸馏,并剖析了开源竞争态势。
将精选的 AI 主题、趋势和研究直接发送到您的收件箱。
据该公司介绍,DeepSeek-R1 是一款数字助理,在某些涉及数学和编码任务的 AI 基准测试中,其表现可与 OpenAI 的 o1 相媲美,但训练时所采用的芯片数量却远远少于后者,且使用成本大约降低了 96%。
IBM 相信,AI 模型的创建、部署和运用能够负责任地推进整个企业的创新。IBM watsonx AI 和数据平台具有构建和测试基础模型以及生成式 AI 的端到端流程。针对 IBM 开发的模型,我们会在模型训练之前搜索并删除重复项,并使用 URL 拦截列表技术、不良内容和文档质量过滤器、句子分割和标记化技术。
在数据训练过程中,我们力求防止模型输出失准,并使用监督微调来改善指令跟踪,以便借助提示工程将模型用于企业任务。我们将继续朝着多个方向开发 Granite 模型,包括其他模态、特定行业内容和更多用于训练的数据注释,同时还将为 IBM 开发的模型部署定期、持续的数据保护措施。
鉴于生成式 AI 技术的日新月异,我们端到端的流程有望不断发展和完善。作为 IBM 在其基础模型开发和测试中投入的严谨性证明,IBM 为其开发的模型提供标准的合同知识产权赔偿,类似于为 IBM 硬件和软件产品提供的赔偿。
与其他一些大型语言模型提供商不同,IBM 不要求客户因使用 IBM 开发的模型而赔偿 IBM,这是 IBM 的标准赔偿惯例。此外,IBM 对自身开发的模型未设置赔偿责任上限,这也符合 IBM 的一贯赔偿义务做法。
受上述保护的 watsonx 模型目前包括:
(1) Slate 系列纯编码器模型。
(2) Granite 系列纯解码器模型。
* 规模较小的行业定制 AI 模型如何提供更大的优点
https://www.ft.com/partnercontent/ibm/how-smaller-industry-tailored-ai-models-can-offer-greater-benefits.html
1 IBM Research 将 Granite 模型与领先开放式模型在各项学术和企业基准测试中的性能表现进行比较 - https://ibm.com/new/ibm-granite-3-0-open-state-of-the-art-enterprise-models