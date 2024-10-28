IBM 正在根据 Apache 2.0 许可以开源软件的形式发布其Granite 3.0 模型，这与那些将 AI 系统保持私有的开发者形成了显著差异。该公司使用 GitHub Code Clean 和 StarCoder 等公共数据集构建模型，从而避免了版权问题，版权问题曾引发对使用受保护内容进行 AI 训练的公司提起诉讼，例如 News Corp 目前起诉 Perplexity 的案件。

该版本包含专注于检索增强生成和分类等企业任务的 8B 和 2B 语言模型，以及用于指令遵循和安全监控的专用变体。这些模型支持 116 种编程语言，使用 3-4 TB 的词元进行训练，可通过 Hugging Face、GitHub 和 IBM® watsonx.ai 等多个平台获取。这些模型有 30 亿至 340 亿个参数，可用于研究和商业应用，且不受名义上“开源”版本的限制。

“拥有这种多元化的思维，并为这个开放的生态系统做出贡献，这比将我们的模型封闭在一个盒子里更令人兴奋，”IBM Research 数据和模型工厂项目总监 Kate Soule 表示。“我们希望社区能够使用。”

开源趋势在欧洲也势头强劲，Mistral AI 已成为行业领导者。这家总部位于巴黎的初创公司发布了功能日益强大的模型，供开发人员自由下载和修改。

开源战略形成了双向交流：公司共享的是只有资金雄厚才能构建的 AI 模型，同时从数千名开发者那里获得洞察，探索该技术的新用途。许多人认为，现在限制访问意味着错失这种集体创新。

“想象一下，对您的模型架构进行一些小的、新颖的调整，即使其他所有内容不变，也能显著提高整体性能，”IBM Think 的高级作家 Dave Bergmann 表示。“如果将自己的模型作为唯一的开放权重发布，并拒绝透露其架构的信息和代码，您可能永远也不会意识到其中蕴藏着的机会。但如果有 2 万人深入研究您的模型代码，就会有人洞察到它。”