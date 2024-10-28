随着科技公司向人工智能领域投入数十亿美元，一种反直觉的战略正受到越来越多的关注：即开放代码。向开源 AI 模型的转变，反映出业界在亟需控制研发成本的同时加速突破的压力日益增长，在一个人才与算力均代价高昂的领域，这尤为关键。
随着 IBM、Meta 和 Mistral AI 等公司采用开源开发，向开发人员和研究人员免费提供复杂的 AI 技术，AI 态势正在发生变化。虽然这种方法可以通过合作实现技术民主化和加速突破，但批评人士警告说，这可能会让不法分子滥用或修改技术以达到有害目的。
支持者表示，开源 AI 开发使全球的研究人员和开发者能够检查、修改和改进这项技术。这种协作方法已经在模型效率方面取得了重大进步。例如，IBM 的全新 Granite 3.0 AI 模型仅需系统一小部分的计算资源，即可实现与更大系统相当的性能。
IBM 正在根据 Apache 2.0 许可以开源软件的形式发布其Granite 3.0 模型，这与那些将 AI 系统保持私有的开发者形成了显著差异。该公司使用 GitHub Code Clean 和 StarCoder 等公共数据集构建模型，从而避免了版权问题，版权问题曾引发对使用受保护内容进行 AI 训练的公司提起诉讼，例如 News Corp 目前起诉 Perplexity 的案件。
该版本包含专注于检索增强生成和分类等企业任务的 8B 和 2B 语言模型，以及用于指令遵循和安全监控的专用变体。这些模型支持 116 种编程语言，使用 3-4 TB 的词元进行训练，可通过 Hugging Face、GitHub 和 IBM® watsonx.ai 等多个平台获取。这些模型有 30 亿至 340 亿个参数，可用于研究和商业应用，且不受名义上“开源”版本的限制。
“拥有这种多元化的思维，并为这个开放的生态系统做出贡献，这比将我们的模型封闭在一个盒子里更令人兴奋，”IBM Research 数据和模型工厂项目总监 Kate Soule 表示。“我们希望社区能够使用。”
开源趋势在欧洲也势头强劲，Mistral AI 已成为行业领导者。这家总部位于巴黎的初创公司发布了功能日益强大的模型，供开发人员自由下载和修改。
开源战略形成了双向交流：公司共享的是只有资金雄厚才能构建的 AI 模型，同时从数千名开发者那里获得洞察，探索该技术的新用途。许多人认为，现在限制访问意味着错失这种集体创新。
“想象一下，对您的模型架构进行一些小的、新颖的调整，即使其他所有内容不变，也能显著提高整体性能，”IBM Think 的高级作家 Dave Bergmann 表示。“如果将自己的模型作为唯一的开放权重发布，并拒绝透露其架构的信息和代码，您可能永远也不会意识到其中蕴藏着的机会。但如果有 2 万人深入研究您的模型代码，就会有人洞察到它。”
Meta 发布的 开源 Llama 模型是一个重要的转折点。这意味着，科技界规模最大的公司之一为研究人员和小型组织提供了他们无法独立开发的先进 AI 技术。
“我们从根本上认为，开源 AI 适合每个人，首先是开发人员可以采用这些模型，并在需要时进行微调、训练、提炼，并在任何需要的地方使用，”Meta 的 AI 合作伙伴工程高级总监 Amit Sangani 在最近的一次 AI 联盟聚会中说道。“AI 越开源，就越透明、越安全。它得到了广泛的审查，这是一件好事，因为发现问题后，包括 Meta 在内的人们都会进行修复。”
尽管开源 AI 技术具有优势，但也可能带来风险。一些观察人士表示，开源 AI 模型可能更容易被修改以达到有害目的，例如生成虚假信息或创建恶意软件。缺乏集中控制意味着，即使原始开发者遵守高道德标准，其模型的修改版本也可能不遵守道德标准。
尽管如此，像 Granite 3.0 这样的模型所展现出的效率提升表明，未来 AI 能力可能会更容易被资源有限的组织所利用。无力运行大规模语言模型的小型企业可以部署针对其特定需求量身定制的更小、更高效的开源替代模型。
“开源将推动更多地方开展更多创新，”AI 联盟社区总监 Dave Nielsen 说道。“这将让更多企业家和客户更有热情，并将创造更多收入。”
使用面向 AI 构建器的新一代企业级开发平台 IBM watsonx.ai，可以训练、验证、调整和部署生成式 AI、基础模型和机器学习功能。使用一小部分数据，即可在很短时间内构建 AI 应用程序。