AI 军备竞赛不再只是价值数十亿美元巨头的专利。
在 AI 领域的讨论中，OpenAI、Google 和 Microsoft 等公司占据了头条新闻。然而，新一轮开源创新（以最近的 DeepSeek 模型为例）正在创造公平的竞争环境。该模型的成功凸显了一个日益明显的趋势：小型企业正在逐渐挑战 AI 领域的领先者。
“这强化了我们已经知道的事情，”IBM Research AI 模型副总裁 David D. Cox 说道，“我们认为，打造出色的模型并不需要数十亿美元的投入。DeepSeek 证明了开源方法正在迎头赶上——这是一件好事。”
AI 研究人员不断竞相打造更强大的模型，同时又不增加计算成本。随着对硬件限制和能耗的担忧日益加剧，提高效率的创新正变得与性能提升同等重要。
IBM CEO Arvind Krishna 在 LinkedIn 上写道：“长期以来，AI 竞赛一直是规模游戏，更大的模型意味着更好的结果。但没有任何物理定律规定 AI 模型必须庞大且昂贵。训练和推理的成本只是另一项需要解决的技术挑战。”
DeepSeek 在 AI 效率上的突破来自一项名为多头潜在注意力（MLA）的新技术。该方法改变了 AI 模型处理和存储信息的方式。关键改进在于 MLA 缩减了 KV 缓存的大小，而 KV 缓存对于 AI 系统高效运行至关重要。Cox 认为，这使 AI 系统使用更少内存，并更容易扩展规模。
Cox 指出：“他们在这方面做了非常出色的工作。减小 KV 缓存至关重要，因为它能让模型运行更快，消耗更少资源。”
在 DeepSeek 的幕后，这些突破实现了成倍增长。IBM Research 首席研究科学家 Prasanna Sattigeri 指出，公司这些创新关注的是效率和架构改进。
Sattigeri 表示：“他们优化了 GPU 之间的通信，而这通常是大规模 AI 训练的瓶颈。这使他们能够使用旧硬件高效训练，这是令人赞叹的工程壮举。”
但像任何目标远大的工程项目一样，这一次飞跃也是需要付出代价的。DeepSeek 还采用了强化学习（RL）技术，这种方法与 OpenAI 在 o1 推理扩展中使用的技术类似。该方法通过在多次迭代中强化成功的输出，不断优化模型的表现。不过，Cox 指出，DeepSeek 的具体实现也带来了权衡，例如函数调用能力较弱，以及在安全对齐方面存在隐忧。
他表示：“这确实是向前迈出的一大步，但仍存在一些不够成熟之处。该模型在推理任务上表现出色，但其他方面的能力有所牺牲。”
尽管技术进步让构建大型 AI 模型变得更加容易，但更大的挑战依然存在：为了保持竞争力所需的庞大算力。赖斯大学计算机科学副教授 Xia “Ben” Hu 承认，DeepSeek 是 AI 发展过程中更高效的一步。不过他也指出，这并未从根本上改变 AI 基础设施领域的整体力量格局——谁能获得海量算力，谁依然掌握主导权。
Hu 表示：“DeepSeek 得到了中国一家大型风险投资基金的支持，并且能够使用数以万计的 GPU。这对许多小型初创公司来说，仍然是一道难以跨越的门槛。”
不过，Hu 认为，最显著的变化可能将出现在企业级 AI 的应用层面。他说：“例如石油天然气和制造业等传统行业在开发自有 AI 解决方案方面一直较为谨慎。随着成本下降、开源模型不断成熟，那些曾经依赖外部 AI 服务的企业，如今开始考虑打造符合自身需求的内部模型。”
其影响并不局限于某一个模型。随着开源 AI 项目不断涌现，小型初创公司如今也能获取过去只有依赖庞大数据中心和巨额预算才能使用的工具。Cox 指出，OpenAI 及其同行长期营造出一种“必然性”的氛围——仿佛只有资金雄厚者才能在 AI 领域占据领先地位。但随着 DeepSeek 以及其他模型的出现，这一观念正开始出现裂痕。
Cox 表示：“我们正在看到一种变化，参与竞争的主体范围正在大幅扩大。并不是说只要有 500 万美元就能一夜之间打造出顶级模型。但对于资金充足的初创公司和中型企业来说呢？答案是：完全有可能。”
研究人员也开始将重点放在效率上，而非单纯依赖原始算力。Cox 及其研究团队重点研究了“混合专家模型”（Mixture of Experts）方法，使 AI 能够更有选择性地使用计算资源。
他表示：“混合专家模型只是拼图中的一块，未来还会有更多突破。”这也意味着，AI 的未来可能不再那么依赖先进芯片的获取，而更多取决于如何更聪明地利用现有硬件。
Sattigeri 强调了其中一项创新——合成数据的兴起，即通过人工方式生成、用于模拟真实世界的数据。他说：“通过 DeepSeek 这样的模型，我们正在看到一种趋势，即更多使用 AI 生成的合成数据，以更高效地优化和训练模型。这有望大幅降低成本，让更多参与者能够获得高质量的 AI。”
AI 开发门槛的不断降低，也引发了关于未来竞争格局的新问题。未来究竟是基础设施与算力决定胜负，还是快速创新能力成为最核心的资产？Cox 认为，这是两者共同作用的结果。
他说：“你依然需要强大的基础设施，也依然需要顶尖人才，但 OpenAI 和 Google 所拥有的护城河，并没有他们希望人们相信的那么深。在这个领域，秘密很难长期保密。想法会传播，人才会流动。我们正在看到快速的收敛与趋同。”
Hu 补充说，AI 的发展仍然依赖四个关键要素：“我将其称为 ABCD 模型——算法（Algorithms）、大数据（Big Data）、算力（Compute）和分发（Distribution）。最顶尖的 AI 公司具备这四项能力。DeepSeek 正在前两项上取得突破，但在算力和分发层面，头部厂商仍然占据明显优势。”
随着更高效技术的出现，AI 公司的数量不断增长，这不仅关乎竞争，还可能引发一场创造力的革命。Cox 表示，如果更多公司能够在不依赖数十亿美元预算的情况下开发 AI，创新将由多元视角推动，而不再被少数企业的议程所主导。这将带来更多量身定制的 AI 解决方案和更专业化的模型，同时也孕育出一个更加活跃的市场。
“创新将以更快、更安全、更包容的方式发生，”Cox 说。“如果我们能超越由少数参与者设定规则的单一文化，我们将看到各种不同方法的蓬勃发展。”
Cox 指出，对于坚定投入开源 AI 的 IBM 而言，DeepSeek 的崛起验证了其战略方向。他说：“这对我们来说其实是一件好事。这证明了开放模型是可行的，而且确实存在市场需求。参与者越多，所有人从中获得的价值也就越大。”
Hu 指出，虽然小型公司正在取得进展，但大型参与者也在适应。“亚马逊、Meta 和微软不会坐视开源技术侵蚀他们的业务，”他表示。“他们正在努力研究如何整合开源模型，同时保持对基础设施和数据的控制。”
接下来会发生什么？Cox 和其他专家表示，AI 的发展并不会演变成无序混战，但小型企业显然已经不再完全受制于科技巨头。开源工具正在加速技术演进，而真正受益最大的，将是那些积极拥抱这一转变的公司。
Cox 表示：“这是一个持续发展的趋势。它并非始于 DeepSeek，也不会止步于此。但它确实让一些人清醒过来了。”
