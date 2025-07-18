当 DeepSeek-R1 于 1 月 20 日发布时，这款强大而高性价比的 AI 推理模型轰动了硅谷和华尔街。原因何在？它的推理能力可与 OpenAI、Anthropic 等公司的顶级模型媲美，但据报道其消耗的计算资源少得多，训练和使用成本也仅为前者一小部分。仅上个月，该模型在 Hugging Face 上的下载量就超过 80 万次。
“这记警钟敲响了，”帕洛阿尔托投资公司 AMINO Capital 的创始管理合伙人 Larry Li 最近在接受 IBM Think 采访时回忆道。他说，新技术常被“逆向工程”。“但没人预料到它能做得如此出色。”
Cathay Innovation 旗下 C.Lab 负责人 Matthieu Soulé 表示：“这正在打破‘美国作为全球唯一创新之地’的说法。”Cathay Innovation 是一家投资于欧盟及亚洲（包括中国）AI 创新的基金。
许多人预测，DeepSeek 的成功将从更广泛的层面彻底改变行业格局及全球 AI 竞争格局。六个月后，我们想要确认：这究竟是否真的发生了？
我们采访了 DeepSeek-R1 发布后几个小时曾接受采访的部分专家，以及其他几位专家，以获得全面的观点。
DeepSeek-R1 发布后的几天里，许多人担心该公司是否准确统计并报告了全部成本——不仅是接近完成的模型训练成本——以及使用了哪些公司的哪些组件。换言之，他们是否真正实现了革命性突破，还是仅做出了渐进式改进？
IBM 首席研究科学家 Kaoutar El Maghraoui 等人认为，真正的创新或许在于她所称的“架构效率”，即结合多种技术，包括“专家混合、强化学习策略、软硬件协同设计及其他优化技巧”。“这主要是对现有技术的一种巧妙且高效的实现，”她在最近接受 IBM Think 采访时表示。
尽管如此，各界专家一致认为，DeepSeek-R1 在几个关键方面改变了全球 AI 生态格局。首先，许多人理所当然地认为，美国 AI 公司拥有几乎无法追赶的“护城河”或领先优势。DeepSeek 打破了这一假设，它降低了开发者和小型公司获取工具以开发自身 LLM 的门槛。
IBM 高级技术产品经理 Abraham Daniels 在采访中表示：“开发人员和用户现在仅需投入极少成本，就能获得与 OpenAI o1 相当的能力。“
DeepSeek 开源其模型的事实，在提升技术可及性方面发挥了重要作用。“自 DeepSeek 加入并贡献于 AI 联盟以来，我们看到对开源的兴趣有所增加，”IBM 及 AI 联盟的 AI 开放战略总监 Anthony Annunziata 表示。AI 联盟是一个由 IBM 和 Meta 发起创立的国际性企业与组织网络，致力于创建开放且安全的 AI。
Annunziata 表示：“在欧洲、越南、印度和日本，众多地区性 AI 公司希望保持对 AI 的自主掌控——他们能够按照自身的文化、社会及经济需求塑造 AI，这些需求与美国及其他地区有所不同。”
保护本土 AI 研究成果被视为首要任务。El Maghroui 表示：“各国政府正在积极推动数字主权，努力寻找避免外国 AI 影响的途径。”
基于本地语言创建 LLM 激励着众多创业者。“AI 正朝着这个方向发展：作为一种公用设施，每个国家或地区都希望拥有自己的语言模型，至少能在影响 AI 行为方面拥有话语权，”Li 说。
例如，日本近期颁布了《AI 促进法》，旨在显著推动该技术的发展与应用。6月下旬，AI 联盟在日本启动了新的篇章，重点聚焦当地企业家高度关注的两个领域：AI 主权与制造业中的 AI 应用。语言在掌控 AI 系统中发挥关键作用，例如，2024 年末，来自学术界与产业界的 1,500 多位研究者联合开发了强大且开放的日语模型。
许多本土 AI 模型及企业家同样将当地经济利益置于优先地位。以日本为例，加入 AI 联盟的众多公司，包括三菱电机与松下，正在开发面向制造业和工业应用的 AI 模型，这一领域在日本经济中占比尤为重要。
另一方面，日本软硬件公司 Preferred Networks 首席技术官兼联合创始人冈原大辅表示，本地模型的需求也在不断增长。该公司利用深度学习与 AI 开发先进软件。5 月，Preferred Networks 发布了第二版 PLaMo，这是一款可本地运行的紧凑型模型，并采用日语与英语进行训练。
冈原大辅在接受 IBM Think 采访时表示：“虽然整体性能不及前沿模型，但在特定任务上表现尤为出色。在小型模型的应用场景中——例如参数规模在 80 亿至 300 亿之间的模型——它在多个日语任务上优于 CLANG、GPT-4o mini 及其他同类模型。”
越南也掀起了一股创业型 LLM 活动热潮，AI 联盟今年 6 月在当地成立了分支机构。Annunziata 表示，除了开发越南语模型外，当地企业家还致力于利用 AI 模型研发新型芯片，为 AI 系统提供算力支持。
DeepSeek 激励如此多当地企业家的另一个原因，是多个国家出于安全和隐私考虑，对 DeepSeek-R1 实施了禁用或限制。意大利、澳大利亚、韩国和加拿大全面禁止了 DeepSeek，而美国若干州，尤其是政府网站，也对其使用施加了限制。这一举措产生了有趣的连锁效应：激励本地创业者利用开源工具，打造更安全的模型，以适应各自特定的地域需求。
科技企业家兼风险投资人 Kai-Fu Lee 最新的科技公司 01.AI，希望开拓企业 AI 的 B2B 市场——这个领域在中国是出了名的难做，因为其中半数为国有企业，而规模较大的私营企业在发展过程中也可能受到政府影响。Lee 此前曾创立 Rhymes AI，该公司于去年秋季发布了包括 搜索引擎 和开源视频生成模型 Allegro 在内的多款产品。
01.AI 联合创始人 Anita Huang 在接受 IBM Think 采访时表示：“我们采取务实的态度来看这些模型：它们确实足够优秀，但对于许多企业来说，使用起来仍不容易，这正是我们致力解决的问题。我们认为，尤其是针对中国企业市场，缺失的环节在于中间件层，它将成为与大型语言模型交互的窗口。”目前，他们的企业平台采用了 DeepSeek 与阿里巴巴 Qwen 等模型。
在 DeepSeek 发布后，许多人预测，它将为链式推理成为主流铺平道路。然而，自那时起，行业格局已悄然发生变化。新研究显示，推理模型在成本与资源消耗上非常高昂，而在许多实际任务中，并非必需。
或许被过度炒作的最大领域，是企业对 DeepSeek 的采用，毕竟其授权成本极低（通过宽松的 MIT 许可获得）。
El Maghraoui 表示：“实际上，企业采用率仍非常有限，这主要是因为缺乏数据隐私保障、合规性、治理及安全机制。”
至少在美国，大多数公司仍选择与提供托管或可审计解决方案的供应商合作。
Annunziata 指出，虽然“人们意识到创新可能来自意想不到的地方”值得肯定，但整个 AI 行业及更广泛市场并未如部分预测般发生显著变化。相反，她说，“开源公司在开源领域持续加码，而大型专有企业则集中于吸引人才，更进一步收购或削弱竞争对手，并在模型研发上投入越来越多资金。”
Daniels 表示，归根结底，DeepSeek 的最大贡献或许在于它证明了小型、针对性模型的价值。
他表示：“DeepSeek 开启了 AI 竞赛，并将小型语言模型推向了新的竞争前沿。高性能的小型语言模型训练效率高于大型模型，并能更好地满足企业应用场景。”
AI 代理——可自主推理、规划和执行任务的 AI 系统——在 2025 年于企业中实现爆炸式增长，这便是一个典型用例。较小的模型更适合代理式 AI 系统，因为它们效率更高、资源消耗更低，且能够针对特定任务进行定制。
正如 IBM 杰出工程师 Chris Hay 在最近一集《Mixture of Experts》中所言：“运行代理时，你希望模型小巧、快速且高效。”
