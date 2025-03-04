如果你留意 2025 年 1 月 20 日的头条新闻，可能会觉得天要塌了。这是因为中国公司 DeepSeek 发布了其 R1 大语言模型 (LLM)，该模型在发布后不久迅速成为下载量和活跃度最高的模型之一。

引发这场轰动的关键在于，这家以自身名义发布模型的杭州人工智能实验室，仅以 560 万美元的极低成本和远少于美国领先模型的算力资源与英伟达芯片，便成功构建出这一模型。

不出所料，人们开始公开担忧那些重金投入的美国人工智能企业即将落后。由于 DeepSeek 使用的英伟达芯片少于其他公司，该公司的股价应声下跌。但这更多是市场对消息的应激反应，而非对这家芯片制造商前景的真正担忧。

科技与商业记者将此事件视为对体系的冲击。然而对我及其他人工智能专家而言，DeepSeek 发布 R1 唯一的令人惊讶之处，在于众人竟如此惊讶。

虽然该模型是新品，但 DeepSeek 绝非市场新人。它在中国市场拥有丰富的开源模型研发经验，特别是去年 12 月发布的 V3 模型尤为突出。事实上，其同步发布的技术论文为有志深入探索如何构建实验室的人提供了绝佳教材。V3 模型本应引发更大反响，却显然未引起足够关注。

DeepSeek 的 R1 模型无疑是生成式 AI 工具的又一典范，它将成为实现智能体 AI 未来的基石——届时人工智能不仅能回应用户需求，更能独立为用户提供服务。

虽然 IBM 通过设计合作使用所有这些模型，我们同样是开源运动的坚定倡导者与实践者。见证像 R1 这样的开源模型获得应有的赞誉，对行业而言意义非凡。

行业巨头目睹 DeepSeek 以远低于知名模型的成本打造出性能相当甚至更优的模型时感到不适，这完全可以理解。但这正是开源社区存在的意义所在。

DeepSeek R1 的发布呈现了两个平行世界：金融市场预见了动荡，而人工智能专家则因技术突破及其催生更高效强大模型的潜力而振奋。