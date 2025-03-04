2025 年 1 月 20 日の見出しをご覧になった方は、空が落ちてくると思ったかもしれません。これは、中国拠点の DeepSeek がR1大規模言語モデル(LLM)をリリースし、その直後に最もダウンロードされ、アクティブなモデルの一つとなったためです。

興奮を引き起こしたのは、中国杭州に拠点を置き、自らの名を冠したモデルをリリースしているAI 研究室が、米国の主要モデルと比べて 560万米ドルというはるかに低いコストで、しかもコンピュートリソースやエヌビディア製チップへのアクセスもはるかに少ないモデルを構築したモデルを構築したという事実からでした。

人々はまるで時計仕掛けのように、多額の資金を投じる米国のAI企業の一部が取り残されてしまうのではないかと公然と懸念していました。DeepSeekは他の企業に比べてNVIDIAチップの使用量が少ないため、同社の株価が下落しました。しかし、これは半導体メーカーの運命について重大な懸念を抱かせたというよりも、ニュースに対する反射的な反応でした。

技術およびビジネス関連のレポーターは、このニュースをシステムに対する衝撃と捉えました。しかし、他のAI専門家や私にとって、DeepSeekの「R1」発表の唯一の驚きは、いかに誰もが驚いたように見えたかということでした。

このモデルは新しいものでしたが、DeepSeekはマーケットプレイスに新規に参入したわけではありません。同社は、特に12月にリリースされたV3モデルをはじめ、中国市場において価値あるオープンソース・モデルを数多く生み出してきた実績を持っています。実際、同社は付随する技術論文を公開し、これらのラボの構築方法を深く知りたい人向けの教育を提供しています。V3 モデルはさらに驚きでしたが、どうやら注目されなかったようです。

もちろん、DeepSeekのR1モデルも生成AI ツール の一例であり、AIツールがユーザーの要望に応答するだけでなく、独立してユーザーにサービスを提供するエージェント型AIの未来の基盤となり得ます。

IBMは意図的にこれらすべてのモデルと提携し、かつ使用していますが、オープンソース運動を強く支持し、そのエンジニアでもあります。R1のようなオープンソース・モデルが賞賛されることは、業界にとって素晴らしいことです。

DeepSeekが自社のモデルと同等かそれ以上のモデルを、しかもより有名なモデルの数分の1のコストで製造しているのを見るのは、大手企業にとって少し不快だったことは理解できます。しかし、それがオープンソース・コミュニティの目的です。

DeepSeek R1の発表は、金融市場が混乱を予測する一方で、AIの専門家は技術的な進歩と、より効率的で強力な新しいモデルにどうつながるかに興奮しているという2つの世界の物語を示しています。