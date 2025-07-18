DeepSeek-R1が1月20日にリリースされたとき、強力でありながらコスト効率の高いこのAI推論モデルが、シリコンバレーとウォール街の両方に電撃を走らせました。なぜでしょうか。これはOpenAIやAnthropicなどのトップモデルと同様の推論が可能でしたが、使用するコンピューティングの数がはるかに少なく、トレーニングと使用にかかるコストもはるかに少ないと報告されたのです。先月だけでも、このモデルはHugging Faceで80万回以上ダウンロードされました。
パロアルトを拠点とする投資会社AMINO Capitalの創設者兼マネージング・パートナーであるLarry Li氏は、IBM Thinkとの最近のインタビューで、「あれは警鐘だった」と語っている。新しいテクノロジーは、しばしば「リバース・エンジニアリング」されます。「しかし、誰もそれがこれほどうまくできるとは予想していませんでした。」
「米国は世界で唯一、イノベーションを起こせる場所であるというストーリーを変えてしまいました」と、EUと中国を含むアジア全域のAIイノベーションに投資するファンド、Cathay InnovationのC.Labの責任者であるMatthieu Soulé氏は言います。
多くの人は、DeepSeekの成功が業界と世界のAIにさらに広範な変革をもたらすと予測しました。6カ月後、私たちは調査して確認したいと考えました。これが本当に起こったでしょうか？
DeepSeek-R1のリリース後数時間にインタビューした同じ専門家の何人かや、他の数名の専門家にも全体像を捉えるために話を聞きました。
DeepSeek-R1のリリースから数日間、同社が最終版に近いモデルのトレーニングのコストを正確に集計・報告したのかだけでなく、どの企業のどのコンポーネントを使用したかについて、多くの懸念が生じました。言い換えれば、彼らは本当に革新的なことを行ったのか、それとも漸進的な進歩だったのでしょうか。
IBM主席研究サイエンティストのKaoutar El Maghraouiのような人々は、真のイノベーションとは、彼女が言うところの「アーキテクチャー的効率」、つまり「専門家の混合、強化学習戦略、ハードウェアとソフトウェアの共同設計、その他さまざまな最適化のトリックなど」の技術の組み合わせだと感じています。「これはほとんどの場合、既存の手法の賢明で効果的な実装です」と彼女は最近のIBM Thinkのインタビューで答えました。
それでも、全体的な専門家たちは、DeepSeek-R1がいくつかの重要な方向で世界のAIランドスケープを変えたことに同意しています。その1つは、アメリカのAI企業は堀を築いていたり先例となったりしており、それを埋め合わせるのがほぼ不可能なのは当然だと、多くの人が考えていたことです。DeepSeekは、開発者や中小企業が独自のLLMを開発するためのツールにアクセスする際の障壁を下げたため、その仮定が覆りました。
IBMのシニア・テクニカル・プロダクト・マネージャーであるAbraham Danielsは、「開発者とユーザーは、わずかなコストでOpenAIのo1と同じタイプの機能にアクセスできるようになりました」とインタビューで述べています。
実際、DeepSeek がモデルをオープンソース化したことは、アクセシビリティの向上に大きな役割を果たしました。IBMとAI AllianceのAIオープン戦略担当ディレクター、Anthony Annunziataは、「DeepSeekが登場してからは、オープンソースへの関心が高まり、AI Allianceに貢献していることがわかりました」と述べています。AI Allianceは、オープンで安全なAIの実現に取り組む企業や組織の国際的なネットワークで、IBMとMetaによって設立されましたた。
Annunziataは次のように述べています。「ヨーロッパ全土、ベトナム、インド、日本には、その地域のAI企業が多数存在し、自社の人工知能の主権的制御を維持し、米国や他の地域とは異なる彼らの文化的、社会的、経済的ニーズに合わせて人工知能を形作りたいと考えてます。
国内発祥のAI研究を保護することは最優先事項です。「デジタル主権の推進が本格化しており、政府は海外AIの影響を避ける方法を模索しています」とEl Maghrouiは述べています。
現地言語に基づいたLLMを作成することは、多くの起業家を動機付けします。「AIは、ユーティリティーとして、各国や地域が独自の言語モデルを持ち、少なくとも行動に影響を与えるという観点から発言権を持とうとする方向に向かっています」とLi氏。
たとえば、日本は最近、AIテクノロジーの普及を特に支援するためにAI推進法を制定しました。6月下旬、AI Allianceは日本における新支部を立ち上げ、現地の起業家にとって関心の高い2つの分野、AI主権と製造業におけるAI、に焦点を当てあてました。言語はAIシステムの制御に大きな役割を果たしているため、たとえば、2024年後半には、学術界や業界から1,500人を超える研究者が、強力でオープンな日本語言語モデルを開発するために集いました。
また、国内発祥のAIモデルや起業家の多くは、現地の経済的利益を優先します。日本の場合、三菱電気やパナソニックなど、AI Allianceに参加した企業の多くが、日本経済の特に大きなセグメントである製造業や産業アプリケーションを対象としたAIモデルを開発しています。
IBMニュースレター
AI活用のグローバル・トレンドや日本の市場動向を踏まえたDX、生成AIの最新情報を毎月お届けします。登録の際はIBMプライバシー・ステートメントをご覧ください。
ニュースレターは日本語で配信されます。すべてのニュースレターに登録解除リンクがあります。サブスクリプションの管理や解除はこちらから。詳しくはIBMプライバシー・ステートメントをご覧ください。
ディープラーニングとAIを使用した高度なソフトウェアを開発する日本のハードウェアおよびソフトウェア企業、Preferred Networks社のCTO兼共同創設者である岡野原大輔氏は、その一方でローカル・モデルへの需要も高まっていると述べています。5月、Preferred Networks社は、オンプレミスで実行でき、日本語と英語でトレーニングされたコンパクトなモデルであるPLaMoの第2バージョンをリリースしました。
「全体としての性能はフロンティアモデルに比べて競争力があるわけではありませんが、特定のタスクにおいては優れています」と、岡野原氏はIBM Thinkのインタビューで述べています。「80億～300億のパラメーターを持つモデルなどの小規模なモデルのユースケースでは、いくつかの日本語言語タスクにおいて、Clang、GPT-4o Mini、および類似のモデルを上回るパフォーマンスを発揮します。」
ベトナムでは、起業家的なLLM活動が立て続けに行われており、今年6月にAI Allianceはそこで支所を立ち上げました。Annunziataによると、起業家はベトナム言語モデルの開発に加えて、AIを強化する新しい種類のチップのAIモデルを使用した開発にも重点を置いています。
DeepSeekが地域の起業家にインスピレーションを与えたもう1つの理由は、さまざまな国または地域がセキュリティーとプライバシーの懸念を理由に、DeepSeek-R1の使用を禁止または制限しているという事実でした。イタリア、オーストラリア、韓国、カナダはDeepSeekを禁止し、米国のいくつかの州、特に官公庁・自治体のサイトでも制限されていました。これは、地域の起業家がオープンソース・ツールを使用して、特定の地域で使用できる安全性の高いモデルを作成するよう動機づけるという、興味深い波及効果をもたらしました。
テック起業家でありVCでもあるKai-Fu Leeの最新のテック企業01.AIは、企業向けAIのB2B市場を開拓しようとしています。この分野は、企業の半分が国有企業であり、大規模な民間企業が規模を拡大するにつれて官公庁・自治体の影響下に置かれる可能性がある中国では、非常に難しい分野です。Lee氏は以前、Rhymes AIを立ち上げました。同社は昨秋、検索エンジンやオープンソースのビデオ生成モデルであるAllegroなど複数の製品をリリースしました。
「私たちは実用的なアプローチでそれを考えています。このモデルは本当に十分に優れているからです。しかし、多くの企業や企業にとっては未だに簡単に使用できるものではなく、これが私たちが取り組もうとしている問題です」と、01.AIの共同創設者であるAnita Huang氏はIBM Thinkとのインタビューで述べています。「特に中国のエンタープライズ市場にとって不足しているのは、Windowsや大規模言語モデルになるミドルウェア層だと感じています」現在、同国のエンタープライズ・プラットフォームは、DeepSeekやAlibabaのQwenなどのモデルを使用しています。
DeepSeek出現の直後には、多くの人が、これが思考の連鎖による推論が主流になる下地となるだろうと予測していました。それ以降、業界は変化してきました。新しい研究によると、推論モデルはコストとリソースを大量に消費し、これらのモデルからのユーティリティーを求める多くのタスクの場合には必要とはなりません。
おそらく誇大広告がされている最大の領域は、ライセンス・コストの低さ（永久的な MIT ライセンスを通じてライセンス供与されたこと）から、DeepSeekを企業が採用したことでしょう。
「実際には、データ・プライバシー保証の欠如、コンプライアンス、ガバナンス、セキュリティーの欠如により、企業の導入は依然として非常に限られています」とEl Maghrouiは述べています。
少なくとも米国では、ほとんどの企業が、マネージド型または監査可能なソリューションを提供するベンダーを採用するに留まっています。
したがってAnziataによれば、「人々がイノベーションが驚くべき場所から生まれたのを見た」ことは良い点だとしても、AI業界全体とさらに広範な市場は、一部の予測のように変化していません。その代わりに、「オープンソース企業はオープンソースにさらに力を注ぎ、大手の専有企業は人材の獲得に重点を置き、さらに競合他社の買収や競合他社の精彩を欠かせることに重点を置きながら、モデルにますます多くの資金を投入しています」
究極的には、DeepSeekの最大のレガシーとは、目的に合った小規模モデルの例を示したことにあるかもしれないとDanielsは言います。
「DeepSeekはAIレースの扉を開き、小さな言語モデルを新たな戦いの場にしました」と彼は言います。「高機能で小規模な言語モデルは、大規模なモデルよりも効率的にトレーニングできるため、企業のユースケースに適切に対応できます」
AIエージェント（タスクを推論、計画、実行できる自律型AIシステム）は、2025年に企業全体で爆発的に普及し、そのようなユースケースの1つとなっています。小規模なモデルは、効率が高く、必要なリソースが少なく、特定のタスクに合わせて調整できるため、多くの場合エージェント型AIシステムに適しています。
IBMの特別エンジニアであるChris Hayが、最近のMixture of Expertsエピソードで語っているように、「エージェントを走らせる場合、モデルは小さく、速く、無駄のないものにしたい」のです。
IBM® Granite™をご紹介します。ビジネス向けに特化し、AIアプリケーションの拡張に合わせて最適化された、オープンで高性能かつ信頼性の高いAIモデル・ファミリーです。言語、コード、時系列、ガードレールのオプションをご覧ください。
watsonxプラットフォームにある基盤モデルのIBMライブラリーを探索し、ビジネスに合わせて自信を持って生成AIを拡張します。
業界をリードするIBMのAI専門知識とソリューション製品群を使用すれば、ビジネスにAIを活用できます。
AIの導入で重要なワークフローと業務を再構築し、エクスペリエンス、リアルタイムの意思決定とビジネス価値を最大化します。
ビジネスに合わせて生成AIを確実に拡張できるように、IBM watsonxプラットフォームにあるIBMライブラリーの基盤モデルの詳細を学びましょう。