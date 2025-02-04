タグ
AI（人工知能）

DeepSeekが示すさらに多くのAI参入の余地

会議室でタブレット端末で作業している女性

AI武装の競争は、もはや10億ドル規模の大手企業だけのものではありません。

人工知能に関し話題にされるとき、OpenAI、Google、Microsoftなどの企業がヘッドラインを席巻しています。しかし、最近のDeepSeekモデルに代表されるオープンソース・イノベーションの新しい波により、競争が激化しています。このモデルの成功は、中小企業がAIの最も有名なプレーヤーにますます挑戦する可能性があることを明確に示しています。

「これは、私たちがすでに知っていたことを強化するものです」と、IBM ResearchのAIモデル担当バイス・プレジデントであるDavid D. Coxは述べています。「優れたモデルを構築するためには、何十億ドルも必要だとは考えていません。DeepSeekは、オープンソースのアプローチが追いつきつつあることを証明しており、それは良いことです。」

賢いメモリー・トリック

AI 研究者は、計算コストを押し上げることがない、より強力なモデルを作成しようと絶えず競争しています。ハードウェアの限界やエネルギー消費に対する懸念が高まる中、効率を向上させるイノベーションは、生の性能の向上と同じくらい重要になってきています。

「あまりに長い間、AIの競争は、より大きなモデルがより良い結果をもたらすという規模のゲームだった」とIBMのアルヴィンド・クリシュナCEOはLinkedInに書いています。「しかし、AIモデルは大きくて高価なままでなければならないという物理法則はありません。トレーニングと推論にかかるコストは、解決すべきテクノロジーの別な課題にすぎません」

DeepSeekのAI効率における画期的な進歩は、Multi-Head Latent Attention (MLA) と呼ばれる新しい技術によるものです。この方法では、AIモデルが情報を処理し、保存する方法が変わります。主な改善点は、MLA によって、AI システムが効率的に動作するために不可欠なKV キャッシュと呼ばれるもののサイズが削減されることです。Cox氏によると、これによりAIシステムのメモリ使用量が減り、より簡単に大規模に拡張できるようになります。

「彼らはこれで本当に素晴らしい仕事をしました」とCoxは指摘します。「KVキャッシュのサイズを縮小することは、モデルの実行を高速化し、使用するリソースを減らすことができるため、非常に重要です。」

DeepSeekの下において、この画期的な進歩が倍増しました。IBM Researchの主席研究員であるPrasanna Sattigeriは、同社のイノベーションは効率性とアーキテクチャーの改善にあると指摘しました。

「彼らはGPU間の通信を最適化しており、これは大規模なAIトレーニングではボトルネックとなりがちです」とSattigeriは言います。「これにより、古いハードウェアを使用して効果的なトレーニングを行うことができました。これは、エンジニアリング上の驚くべき偉業です。」

しかし、他の野心的なエンジニアリング・プロジェクトと同様、この飛躍的な進歩にはコストがかかりました。DeepSeekは、OpenAIのo1推論スケーリング・アプローチで使用されるものと同様の強化学習（RL）技術も活用しました。この方法では、複数回の反復にわたって成功したアウトプットを補強することで、モデルの性能が改良されます。しかし、Coxは、DeepSeekの実装によって、関数呼び出し機能の低下や安全性の調整に関する懸念などのトレードオフが生じたと指摘しています。

「これは素晴らしい前進ですが、ある程度の荒削りさが残っています」とのことです。「このモデルは推論タスクでは優れていますが、他の分野では酷評も受けました」

ニュースレターを表示しているスマホの画面

The DX Leaders

「The DX Leaders」は日本語でお届けするニュースレターです。AI活用のグローバル・トレンドや日本の市場動向を踏まえたDX、生成AIの最新情報を毎月お届けします。

大きな夢、小さな予算

進歩により大規模なAIモデルの構築が容易になっても、競争力を維持するために膨大なコンピューティング能力が必要だという、より大きな課題が依然として存在します。ライス大学のコンピュータ・サイエンス准教授であるXia “Ben” Huu氏は、DeepSeekがAI開発においてより効率的な前進であることを認めています。ただし同氏は、AIインフラストラクチャーにおける全体的なパワー・ダイナミクスが根本的に変化するわけではなく、膨大なコンピューティング・リソースへのアクセスが、誰が競争をリードするかを依然として決定していると指摘しています。

「DeepSeekは中国の大手ベンチャーファンドに支援されており、何万ものGPUにアクセスできます」とHu氏は言います。「これは依然として、多くの小規模スタートアップにとって大きな障壁です。」

しかしHu氏は、最も重要な変化はエンタープライズ向けAIの導入になる可能性が高いと予測しています。「石油・ガス、製造などの従来の業種は、独自のAIソリューションを開発することに躊躇していました」と彼は言います。「コストが低下し、オープンソース・モデルが改善されたことで、かつては外部のAIサービスに依存していた企業が、特定のニーズに合わせた社内モデルの構築を検討し始めています。」

この暗示は1つのモデルにとどまりません。オープンソースのAIプロジェクトが増加する中、小規模なスタートアップ企業は、かつては大規模なデータセンターと膨大な予算を必要としていたツールにアクセスできるようになりました。Coxは、OpenAIやそれに類するものは長い間、「避けられない空気」を予測してきたと述べました。つまり、AIをリードできるのは資金の豊富な企業だけだということです。しかし、DeepSeekやその他のモデルが登場するにつれて、その概念は崩壊し始めています。

「この分野では、より幅広い範囲のプレーヤーが競争できる変化が見られます」とCoxは言います。「500万米ドルを持つ人が一夜にしてトップレベルのモデルを構築できるということではありません。資金が豊富なスタートアップ企業や中堅企業でそれが可能だということでしょうか？そのとおりです。」

研究者たちは、生のコンピューティング能力ではなく、効率性にも焦点を当てています。Coxと彼の研究チームは、AIが処理リソースの使用方法をより選択できるようにするMixture of Expertsアプローチに狙いを絞りました。

「Mixture of Expertsはパズルの一部にすぎません。もっと多くのことが起きます」と彼は言い、AIの将来は、高度なチップへのアクセスよりも、既存のハードウェアをよりスマートに利用するかどうかにかかっているとのことです。

Sattigeriは、そのようなイノベーションの1つである、合成データ、つまり現実世界のデータを模倣する人工的に生成された情報の台頭について強調しました。「DeepSeekのようなモデルでは、AIが生成した合成データを使用して、モデルをより効率的に洗練しトレーニングする方向への移行が見られます」と彼は言います。「これにより、コストが大幅に削減され、より多くのプレーヤーが高品質のAIを利用できるようになります。」

AI開発へのアクセシビリティーが高まることで、競争の将来に関する新たな疑問が生じています。インフラストラクチャーとコンピューティング能力がそれでも勝者を決めるのでしょうか、それとも迅速なイノベーションの能力が最も価値ある資産になるのでしょうか。Coxによると、両方を混合させたものだそうです。

「それでも、本格的なインフラストラクチャーと優れた人材が必要ですが、OpenAIとGoogleが設定している領域は、人々に信じられているほど深くはありません」と彼は言います。「この分野では、秘密は秘密として留まらないのです。アイデアが広がり、人々が動きます。そこには急速な収束が見られます。」

Hu氏は、AI開発には依然として4つの重要なコンポーネントが必要であると付け加えています。「私はそれをABCDモデルと呼んでいます。アルゴリズム、ビッグデータ、コンピュート、配布です」と彼は言います。「最高のAI企業は、この4つすべてを備えています。DeepSeekは最初の2つで大きな成果を上げていますが、コンピューティングと配布は依然として主要なプレーヤーに競争力を与えています。」

AI Academy

基盤モデルがAIのパラダイム・シフトとなる理由

新たな収入源の獲得、コスト削減、生産性の向上を実現する、柔軟で再利用可能な新しいAIモデルについて学びます。その後、ガイドブックを使ってさらに理解を深めてください。
エピソードに移動

AIの次の章：小さく考察して大きな成果を上げる

より効率的なテクノロジーによって実現されるAI企業の数が増えていることは、単なる競争ではなく、創造的な革命を引き起こす可能性があります。より多くの企業が数十億ドル規模の予算をかけずにAIを開発できるようになれば、イノベーションは一握りの企業の意図によるのではなく、多様な視点によって推進されるようになるだろうとCoxは言います。つまり、よりカスタマイズされたAIソリューションと特殊なモデル、そしてよりダイナミックな市場が生まれるということです。

「イノベーションは、より安全で、より包括的な方法で、より迅速に実現します」とCoxは述べています。「少数のプレーヤーが条件を設定する単一文化を超えて進むとき、さまざまなアプローチが繁栄するでしょう。」

Coxは、オープンソースAIに取り組んでいるIBMにとって、DeepSeekの台頭はそのアプローチの価値を裏付けるものであると述べています。「これは私たちにとって実に良いことです」と彼は言います。「これは、オープン・モデルが機能すること、そしてオープン・モデルに需要があることを証明しています。貢献する人が多ければ多いほど、私たち全員のメリットになります。」

Hu氏は、中小企業が地位を確立する一方で、大手企業も適応しつつあると指摘します。「Amazon、Meta、Microsoftは、オープンソースにランチを食べに座ることだけではありませんでした」と同氏は言います。「彼らは、インフラストラクチャーとデータの管理を維持しながら、オープンソース・モデルを統合する方法を見つけるために懸命に取り組んでいます。」

次に何が起こるのか?Coxや他の専門家は、AI開発がすべての人に自由に行えるようになるとは考えていませんが、中小企業がもはやテクノロジー大手企業に操業を任せていることは明らかです。オープンソース・ツールは進歩を加速させており、最大の利益を得るのは、この変化を受け入れている企業です。

「これは継続的なトレンドの一部です」とCoxは述べています。「それはDeepSeekから始まり、それで終わることもありません。しかし、一部の人々は確かに気づき始めています。」

参考情報

IBM Graniteはこちら

IBM® Granite™をご紹介します。ビジネス向けに特化し、AIアプリケーションの拡張に合わせて最適化された、オープンで高性能かつ信頼性の高いAIモデル・ファミリーです。言語、コード、時系列、ガードレールのオプションをご覧ください。
適切な基盤モデルを選ぶ方法

ユースケースに最適なAI基盤モデルを選択する方法について説明します。
LLMの威力を知る

IBM Developerの記事、ブログを読み、チュートリアルで学んで、LLMに関する知識を深めましょう。
CEOのためのモデル最適化ガイド

最新のAI技術とインフラストラクチャーを使用して、モデルのパフォーマンスを向上させ、競合他社に差をつけるよう、チームを継続的に後押しする方法を学びましょう。
AI基盤モデル提案の差別化

あらゆる業界に信頼性、パフォーマンス、費用対効果の高いメリットを提供する エンタープライズ・グレードの基盤モデルの価値に関する 詳細をご覧ください。
生成AI + MLの力を解き放つ

生成AI、機械学習、基盤モデルをビジネス・オペレーションに組み込んでパフォーマンスを向上させる方法をご紹介します。
AI in Action 2024

2,000の組織を対象に実施されたAIの取り組みに関する調査結果をご覧ください。成功事例や課題、そしてAIを活用して競争優位性を高めるためのヒントが得られます。
関連ソリューション
基盤モデル

watsonxプラットフォームにある基盤モデルのIBMライブラリーを探索し、ビジネスに合わせて自信を持って生成AIを拡張します。

 watsonx.aiをご覧ください。
人工知能ソリューション

業界をリードするIBMのAI専門知識とソリューション製品群を使用すれば、ビジネスにAIを活用できます。

 AIソリューションはこちら
AIコンサルティングとサービス

AIの導入で重要なワークフローと業務を再構築し、エクスペリエンス、リアルタイムの意思決定とビジネス価値を最大化します。

 AIサービスはこちら
次のステップ

ビジネスに合わせて生成AIを確実に拡張できるように、IBM watsonxプラットフォームにあるIBMライブラリーの基盤モデルの詳細を学びましょう。

 watsonx.aiの詳細はこちら AIソリューションはこちら