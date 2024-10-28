テクノロジー企業が人工知能に数十億ドルを投入するにつれ、コードを放棄するという直感に反するストラテジーが注目を集めています。オープンソースAIモデルへの動きは、才能とコンピューティングパワーが高額な値札を伴う分野でブレークスルーを加速させる一方で、開発コストを抑制するという圧力の高まりを反映しています。
IBM、Meta、Mistral AIなどの企業がオープンソース開発を採用し、高度なAIテクノロジーを開発者や研究者が自由に利用できるようにするにつれて、AIを取り巻く状況は変化しています。このアプローチはアクセスを民主化し、コラボレーションを通じてブレークスルーを加速する可能性がありますが、批判者は、悪意のある攻撃者が有害な目的でテクノロジーを悪用したり、変更したりする可能性があると警告しています。
支持者は、オープンソースのAI開発により、世界中の研究者や開発者が技術を検査、修正、改善できるようになると述べています。この協力的なアプローチは、モデルの効率の大幅な進歩をもたらしました。例えば、IBMの新しいGranite 3.0 AIモデルは、コンピューティング・リソースのほんの一部を必要としながら、より大きなシステムに匹敵する性能を達成しています。
IBMは、Granite 3.0モデルをApache 2.0ライセンスの下でオープンソース・ソフトウェアとしてリリースしており、AIシステムをプライベートに保つ開発者とは著しく異なるアプローチを採用しています。当社はGitHub Code CleanやStarCoderといった公開データセットを用いてモデルを構築したため、保護されたコンテンツでモデルを訓練したAI企業に対する訴訟（例えばNews CorpによるPerplexity社への現在の訴訟事例）を引き起こした著作権問題から距離を置くことが可能となりました。
このリリースには、検索拡張生成や分類などのエンタープライズ・タスクに焦点を当てた8Bおよび2B言語モデルと、指示とセキュリティー監視のための特殊なバリアントが含まれています。116のプログラミング言語をサポートし、3～4テラバイトのトークンでトレーニングされたこのモデルは、Hugging Face、GitHub、IBM® watsonx.aiなど、複数のプラットフォームで利用できます。モデルのパラメーター数は30～340億個で、名目上の「オープンソース」リリースであれば、研究用途や商用用途に制限なく使用できます。
IBM® Researchのデータおよびモデル・ファクトリー・プログラム・ディレクターのKate Souleは、「多様な思考を受け入れ、このオープン・エコシステムの一部として貢献することは、モデルを箱のような箱の中に閉じ込めておくことよりもはるかにエキサイティングな提案です」と述べています。「コミュニティーに使ってもらいたいと思います。」
オープンソースの動きはヨーロッパでも勢いを増しており、Mistral AIは業界のリーダーとして頭角を現しています。パリを拠点とするこのスタートアップ企業は、開発者が自由にダウンロードして変更できる、ますます高性能なモデルをリリースしています。
オープンソース戦略では、双方向の交換が生まれます。企業は、ディープ・ポケットだけが構築できるAIモデルを共有すると同時に、何千人もの開発者がテクノロジーの斬新な用途を見つける中でインサイトを得ることができます。アクセスを制限することは、この集合的なイノベーションを逃すことを意味すると多くの人が主張しています。
IBMのシニアライターであるDave Bergmannは、「モデル・アーキテクチャーに何らかの新しい調整機能があると、他のすべてを変更しないだけで、全体的な性能が大幅に向上すると想像してください」と述べています。「モデルをオープン・ウェイトのみとしてリリースし、そのアーキテクチャーの情報やコードの開示を拒否した場合は、そこにチャンスを実現することがないかもしれません。しかし、2万人がモデル・コードを混乱させれば、誰かがそれを見つけるでしょう。」と初歩的な例を示しています。
Meta社によるオープンソースのLlamaモデルのリリースは、重要な転換点となりました。つまり、あるテクノロジー最大企業の1社が、研究者や小規模組織に、単独で構築する余裕のない高度なAI技術を提供したのです。
「私たちは、オープンソースAIは、これらのモデルを採用し、ファイン・チューニングし、トレーニングし、蒸留し、好きな場所で使用できる開発者を含め、すべての人にとって良いと信じています」とMeta社のAIパートナーエンジニアリング担当シニアディレクターであるAmit Sangani氏は述べています。「AIがオープンソースになればなるほど、AIの透明性と安全性が高まります。それは広く精査されており、これは良いことです。問題が見つかると、Meta社を含む人々が問題を解決するからです。」
利点はあるものの、オープンソースのAIテクノロジーにはリスクが伴う可能性があります。オープンソースのAIモデルは、偽情報の生成やマルウェアの作成といった有害な目的のために、より簡単に修正される可能性があるという意見もあります。一元管理が欠如しているということは、元の開発者が高い倫理基準を遵守していても、変更されたモデルの開発者はそうでない可能性があることを意味します。
それにもかかわらず、Granite 3.0のようなモデルによって示された効率性の向上は、リソースが限られた組織でもAI機能がより利用しやすくなる将来性があることを示しています。大規模な言語モデルを実行する余裕のない中小企業は、特定のニーズに合わせてカスタマイズされた、より小規模で効率的なオープンソースの代替手段をデプロイできます。
「オープンソースは、より多くの場所でより多くのイノベーションを実現するでしょう」と、AI Allianceのコミュニティー・ディレクター、Dave Nielsen氏は言います。「そして、それはより多くの起業家とより多くの顧客にさらなる期待を生み出し、より多くの収益を生み出すでしょう。」
