watsonx.aiの背後にあるテクノロジーを紹介IBMのエンタープライズ向けAI製品ポートフォリオ

薄紫色の円がパターンで交差するwatsonx.aiの抽象的なグラフィック

AI革命の最前線に立つ AI革命。過去10年間、ディープラーニングはデータの可用性と強力なコンピューティング能力の重大な衝突から誕生し、多くの目覚ましいAI機能を実現しました。しかし、自動化には多大な労力がかかるという矛盾する課題に直面しています。これは冗談のように聞こえますが、AIを使ってビジネス上の問題を解決しようとした人なら誰でも知っているかもしれませんが、そうではありません。

従来のAIツールは強力ではありますが、高価で時間がかかり、使いにくい場合があります。AIモデルをトレーニングするには、データを確実に収集、キュレートし、タスク固有の注釈を付けてラベル付けする必要があります。モデルを構築するには、専門的で見つけにくいスキルが必要であり、新しいタスクを実行するたびにプロセスを繰り返す必要があります。その結果は、企業は豊富なデータと高いビジネス価値を備えたタスクの自動化に重点を置き、他のすべてをテーブル上に残しました。しかし、この状況は変わり始めています。

トランスフォーマーや自己教師付き学習法の登場により、膨大なラベルなしデータにアクセスできるようになり、大規模な事前学習モデル、いわゆる「基盤モデル」への道が開かれました。こうした大規模モデルにより、オートメーションに伴うコストと労力が削減されました。

基盤モデルは、さまざまなAIアプリケーションに強力で多用途な基盤を提供します。基盤モデルを使用すると、限られた注釈付きデータと最小限の労力でタスクを迅速に実行できます。場合によっては、モデルを解決に導くために、目の前のタスクを説明するだけで済みます。

しかし、これらの強力なテクノロジーは企業に新たなリスクと課題ももたらします。今日のモデルは多くの場合、品質や出所が不明なデータセットでトレーニングされているため、攻撃的またはバイアス、または事実に反する応答につながります。大規模なモデルは高価で、トレーニングと実行に多くのエネルギーを必要とし、デプロイも複雑です。

私たちIBMは、エンタープライズ向けの基盤モデルを使用する際の中核的な課題に対処するアプローチを開発してきました。本日、watsonx.aiを発表しました。今日の市場にある最新のAIツールとテクノロジーへのIBMの入り口。分野が急速に変化していることの証として、一部のツールは数週間前から現在までに新しいツールを追加しています。

今週発表されたIBMの大規模なwatsonx製品の一部である watsonx.ai に含まれる内容は多様で、今後も進化し続けるでしょうが、私たちの大きな約束は同じです。安全でエンタープライズ対応のオートメーション製品を提供することです。

これは、AIにおけるこの新しいパラダイムから価値を引き出すためのお客様の旅を加速させるというIBMの継続的な取り組みの一環です。ここでは、データおよびモデル・アーキテクチャーへのアプローチを含め、IBMでトレーニングされたエンタープライズ・グレードの一連の基盤モデルを構築するための私たちの取り組みについて説明します。また、企業が当社のものに加えて、オープンソース・モデルの幅広いカタログを使用して基盤モデル・ベースのソリューションを構築およびデプロイできるようにする私の新しいポートフォリオとツールについても概説します。

データ: 基盤モデルの基盤

データ品質は重要です。偏ったデータや有害なデータを使ってトレーニングされたAIモデルは、当然ながら偏った出力や有害な出力を生成する傾向があります。この問題は、基盤モデルの時代においてさらに深刻化しています。モデルのトレーニングに使用されるデータは一般に多くのソースから得られるもので、非常に豊富なため、人間はすべてのデータを適切に調べられません。

データは基盤モデルを推進する燃料であるため、IBMはモデルに含まれるすべてのデータを綿密にキュレートすることに重点を置いています。当社は、憎悪や冒涜、ライセンス制限、バイアスについて積極的にデータをフィルタリングするAIツールを開発しました。不快なデータが特定された場合は、それを削除し、モデルを再トレーニングし、繰り返します。

データ・キュレーションは決して完了しない作業です。私たちは、次に進む、変化し続ける一連の法的および規制上の要件を満たすために、データ品質と管理を改善するための新しい方法を開発および改良しています。私たちは、クリーニングされた未加工データ、使用されたメソッド、各データポイントが触れたモデルを追跡するためのエンドツーエンドのフレームワークを構築しました。

財務、法務、サイバーセキュリティー、サステナビリティーなどの幅広い分野にわたる最も差し迫ったビジネス上の課題に取り組むために、質の高いデータを収集するために次に進みます。現在、私たちの基盤モデルをトレーニングするために、1テラバイトを超えるキュレートされたテキストを対象としており、キュレートされたソフトウェア・コード、satelliteデータ、ITネットワーク・イベント・データおよびログを追加しています。

IBM Researchは、基盤モデルのライフサイクル全体を通じて信頼性を導入し、バイアスを軽減し、モデルの安全性を向上させる技術も開発しています。この分野での私たちの研究には、モデルのチューニングに使用されるデータ内のバイアスデータポイントを識別して編集できるようにするFairIJが含まれます。公平性再プログラマーなどの他の方法では、モデルがトレーニングされた後でもモデルのバイアスを軽減できます。

企業価値に焦点を当てた効率的な基盤モデル

IBMの新しいwatsonx.aiスタジオは、企業価値の提供を目的としたスイートの基盤モデルを提供します。これらはさまざまなIBM製品に組み込まれており、今後数か月以内にIBMのお客様に提供される予定です。

1つのサイズですべてに対応できるわけではないことを認識し、IBMはさまざまなサイズとアーキテクチャーの言語とコードの基盤モデルのファミリーを構築しています。各モデル・ファミリーには、地質学をテーマにしたコード名(Granite、Sandstone、Obsidian、Slate)があり、IBM 研究とオープン・研究コミュニティーの最先端のイノベーションが結集しています。各モデルは、企業のさまざまな業務に合わせてカスタマイズできます。

IBMのGraniteモデルは、生成タスク用のデコーダー専用のGPTのようなアーキテクチャーを基盤としています。Sandstoneモデルはエンコーダー/デコーダー・アーキテクチャーを使用しており、特定のタスクの微調整に適しており、Googleの人気のあるT5モデルと互換性があります。Obsidianモデルは、IBM Researchが開発した新しいモジュール・アーキテクチャーを活用し、さまざまなタスクにわたって高い推論効率とパフォーマンス・レベルを実現します。Slateは、エンコーダー専用(RoBERTAベース)モデルのファミリーを指します。生成AIではありませんが、多くのエンタープライズNLPタスクに高速かつ効果的です。すべての watsonx.ai モデルは、IBM がキュレートしたエンタープライズ向けのデータレイク、つまりカスタム設計されたクラウドネイティブ AI スーパーコンピューターVelaでトレーニングされています。

効率性とサステナビリティーは、watsonx.aiの中核となる設計原則です。IBM Researchでは、小さなモデルをリサイクルして大きなモデルに「成長」させる 「LiGO」 アルゴリズムなど、効率的なモデル・トレーニングのための新しいテクノロジーを発明しました。この方法により、モデルのトレーニングに必要な時間、コスト、二酸化炭素排出量を40%から70%削減できます。推論速度を向上させるために、量子化に関する深い専門知識を活用するか、32ポイントの浮動小数点演算からはるかに小さな整数ビット形式にモデルを縮小しています。AIモデルの精度を下げると、精度を犠牲にすることなく効率のメリットが大幅に向上します。近いうちに、AIに最適化されたチップ、IBM AIUでこれらの圧縮モデルを実行したいと考えています。

基盤モデル用のハイブリッドクラウド・ツール

基盤モデルのパズルの最後のピースは、モデルのチューニングとデプロイのための使いやすいソフトウェアを作成することです。IBMのハイブリッドクラウドネイティブなスタック、RedHat OpenShift上に構築され、基盤モデルのトレーニングと提供に最適化されています。企業は、OpenShiftの柔軟性を活用して、オンプレミスを含むあらゆる場所からモデルを実行できます。

watsonx.aiで基盤モデルベースのソリューションを構築するための、使いやすいユーザー・インターフェースと開発者向けのライブラリーを提供するツール・スイートを開発しました。プロンプトLabでは、ユーザーはラベル付きのいくつかの例を使用して、AIタスクを迅速に実行できます。Tuning Studio は、IBM Researchが開発した最先端の効率的な微調整手法に基づいて、独自のデータを使用して迅速かつ堅牢なモデルカスタマイズを可能にします。

watsonx.aiは、IBM独自のモデルに加え、企業が実験し、それを迅速に反復するための、幅広いオープンソース・モデルのカタログへのシームレスなアクセスを提供します。ハギング・フェイスとの新たなパートナーシップにより、IBMはwatsonx.ai®で数千ものオープンソースのハギング・フェイス基盤モデル、データセット、ライブラリを提供します。Hugging Faceは、IBM独自のオープンアクセス・モデルとツールのすべてをwatsonx.ai上で提供する予定です。

新しいモデルを試すには、ドロップダウン・メニューからそれを選択するだけです。スタジオの詳細はこちらからご覧ください。

未来への展望

基盤モデルはAIのランドスケープを変えており、近年の進歩は加速するばかりです。私たちIBMは、この急速に進化する分野の最前線を切り開き、イノベーションを真の企業価値に変えるお手伝いをできることを嬉しく思います。

 
次のステップ

AI開発ライフサイクル全体にわたる機能にワンストップでアクセスできます。使いやすいインターフェース、ワークフロー、業界標準のAPIやSDKを利用して、強力なAIソリューションを構築できます。

watsonx.aiの詳細はこちら デモを予約