名前が示すとおり、生成AIモデルは、ユーザーのプロンプトに基づいてテキスト、画像、コード、その他の応答を生成します。生成AIモデルを正しく利用する組織は、業務効率の向上や意思決定の改善からマーケティング・コンテンツの迅速な作成まで、さまざまなメリットを得ることができます。しかし、これらのモデルの生成機能、そして最終的には組織へのメリットを可能にするものは何でしょうか。
答えは基盤モデルです。これは、従来の機械学習モデルには欠けている、強化された推論機能とディープラーニング機能を生成モデルに提供する基盤となるエンジンです。基盤モデルとデータ・ストアを組み合わせることで、カスタマー・ケア、マーケティング、人事(人材獲得を含む)、IT機能の最適化を目指すさまざまな業界の組織向けに、生成AIツールを作成およびカスタマイズできるようになります。
Transformerとも呼ばれる基盤モデルは、膨大な量の幅広いデータでトレーニングされたAIアルゴリズムです。「基盤モデル」という用語は、2021年にスタンフォード大学の研究所Institute for Human-Centered Artificial Intelligenceによって造られました。
基盤モデルは、人間の脳と同じように情報を処理するためのニューラル・ネットワーク・モデル・アーキテクチャーに基づいて構築されます。基盤モデルは、データ分類、画像内のオブジェクトの識別(コンピューター・ビジョン)、自然言語処理(NLP)(テキストの理解と生成)などのタスクを高い精度で実行するようにトレーニングできます。また、自己教師学習を実行して知識を一般化し、新しいタスクに適用することも可能です。
データサイエンティストは、モデルをゼロからトレーニングするために時間と労力を費やす代わりに、事前トレーニング済みの基盤モデルを開始点として使用して、特定のユースケース向けに生成AIモデルを作成またはカスタマイズできます。例えば、基盤モデルは生成AIモデルの基礎として使用され、その後、追加の製造データセットを使用してファイン・チューニングされ、ある種の製品をより安全かつ迅速に製造する方法の発見に役立ちます。
大規模言語モデル(LLM)と呼ばれる特定の種類の基盤モデルは、NLPタスク用の膨大な量のテキスト・データでトレーニングされます。BERT(Bi-directional Encoder Representations from Transformers)は、開発された最も初期のLLM基盤モデルの1つです。オープンソース・モデルであるBERTは、Google社が2018年に開発しました。これは、自己教師による英語データの大規模なコーパスで事前トレーニングされており、次のようなさまざまなタスクに使用できます。
生成AIに使用される基盤モデルは、コンテンツを生成したりタスクを実行したりするアプリケーションをサポートするために大量のラベルなしデータでトレーニングできる点が、従来の機械学習モデルとは異なります。
一方、従来の機械学習モデルは、通常、ラベル付きのデータを使用して単一のタスクを実行するようにトレーニングされます。例えば、ラベル付きの車の画像を使用してモデルをトレーニングし、ラベルなしの画像内の車を認識できるようにします。
IBMのwatsonx.ai studioは、それぞれ地質学をテーマにしたコード名を持つ言語およびコード基盤モデルのスイートで、企業のさまざまなタスクに合わせてカスタマイズできます。すべてのwatsonx.aiモデルは、IBMがキュレートしたエンタープライズ向けデータレイクでトレーニングされます。
Slateは、生成テクノロジーではないものの、多くのエンタープライズ向けNLPタスクに対して高速かつ効果的な、エンコーダーのみのモデル・ファミリーです。
Graniteモデルは、生成タスク用のデコーダーのみの、GPTのようなアーキテクチャーをベースにしています。
Sandstoneモデルはエンコーダー/デコーダー・アーキテクチャーを使用しており、特定のタスクのファイン・チューニングに適しています。
Obsidianモデルは、IBM Researchが開発した新しいモジュール・アーキテクチャーを活用し、さまざまなタスクにわたって高い推論効率とパフォーマンス・レベルを実現します。
信頼できる領域固有の知識への安全なアクセスがなければ、基盤モデルの信頼性は大幅に低下し、エンタープライズ向けのAIアプリケーションの有益性も低下します。しかしここで、データ・ストアが安全なデータ・リポジトリーとして機能し、基盤モデルは拡張でき、トレーニング用データも増やすことができます。
ビジネス重視の生成AIに適したデータ・ストアは、データレイクとデータウェアハウスの特性を組み合わせたオープン・レイクハウス・アーキテクチャーに組み込まれます。このアーキテクチャーは、低コストのオブジェクト・ストレージにより節約を可能にするだけではなく、高性能分析と大規模データ処理向けに構築されたApache Icebergなどのオープン・テーブル形式を通じて大量のデータを共有できるようにします。
基盤モデルは、スケーラブルでコスト効率の高いコンテナ内で、非常に大量のドメイン固有のデータをクエリーできます。また、クラウドと組み合わせたこれらのタイプのデータ・ストアは、事実上無制限の拡張性を実現するため、時間の経過とともにデータが追加されるにつれて、基盤モデルの知識ギャップが狭まるか、または解消されることもあります。ギャップが埋められるほど、基盤モデルの信頼性が高まり、その適用可能範囲が広がります。
データ・ストアは、データサイエンティストに、基盤モデルのトレーニングとファイン・チューニングに使用するデータを収集およびクレンジングするために使用できるリポジトリーを提供します。また、膨大な量のデータを処理するサードパーティー・プロバイダーのクラウドおよびハイブリッドクラウド・インフラストラクチャーを活用するデータ・ストアは、生成AIのコスト効率にとって重要です。
基盤モデルがデータ・ストア全体の情報にアクセスし、この情報を使用してさまざまなタスクを実行し、応答を生成する方法をファイン・チューニングすると、結果として得られる生成AIツールによって、組織は次のようなメリットを実現できます。
データサイエンティストは、事前トレーニング済みのモデルを使用して、さまざまなミッションクリティカルな状況にAIツールを効率的にデプロイできます。
開発者は、カスタム・コードのスニペットを生成するAIツールを使用して、コードの作成、テスト、ドキュメント化をより迅速に行うことができます。
経営幹部は長いレポートの代わりに、AIが生成した要約を受け取ることができます。また、新入社員はオンボーディング資料やその他の販促資料の簡潔版を受け取ることができます。
組織は、生成AIツールを使用して、次のようなさまざまなタスクを自動化できます。
マーケティング・チームは、生成AIツールを使用して、幅広いトピックに関するコンテンツを作成できます。また、マーケティング資料を複数の言語に迅速かつ正確に翻訳することもできます。
ビジネスリーダーやその他の利害関係者は、AI支援分析を実行して大量の非構造化データを解釈し、市場や評判の感情などをより深く理解することができます。
組織がビジネス全体でAIを幅広く活用できるよう、IBMはAI製品のポートフォリオであるwatsonxを提供しています。このポートフォリオは次の3つの主力製品で構成されています。
生成AIが生み出しうる価値、AIに必要な投資、AIがもたらすリスクのバランスを、CEO(最高経営責任者)がどのように取ることができるかについて説明します。
ハンズオン・ラボ、コース、指導付きプロジェクト、トライアルなどで、基本的な概念を学び、スキルを身につけていただけます。
生成AIと機械学習をビジネスに活用する確実な方法を学びましょう。
AIの投資対効果を高めるために、主要な分野で生成AIの活用を拡大することで、どのように革新的な新規ソリューションの構築、提供を支援し、変化をもたらすかを紹介します。
2,000の組織を対象に、AIへの取り組みについて調査を行い、何が機能し、何が機能していないのか、どうすれば前進できるのかを明らかにしました。
IBM Graniteは、ビジネス向けにカスタマイズされ、AIアプリケーションの拡張に合わせて最適化された、オープンで高性能、かつ信頼性の高いAIモデルのファミリーです。言語、コード、時系列、ガードレールのオプションをご覧ください。
ユースケースに最適なAI基盤モデルを選択する方法について説明します。
強力なAIストラテジーの3つの重要な要素である、競争優位性の創出、ビジネス全体へのAIの拡張、信頼できるAIの推進について詳しく説明します。
AI開発者向けの次世代エンタープライズ・スタジオであるIBM watsonx.aiを使用して、生成AI、基盤モデル、機械学習機能をトレーニング、検証、チューニング、導入しましょう。わずかなデータとわずかな時間でAIアプリケーションを構築できます。
業界をリードするIBMのAI専門知識とソリューション製品群を使用すれば、ビジネスにAIを活用できます。
AIの導入で重要なワークフローと業務を再構築し、エクスペリエンス、リアルタイムの意思決定とビジネス価値を最大化します。