柔軟なモデル選択による生成AIのスケーリング

現代的な図書館の大きな窓辺に座り、ノートPCで作業している男性。

このブログシリーズでは、ビジネスおよびテクノロジー・リーダー向けに、エンタープライズ生成AI(Gen AI)の謎を解き明かします。変革をもたらす人工知能(AI)導入プロセスのためのシンプルなフレームワークと指針を提供します。前回のブログでは、エンタープライズ・グレード・モデルを提供するIBMの差別化されたアプローチについて説明しました。このブログでは、基盤モデルの選択が重要な理由と、その選択によって企業が自信を持って生成AIを拡張できるようになる方法について詳しく掘り下げます。

モデル選択が重要な理由

生成AIが絶えず変化する環境では、万能のアプローチでは不十分です。企業がAIの力の活用に努めるには、自由に使えるさまざまなモデルを選択できるようにすることが必要です。

  • イノベーションを促進する:多様なモデル・パレットは、幅広い問題に取り組む上で明確な強みをもたらすことでイノベーションを促進するだけでなく、進化するビジネス・ニーズや顧客の期待にチームが適応することを可能にします。
  • 競争上の優位性を得るためのカスタマイズ:さまざまなモデルにより、企業はニッチな要件に合わせてAIアプリケーションをカスタマイズし、競争力を高めることができます。生成AIは、質問応答チャット・アプリケーションや簡単な要約を生成するコードの作成など、特定のタスクに合わせてファイン・チューニングできます。
  • 市場投入までの時間の短縮:今日のペースの速いビジネス環境では、時間が非常に重要です。多様なポートフォリオにより、開発プロセスが迅速化され、企業はAI搭載の製品を迅速に導入できるようになります。これは、最新のイノベーションへのアクセスが極めて重要な競争上の優位性をもたらす生成AIにおいて特に重要です。
  • 変化に柔軟に対応できるようにする:市場の状況やビジネスストラテジーは常に進化しています。さまざまなモデルの選択により、企業は迅速かつ効果的に方向転換することができます。複数のオプションにアクセスすることで、新しいトレンドやストラテジー的変化が発生したときに迅速に適応し、機敏性とレジリエンスを維持できます。
  • ユースケース全体でコストを最適化する:モデルが異なればコストの影響も異なります。さまざまなモデルにアクセスすることで、企業はアプリケーションごとに最も費用対効果の高いオプションを選択できます。一部のタスクでは高コストなモデルの精度が必要になる場合がありますが、その他のタスクには品質を犠牲にすることなく、より手頃な代替手段で対処できます。たとえば、カスタマー・ケアでは、正確さよりもスループットや待ち時間の方が重要である場合がありますが、リソースや開発の分野では、正確性の方が重要です。
  • リスクの軽減:単一のモデルや限定的な選択肢に依存することはリスクが高くなります。多様なポートフォリオは、集中リスクの軽減に役立ち、1つのアプローチの欠点や失敗に対して企業が回復力を維持するのに役立ちます。このストラテジーによってリスクの分散が可能になり、課題が発生した場合には代替のソリューションが提供されます。
  • 規制の遵守:AIの規制状況は、倫理的配慮を最前線に置きながら、進化し続けています。モデルが異なれば、公平性、プライバシー、コンプライアンスにさまざまな影響が及びます。幅広い選択肢によって、企業はこの複雑な地形を乗り越え、法的・倫理的基準を満たすモデルを選択することができます。

適切なAIモデルの選択

モデル選択の重要性を理解したので、特定のユースケースに適したモデルを選択する際に、選択過負荷の問題にどのように対処すればよいでしょうか。この複雑な問題を、今すぐ適用できる一連の簡単なステップに分解します。

  1. 明確なユースケースの選定:ビジネス・アプリケーションの具体的なニーズと要件を決定します。これには、業種・業務内の微妙な点を考慮してモデルが目的と密接に一致していることを確認するための詳細なプロンプトを作成することが含まれます。
  2. モデルの選択肢をすべてリストアップする:サイズ、精度、待ち時間、関連するリスクに基づいてさまざまなモデルを評価します。これには、精度、レイテンシー、スループットの間のトレードオフなど、各モデルの強みと弱みを理解することが含まれます。
  3. モデルの属性を評価する:モデルの規模が性能にどのような影響を与える可能性や関連するリスクを考慮し、ニーズに照らしたモデルの規模の適切性を評価します。大きければ良いというものではないため、このステップでは、ユースケースに最適に適合するようにモデルを適切なサイズにすることに重点を置いています。小規模なモデルは、対象となるドメインやユースケースにおいては、大規模なモデルを上回るパフォーマンスを実現することができます。
  4. モデルのオプションをテストする:モデルが現実世界のシナリオを模倣した条件下で期待どおりに動作するかどうかを確認するテストを実施します。これには、教育機関向けのベンチマークや分野特有のデータ・セットを使用してアウトプットの品質を評価し、例えばプロンプト・エンジニアリングやモデルのチューニングなどを通じてモデルを微調整してその性能を最適化することが含まれます。
  5. コストと導入のニーズに基づいて選択内容を絞り込む:テスト後、投資収益率、費用対効果、既存のシステムやインフラストラクチャにモデルをデプロイすることの実用性などの要素を考慮して、選択肢を絞り込みます。低遅延や透明性の向上など、他のメリットに基づいて選択を調整します。
  6. 最も価値の高いモデルを選択する:パフォーマンス、コスト、関連するリスクの最適なバランスを実現するAIモデルを最終的に選択し、ユースケースに応じてカスタマイズします。

IBM watsonx™モデル・ライブラリ

マルチモデルストラテジーを追求することにより、IBM watsonx®ライブラリーは、以下の画像に示すように、独自のモデル、オープンソースモデル、およびサードパーティモデルを提供しています。

2024年5月8日現在のwatsonx®基盤モデルのリスト。 2024年5月8日現在のwatsonx®基盤モデルのリスト。

これにより、クライアントには幅広い選択肢が与えられ、クライアント固有のビジネス、地域、リスクの選好に最適なモデルを選択できるようになります。

また、watsonx®を使用すると、ハイブリッド・マルチクラウド、オンプレミスのオプションを用いて顧客が選択したインフラストラクチャーにモデルをデプロイできるため、ベンダー・ロックインを回避して総所有コストを削減できます。

IBM® Granite:IBMが提供するエンタープライズ・グレードの基盤モデル

基盤モデルの特性は、3つの主要な属性にグループ化できます。組織は、1つの属性を過度に強調すると、他の属性が損なわれる可能性があることを理解する必要があります。組織固有のニーズに合わせてモデルをカスタマイズするには、これらの属性のバランスを取ることが重要です。

  1. 信頼できる:明確で、説明可能で、無害なモデル。
  2. 高性能:対象とするビジネス・ドメインやユースケースに適したレベルのパフォーマンス。
  3. 費用対効果が高い:総所有コストを抑え、リスクを軽減して生成AIを提供するモデル。

IBM Granite®は、IBM Researchによって開発されたエンタープライズ・グレード・モデルの主力シリーズです。これらのモデルは、信頼と信頼性に焦点を当てて、これらの属性を最適に組み合わせているため、企業が生成AIへの取り組みを成功させることができます。信頼できない基盤モデルでは、企業は生成AIを拡張できないことを忘れないでください。

IBM watsonx®は、厳格な改良プロセスから生まれたエンタープライズ・グレードのAIモデルを提供します。このプロセスは、IBM研究が主導するイノベーションから始まり、データの透明性を促進するために、IBM AI倫理規定に基づくエンタープライズ関連のコンテンツに関するオープンな連携とトレーニングを伴います。

IBM研究所は、IBMが開発したモデルと一部のオープンソース・モデルの両方を、エンタープライズでの使用に不可欠な機能で強化する命令チューニング技術を開発しました。IBMの「FM_EVAL」データ・セットは、教育機関向けベンチマークにとどまらず、実際のエンタープライズAIアプリケーションをシミュレートします。このパイプラインで最も堅牢なモデルは、IBM® watsonx.ai™で提供されています。画像に示すように、信頼性の高いエンタープライズ・グレードの生成AI基盤モデルをクライアントに提供しています。

エンタープライズ・グレードの生成AI基盤モデル

最新モデルの発表:

  • Graniteコード・モデル:116のプログラミング言語でトレーニングされたモデル・ファミリーで、そのサイズは30億~340億のパラメーターで、基本モデルと命令に従うモデルの両方のバリアントがあります。
  • Granite-7b-lab:一般的な目的のタスクをサポートし、IBMの大規模なチャットボット(lab)手法を使用して調整され、新しいスキルと知識が組み込まれています。

新しいwatsonx.aiチャット・デモで、watsonx®上でエンタープライズ・グレードの基盤モデルをお試しください。シンプルで直感的なチャット・インターフェースを通じて、要約、コンテンツ生成、ドキュメント処理における同社の機能をご覧ください。