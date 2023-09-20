膨大なラベルなしデータセットに対して自己教師あり手法を使用した、これらのベースの大規模言語モデル（LLM）やその他の種類の基盤モデルの事前トレーニングには、多くの場合、大量のコンピューティング（GPU）参考情報が必要となるため、ハブで実行するのが最適です。事実上無限のコンピューティング参考情報と大規模なデータの山により、クラウドに保管されることが多いため、大規模なパラメーター・モデルの事前トレーニングと、これらのベースとなる基盤モデルの精度の継続的な向上が可能になります。



一方、下流のタスク向けのこれらのベースFMのチューニングは、数十または数百のラベル付きデータ・サンプルと推論サービスのみを必要とするため、エンタープライズ・エッジでは数個のGPUだけで実現できます。これにより、機密性の高いラベル付きデータ（または企業の最高峰データ）を企業の運用環境内に安全に保持できると同時に、データ転送コストも削減できます。

データサイエンティストは、アプリケーションをエッジに展開するためのフルスタック・アプローチを使用して、モデルの微調整、テスト、および展開を実行できます。これは、新しいAIモデルをエンド・ユーザーに提供するための開発ライフサイクルを短縮しながら、単一の環境で実現できます。Red Hat OpenShift Data Science（RHODS）や最近発表されたRed Hat OpenShift AIのようなプラットフォームは、クラウドやエッジ環境で本番環境に対応可能なAIモデルを迅速に開発・デプロイするためのツールを提供します。

最後に、微調整されたAIモデルをエンタープライズ・エッジで提供することで、データの取得、送信、変換、処理に関連しがちなレイテンシーが大幅に短縮されます。クラウドでの事前トレーニングをエッジでのファイン・チューニングと推論から切り離すことで、推論タスクに関連する必要時間とデータ移動コストを削減し、全体的な運用コストを削減できます（図3を参照）。