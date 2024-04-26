通信会社、医療会社、石油・ガス会社など、特定の分野で事業を展開する企業は、明確な焦点を持っています。生成AI のシナリオとユースケースからメリットを享受することはできますが、より小規模なモデルの方が適しています。

たとえば、通信会社の場合、一般的な用途としては、コンタクト センターのAIアシスタント、サービス提供におけるパーソナライズされたオファー、顧客体験を強化するためのAI搭載チャットボットなどがあります。通信会社がネットワークの性能を向上させ、5Gネットワークのスペクトル効率を高め、ネットワーク内の特定のボトルネックを特定するのに役立つユースケースには、（パブリックLLMではなく）企業自身のデータが最適です。

ここで「小さい方が良い」という考えに至ります。現在、LLM と比較してサイズが「小さい」小規模言語モデル (SLM) が存在します。SLMは数百億のパラメーターでトレーニングされ、LLMは数千億のパラメーターでトレーニングされます。さらに重要なのは、SLMが特定のドメインに関連するデータでトレーニングされることです。広範なコンテキスト情報を持っていない場合もありますが、選択した領域では非常にうまく機能します。

これらのモデルはサイズが小さいため、クラウドではなく企業のデータセンターでホストすることもできます。SLMは1つのGPUチップ上で大規模に実行され、年間のコンピューティング・コストを数千ドル節約できることもあります。しかし、チップ設計の進歩により、クラウドでのみ実行可能なものと企業のデータセンターでのみ実行可能なものの区別は曖昧になってきています。

コスト、データ・プライバシー、データ主権のいずれの理由であっても、企業はこれらのSLMをデータセンターで実行したいと考えるかもしれません。ほとんどの企業は、データをクラウドに送信することを好みません。もう1つの重要な理由はパフォーマンスです。エッジの生成AIは、できるだけデータの近くで計算と推論を実行するため、クラウド・プロバイダーを介するよりも高速で安全です。

SLMは必要な計算能力が少なく、リソースに制約のある環境やモバイルデバイスへのデプロイメントにも理想的であることは注目に値します。

オンプレミスの例としては、LLMをホストするIBM Cloudへの安全な高速接続を備えた IBM Cloud® Satellite ロケーションが挙げられます。通信事業者は、これらの SLM を自社の基地局でホストし、自社のクライアントにもこのオプションを提供できます。これはすべてGPUの使用を最適化することにかかっており、データが移動しなければならない距離が減少することで、結果として帯域幅が向上します。