アプリケーションの核心であるその背後にあるモデルから始めましょう。しかし、すべてのAIの問題に数千億のパラメーターを持つモデルが必要というわけではありません。小規模なドメイン調整モデルは、特定のタスクにおいては汎用的な大規模モデルと一致するかそれを上回ることが多く、わずかなコストで同等の精度を実現し、推論を高速化します。テキストの要約と分析、コード生成、ドキュメントのQA、その他の範囲の広い問題に焦点を当てることで、開発チームは次のことができます。

クエリーごとの推論コストを削減し、大規模なエージェントで経済的に実現

ワークフローと人間が巻き込まれるプロセスにおいて不可欠な、サブ秒応答までのレイテンシーを削減する

ハイブリッド環境またはエッジ環境にデプロイして、データ主権とコンプライアンスを維持しながら、クラウドのエグレス料金を回避する

適切なモデルを選択するということは、最大のパラメーター数を追求することではなく、1使用あたりのコスト、レイテンシー、メトリクスへの適合性を評価することです。