LoRAの主な利点の1つは、基本モデルを共有および使用して、新しいタスク用の多数の小さなLoRAモジュールを構築できることです。共有モデルはフリーズされているため、ユーザーはLoRAの重み行列を置き換えることでタスクを切り替えることができます。2つの異なるモデルを必要とする代わりに、ファイン・チューニングによる性能の向上を維持しながら、単一のモデルをさまざまなタスクで使用できます。

LoRAを使用すると、ユーザーは勾配を計算したり、ほとんどのパラメーターのオプティマイザー状態を維持したりする必要がないため、トレーニングをより効率的にし、参入においてハードウェア面での障壁が低くなります。代わりに、プロセスでは、はるかに小さい低ランクの行列のみを最適化する必要があります。

LoRAの線形設計により、データサイエンティストは、デプロイ時にトレーニング可能な行列を固定された事前トレーニング済みモデルの重みとマージすることができるため、構築別に全面的にファイン・チューニングされたモデルと比較して推論のレイテンシーが生じません。

LoRAを他の手法と組み合わせることで、プレフィックス・チューニングなどのモデルの性能を向上させ、柔軟性を高めることができます。