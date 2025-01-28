大型和复杂的机器学习模型，例如用于 ChatGPT 等大型语言模型 (LLM) 的模型，需要花费很长时间和大量资源才能建立。它们可能有数万亿个设为特定值的参数。一旦这个过程完成，模型可能总体上功能强大且准确，但不一定针对特定任务进行了微调。

要让模型在特定环境下正常工作，可能需要进行大量的重新训练，改变其所有参数。由于此类模型的参数较多，重新训练既昂贵又耗时。LoRA 提供了一种快速调整模型的方法，而无需重新训练模型。

例如，由于 GPT-3 模型的训练数据集规模庞大，对其进行完全微调需要训练 1,750 亿个参数。使用 LoRA，GPT-3 的可训练参数可以减少到大约 1,800 万个参数，从而将 GPU 内存需求减少大约三分之二。

LoRA 并不是唯一高效的微调方法。LoRa 的一种变体是量化 LoRa (QLoRA)，这是一种将高精度计算技术与低精度存储空间相结合的微调技术。这有助于保持较小的模型尺寸，同时仍确保模型具有高性能和高准确性。