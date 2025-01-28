ChatGPT와 같은 대규모 언어 모델(LLM)에 사용되는 것과 같이 크고 복잡한 머신 러닝 모델은 설정하는 데 오랜 시간과 많은 리소스가 소요됩니다. 여기에는 특정 값으로 설정된 수조 개의 매개변수가 있을 수 있습니다. 이 프로세스가 완료되면 모델은 일반적으로 강력하고 정확할 수 있지만 특정 작업을 수행하기 위해 반드시 미세 조정되어야 하는 것은 아닙니다.

모델이 특정 컨텍스트에서 작동하도록 하려면 모든 매개변수를 변경하여 많은 재훈련이 필요할 수 있습니다. 이러한 모델의 매개변수 수가 많기 때문에 이러한 재훈련은 비용과 시간이 많이 소요됩니다. LoRA는 모델을 재훈련하지 않고도 빠르게 조정할 수 있는 방법을 제공합니다.

예를 들어, GPT-3 모델을 완전히 미세 조정하려면 훈련 데이터 세트의 크기 때문에 1,750억 개의 매개변수를 훈련해야 합니다. LoRA를 사용하면 GPT-3에 대한 훈련 가능한 매개변수를 약 1,800만 개의 매개변수로 줄일 수 있으며, 이를 통해 GPU 메모리 요구 사항을 약 2/3로 줄일 수 있습니다.

LoRA만이 효율적인 미세 조정 방법은 아닙니다. LoRA의 변형으로는 고정밀 컴퓨팅 기술과 저정밀 스토리지 방식을 결합한 미세 조정 기술인 양자화 LoRA(QLoRA)가 있습니다. 이렇게 하면 모델 크기를 작게 유지하면서도 여전히 높은 성능과 정확성을 유지할 수 있습니다.