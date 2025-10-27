프롬프트 조정의 메커니즘과 이점에 대한 명확한 설명을 제공하는 감정 분석 작업을 알아보겠습니다. 1,750억 개의 매개변수 모델을 적용하여 영화 후기를 "긍정적" 또는 "부정적"으로 분류하는 것이 목표라고 가정해 보겠습니다. 완전한 미세 조정 접근 방식은 비용이 엄청나게 많이 들고 느립니다. 프롬프트 조정의 프로세스는 다음과 같습니다.



고정되고 사전 학습된 모델로 시작: 175B 매개변수 백본은 완전히 손대지 않은 상태로 유지되어 사전 훈련 중에 학습한 방대한 일반 지식 저장소를 보존합니다.5



프롬프트 추가: 훈련 가능한 벡터의 작은 세트(예: 20개의 토큰)가 모든 영화 후기의 임베딩에 첨부됩니다. 이러한 벡터는 사람이 읽을 수 있는 텍스트가 아닙니다. 이는 모델의 어휘와 동일한 고차원 공간(예: 이 규모의 모델에 대한 12,288차원 공간)에 존재하는 연속 임베딩입니다. 최적화를 통해 이러한 벡터는 모델의 동작을 조종하는 연속적인 작업별 신호를 인코딩하는 방법을 학습합니다.



입력 피드: 예를 들어,

[소프트 프롬프트] 영화 진짜 재미있었어요!

이 예에서는 감정 분석 작업을 위해 20개의 소프트 프롬프트 토큰을 초기화한다고 가정해 보겠습니다. 학습 후 입력은 내부적으로 다음과 같을 수 있습니다.

[<v1>, <v2>, <v3>, ... <v20>, The, movie, was, absolutely, fantastic, !]

여기서 각 v1은 학습된 고차원 프롬프트 벡터입니다. 훈련의 목표는 동결된 모델이 후속 텍스트의 감정을 올바르게 분류하도록 안내하는 벡터에 대한 최적 값을 찾는 것입니다.



소프트 프롬프트만 학습: 레이블이 지정된 영화 리뷰 데이터 세트를 사용하여 훈련 프로세스가 시작됩니다. 역전파(Backpropagation)를 통해 오차 그래디언트가 계산되지만, 최적화 단계에서는 소프트 프롬프트 임베딩의 매개변수만 업데이트됩니다. 이 접근 방식에는 모델의 1,750억 가중치 대신 수천 개의 매개변수만 조정하는 것이 포함됩니다.5



모듈식으로 배포: 학습이 완료되면 결과 20개의 벡터 세트가 전체 작업별 적응을 구성합니다. 스팸 감지와 같은 다른 작업에 동일한 기본 모델을 적용하려면 스팸 데이터 세트에서 새로운 프롬프트 세트를 간단히 학습시키고 추론 시간에 이를 교체하면 됩니다.



이 기법은 효율성 측면에서 상당한 이점을 제공합니다. 각 작업에 대해 모델의 별도 전체 사본을 저장하는 대신(175B 매개변수 모델은 최대 350GB가 필요할 수 있음) 작업별 프롬프트 매개변수를 저장하면 되며, 이러한 매개변수의 크기는 몇 KB에 불과할 수 있습니다.1 이러한 모듈성 덕분에 프롬프트 조정은 대규모 모델 적응을 위한 실용적이고 비용 효율적인 솔루션이 됩니다.2