دعونا نفهم مهمة تحليل المشاعر التي تقدِّم شرحًا واضحًا لآلية الضبط الفوري وفوائده. لنفترض أن الهدف هو تكييف نموذج يحتوي على 175 مليار مَعلمة لتصنيف مراجعات الأفلام إلى "إيجابية" أو "سلبية". سيكون نهج الضبط الدقيق الكامل مكلِّفًا وبطيئًا للغاية. عند استخدام الضبط الفوري، تكون العملية كما يلي:
ابدأ بنموذج مدرَّب مسبقًا ومجمَّد: يظل العمود الفقري للنموذج الذي يحتوي على 175 مليار مَعلمة دون أي تعديل، محافظًا على مخزونه الكبير من المعرفة العامة المكتسبة أثناء التدريب المسبق.5
إضافة مطالبات ليّنة: يتم إرفاق مجموعة صغيرة من المتجهات القابلة للتدريب (مثل 20 رمزًا مميزًا افتراضيًا) بتضمينات الإدخال لكل تقييم فيلم. هذه المتجهات ليست نصوصًا قابلة للقراءة من قِبَل البشر؛ فهي تضمينات متواصلة موجودة في نفس الفضاء عالي الأبعاد الذي يحتوي على مفردات النموذج (على سبيل المثال، فضاء ذو 12,288 بُعدًا لنموذج بهذا الحجم). من خلال التحسين، تتعلم هذه المتجهات ترميز إشارة مستمرة خاصة بالمهمة توجِّه سلوك النموذج.
تغذية الإدخال: على سبيل المثال،
[مطالبات ليّنة] كان الفيلم رائعًا تمامًا!
في هذا المثال، لنفترض أننا نهيئ 20 رمزًا مميزًا افتراضيًا كمطالبة ليّنة لمهمة تحليل المشاعر. بعد التدريب، قد يبدو الإدخال بهذا الشكل داخليًا:
[<v1>, <v2>, <v3>, ... <v20>, The, movie, was, absolutely, fantastic, !]
هنا، كل v1 هو متجه مطالبة عالي الأبعاد. الهدف من التدريب هو العثور على القيم المُثلى للمتجهات التي توجِّه النموذج المتجمد لتصنيف مشاعر النص اللاحق بشكل صحيح.
تدريب المطالبات الليّنة فقط: باستخدام مجموعة البيانات المصنَّفة من التقييمات، تبدأ عملية التدريب. من خلال الانتشار الخلفي، يتم حساب تدرّج الخطأ ولكن خطوة التحسين تعمل فقط على تحديث مَعلمات تضمينات المطالبات الليّنة. هذه الطريقة تتضمن ضبط عدد قليل من المَعلمات يبلغ بضعة آلاف فقط، بدلًا من 175 مليار وزن للنموذج.5
النشر بشكل معياري: بمجرد اكتمال التدريب، تشكِّل المجموعة الناتجة المكوَّنة من 20 متجهًا التكيف الخاص بالمهمة بأكمله. لتكييف نموذج الأساس نفسه لمهمة مختلفة، مثل كشف الرسائل المزعجة، يكفي تدريب مجموعة جديدة من المطالبات الليّنة على مجموعة بيانات الرسائل المزعجة واستبدالها عند وقت الاستنتاج.
توفِّر هذه التقنية فوائد كبيرة من حيث الكفاءة. بدلًا من تخزين نسخة كاملة منفصلة من النموذج لكل مهمة -حيث قد يحتاج نموذج مكوَّن من 175 مليار مَعلمة إلى ما يصل إلى 350 جيجابايت- يكفي تخزين مَعلمات المطالبات الخاصة بالمهمة، والتي قد تكون بحجم بضعة كيلوبايت فقط.1 هذه المرونة تجعل ضبط المطالبات حلًا عمليًا وذا تكلفة فعَّالة لتكييف النماذج على نطاق واسع.2