تركز أساليب التعلم الانتقالي على تكييف نموذج مدرب مسبقًا لتعلم مهام جديدة أو فئات بيانات لم تُشاهد من قبل.
عندما يتوفر عدد قليل من العينات المصنفة، فإن استخدام التعلم الخاضع للإشراف لتدريب نموذج من البداية - خاصة إذا كان النموذج يحتوي على عدد كبير من المعلمات، مثل الشبكات العصبية الالتفافية (CNNs) المستخدمة عادة في رؤية الكمبيوتر أو الشبكات القائمة على المحولات المستخدمة في معالجة اللغة الطبيعية (NLP) - غالبا ما يؤدي إلى الإفراط في التخصيص: حيث يمكن للنموذج تحقيق أداء جيد على بيانات الاختبار، ولكنه يقدم أداءً سيئًا على البيانات الواقعية. ومع ذلك، فإن جمع كمية كافية من البيانات لتجنب الإفراط في التخصيص يشكل تحديًا غالبًا ما يعيق عملية تدريب النموذج.
يوفر التعلم الانتقالي حلًا عمليًا من خلال استغلال الميزات والتمثيلات التي تعلمها النموذج مسبقًا. يتمثل أحد الأساليب البسيطة في الضبط الدقيق لنموذج تصنيف لأداء نفس المهمة لفئة جديدة باستخدام التعلم الخاضع للإشراف على عدد محدود من الأمثلة المصنفة. تستخدم الأساليب الأكثر تعقيدا لتعليم مهارات جديدة من خلال تصميم مهام ملائمة ذات صلة بمهام لاحقة - غالبا ما تكون مهام التعلم الوصفي - وذلك لتدريب نموذج تم تدريبه مسبقا عبر مهام تمهيدية خاضعة للإشراف الذاتي: وهذا أصبح شائعًا بشكل متزايد في معالجة اللغة الطبيعية (NLP)، خاصة في سياق نماذج الأساس.
تعتمد الأساليب الأكثر تعقيدًا للتعلم الانتقالي على تعديل بنية الشبكة العصبية المدربة، مثل استبدال أو إعادة تدريب الطبقات الخارجية للشبكة العصبية، حيث يحدث التصنيف النهائي، مع الحفاظ على الطبقات الداخلية المسؤولة عن استخراج الميزات. تجميد الأوزان النموذجية (أو تنظيم تغييراتها) لجميع الطبقات باستثناء الخارجية منها يمكن أن يضمن أن التحديثات اللاحقة لا تؤدي إلى "نسيان كارثي" للمعرفة المكتسبة بالفعل، مما يتيح تسريع عملية التعلم في سياق يعتمد على عدد محدود من العينات.
يكون التعلم الانتقالي أكثر نجاحًا عندما يكون التدريب الأولي للنموذج ذا صلة بالمهمة الجديدة. على سبيل المثال، النموذج المدرب على أنواع معينة من الطيور سوف يتعمم بشكل جيد على أنواع غير مرئية من الطيور بعد الضبط الدقيق باستخدام عدد قليل من العينات الموسومة، لأن الأوزان التي تعلمتها المرشحات التي تستخدمها الشبكة العصبية الالتفافية (CNN) للالتفافات مُحسّنة بالفعل لاكتشاف الميزات ذات الصلة بتصنيف الطيور (مثل الريش، والمناقير، وحجم الأجنحة، إلخ.) – لكن استخدام التعلم بعدد محدود من العينات لتعليم النموذج نفسه التعرف على المركبات قد يؤدي إلى أداء أقل إرضاءً.