ما المقصود بنقل التعلم؟

المؤلفين

Jacob Murel Ph.D.

Senior Technical Content Creator

Eda Kavlakoglu

Business Development + Partnerships

IBM Research

ما المقصود بالتعلم بالنقل؟

التعلم بالنقل هو أسلوب للتعلم الآلي يتم فيه استخدام المعرفة المكتسبة من خلال مهمة أو مجموعة بيانات واحدة لتحسين أداء النموذج في مهمة أخرى ذات صلة و/أو مجموعة بيانات مختلفة.1 بمعنى آخر، يستخدم التعلم بالنقل ما تم تعلمه في منطقة واحدة لتحسين التعميم في منطقة أخرى.2

التعلم بالنقل له العديد من التطبيقات، بدءًا من حل مشكلات الانحدار في علوم البيانات إلى تدريب نماذج التعلم العميق. في الواقع، إنه جذاب بشكل خاص للحالة الأخيرة نظرًا للكمية الكبيرة من البيانات اللازمة لإنشاء شبكات عصبية عميقة.

تبني عمليات التعلم التقليدية نموذجًا جديدًا لكل مهمة جديدة، بناءً على البيانات المصنَّفة المتاحة. وهذا لأن خوارزميات التعلم الآلي التقليدية تفترض أن بيانات التدريب والاختبار تأتي من مساحة السمات نفسه، وبالتالي إذا تغير توزيع البيانات، أو تم تطبيق النموذج المدرَّب على مجموعة بيانات جديدة، يجب على المستخدمين إعادة تدريب نموذج جديد من الصفر، حتى عند محاولة تنفيذ مهمة مماثلة للمهمة التي نفذها النموذج الأول (على سبيل المثال، نموذج تصنيف تحليل المشاعر لتقييمات الأفلام وتقييمات الأغاني). ومع ذلك، فإن خوارزميات نقل التعلم تأخذ النماذج أو الشبكات المدرَّبة بالفعل كنقطة انطلاق. ثم تطبِّق معرفة هذا النموذج المكتسبة في مهمة أو بيانات مصدر أولية (على سبيل المثال، تصنيف تقييمات الأفلام) على مهمة أو بيانات مستهدفة جديدة ولكنها ذات صلة (على سبيل المثال، تصنيف تقييمات الأغاني).3

أحدث اتجاهات الذكاء الاصطناعي، يقدمها لك الخبراء

احصل على رؤى منسقة حول أهم أخبار الذكاء الاصطناعي وأكثرها إثارةً للاهتمام. اشترِك في خدمة رسائل Think الإخبارية الأسبوعية. راجع بيان الخصوصية لشركة IBM.

شكرًا لك! لقد اشتركت بنجاح.

سيتم تسليم اشتراكك باللغة الإنجليزية. ستجد رابط إلغاء الاشتراك في كل رسالة إخبارية. يمكنك إدارة اشتراكاتك أو إلغاء اشتراكك هنا. راجع بيان خصوصية IBM لمزيد من المعلومات.

مزايا نقل التعلم وعيوبه

المزايا

  • التكاليف الحسابية. يقلِّل التعلم بالنقل من التكاليف الحسابية المطلوبة لبناء نماذج للمشكلات الجديدة. فمن خلال إعادة استخدام النماذج أو الشبكات المدرَّبة مسبقًا لمعالجة مهمة مختلفة، يمكن للمستخدمين تقليل مقدار وقت تدريب النموذج وبيانات التدريب ووحدات المعالج والموارد الحاسوبية الأخرى. على سبيل المثال، قد يتطلب الوصول إلى معدل تعلم محدد عددًا أقل من العصور، أي التمريرات عبر مجموعة البيانات. وبهذه الطريقة، يستطيع التعلم بالنقل تسريع عمليات تدريب النماذج وتبسيطها.

  • حجم مجموعة البيانات. يساعد التعلم بالنقل بشكل خاص على تخفيف الصعوبات المرتبطة بالحصول على مجموعات بيانات كبيرة. على سبيل المثال، تتطلب النماذج اللغوية الكبيرة (LLMs) كميات كبيرة من بيانات التدريب للحصول على الأداء الأمثل. يمكن أن تكون مجموعات البيانات العامة ذات الجودة العالية محدودة، كما أنَّ إنتاج كمية كافية من البيانات المصنَّفة يدويًا قد يستغرق وقتًا طويلًا ويكلِّف الكثير.

  • التعميم. يساعد التعلم بالنقل على تحسين النموذج، ويمكنه أن يزيد أيضًا من قابلية تعميم النموذج. ولأن التعلم بالنقل يتضمن إعادة تدريب نموذج موجود بمجموعة بيانات جديدة، فإن النموذج المُعاد تدريبه سيتألف من المعرفة المكتسبة من مجموعات بيانات متعددة. ومن المحتمل أن يُظهر أداءً أفضل على مجموعة أوسع من البيانات مقارنةً بنموذج الأساس الأول الذي تم تدريبه على نوع واحد فقط من مجموعة البيانات. وبالتالي يمكن أن يمنع التعلم بالنقل الإفراط في التخصيص.4

بطبيعة الحال، لا يمكن لنقل المعرفة من مجال إلى آخر أن يعوض الأثر السلبي للبيانات الرديئة. ولا تزال تقنيات المعالجة المسبقة وهندسة الميزات، مثل زيادة البيانات واستخراج الميزات، ضرورية عند استخدام التعلم التحويلي.

العيوب

المشكلة لا تكمن كثيرًا في وجود عيوب جوهرية في نقل التعلم، بقدر ما تكمن في العواقب السلبية المحتملة الناتجة عن سوء تطبيقه. يعمل نقل التعلم بشكل أفضل عند استيفاء ثلاثة شروط:

  • أن تكون كلتا مهمتَي التعلم متشابهتين

  • ألا تختلف توزيعات البيانات في مجموعتَي البيانات الأصلية والمستهدفة بشكل كبير

  • أن يكون من الممكن تطبيق نموذج مشابه على كلتا المهمتين

عند عدم تحقيق هذه الشروط، يمكن أن يؤثر نقل التعلم سلبًا في أداء النموذج. وفي سياق نقل التعلم، يُستخدَم مصطلح النقل السلبي للإشارة إلى هذه الظاهرة. البحث المستمر يشير إلى مجموعة من الاختبارات لمعرفة ما إذا كانت المجموعات والمهام تتوافق مع الشروط أعلاه، وبالتالي لن تؤدي إلى نقل سلبي.5 ويُعَد النقل البعيد أحد أنواع الحلول المطورة لتصحيح النقل السلبي الناتج عن اختلاف كبير في توزيعات البيانات بين مجموعات بيانات المصدر والمستهدفة.6

لاحظ أنه لا يوجد معيار موحَّد أو شائع لتحديد مدى التشابه بين المهام في نقل التعلم. بعض الدراسات تقترح طرق مختلفة لتقييم التنبؤات حول التشابهات بين مجموعات البيانات ومهام التعلم الآلي لتحديد مدى جدوى نقل التعلم.7

أكاديمية الذكاء الاصطناعي

تسخير الذكاء الاصطناعي في العمل لخدمة العملاء

اكتشف كيف يمكن للذكاء الاصطناعي التوليدي إدخال السرور على العملاء من خلال تقديم تجربة أكثر سلاسة وزيادة إنتاجية المؤسسة في هذه المجالات الثلاثة الرئيسية: الخدمة الذاتية، والوكلاء البشريين، وعمليات مركز الاتصال.

أنواع التعلم الانتقالي

هناك ثلاث ممارسات أو إعدادات فرعية متجاورة في نقل التعلم. واختلافات هذه الممارسات عن بعضها—وكذلك نقل التعلم على نطاق أوسع—ينتج إلى حد كبير عن التغييرات في العلاقة بين النطاق المصدر والنطاق المستهدف والمهام التي يتعين إكمالها.8

  • النقل الاستقرائي. يُشير هذا إلى الحالة التي تختلف فيها المهمة المصدر عن المهمة المستهدفة، بغض النظر عن أي اختلاف أو تشابه بين النطاقات المصدر والنطاق المستهدف (أي مجموعات البيانات). يمكن أن يظهر هذا في نماذج رؤية الكمبيوتر عندما يتم استخدام هياكل مدرَّبة مسبقًا لاستخراج السمات من مجموعات بيانات كبيرة، ثم تُعتمد هذه الهياكل للتدريب الإضافي على مهمة معينة، مثل اكتشاف الكائنات. التعلم متعدد المهام، الذي يتكون من تعلُّم مهمتين مختلفتين في وقت واحد (مثل تصنيف الصور واكتشاف الكائنات) على نفس مجموعة البيانات، يمكن اعتباره شكلًا من أشكال النقل الاستقرائي.9

  • التعلم غير الخاضع للإشراف. هذا النوع مشابه للنقل الاستقرائي، إذ تختلف المهمة المصدر عن المهمة المستهدفة. ولكن في النقل الاستقرائي، غالبًا ما يتم تصنيف البيانات المصدر و/أو البيانات المستهدفة. وفقًا لاسمه، فإن التعلم بالنقل غير الخاضع للإشراف هو تعلم غير خاضع للإشراف، ما يعني عدم وجود بيانات مصنفة يدويًا.10 وبالمقارنة، يمكن اعتبار النقل الاستقرائي تعلمًا خاضعًا للإشراف. ويُعَد الكشف عن الغش من التطبيقات الشائعة للتعلم غير الخاضع للإشراف. فمن خلال تحديد الأنماط الشائعة عبر مجموعة بيانات غير مصنَّفة للمعاملات، يمكن للنموذج أن يتعلم المزيد لتحديد السلوكيات غير الطبيعية باعتبارها عملية احتيال محتملة.

  • النقل الانتقالي. يحدث هذا عندما تتطابق المهمة المصدر والمهمة المستهدفة، ولكن تختلف مجموعات البيانات (أو النطاقات). وبشكل أكثر تحديدًا، عادةً تكون البيانات المصدر مصنَّفة بينما تكون البيانات المستهدفة غير مصنَّفة. التكييف النطاقي هو نوع من أنواع التعلم الانتقالي حيث يتم تطبيق المعرفة المحصَّلة من أداء مهمة على توزيع بيانات واحد نحو نفس المهمة على توزيع بيانات آخر.11 ومثالًا على نقل التعلم الانتقالي هو تطبيق نموذج تصنيف نصوص تم تدريبه واختباره على تقييمات المطاعم لتصنيف تقييمات الأفلام.

نقل التعلم مقابل الضبط الدقيق

يختلف نقل التعلم عن الضبط الدقيق. كلاهما، بلا جدال، يعيد استخدام نماذج التعلم الآلي الموجودة مسبقًا بدلًا من تدريب نماذج جديدة. لكن أوجه التشابه بينهما تكاد تكون مقتصرة على هذا فقط. يشير الضبط الدقيق إلى عملية التدريب الإضافي لنموذج على مجموعة بيانات خاصة بالمهمة لتحسين الأداء في المهمة الأولية المحددة التي تم إنشاء النموذج من أجلها. على سبيل المثال، يمكن إنشاء نموذج كشف كائنات عام باستخدام مجموعات صور ضخمة مثل COCO أو ImageNet، ثم يتم تدريب النموذج الناتج لاحقًا على مجموعة بيانات أصغر ومصنَّفة مخصصة للكشف عن السيارات. وبهذه الطريقة، يقوم المستخدم بضبط دقيق لنموذج الكشف عن الكائنات للكشف عن السيارات. وفي المقابل، يشير نقل التعلم إلى قيام المستخدمين بتكييف نموذج لمشكلة جديدة ذات صلة بدلًا من المشكلة نفسها.

حالات استخدام نقل التعلم

هناك العديد من تطبيقات التعلم بالنقل في إعدادات التعلم الآلي والذكاء الاصطناعي في العالم الحقيقي. يمكن للمطورين وعلماء البيانات استخدام التعلم بالنقل للمساعدة على تنفيذ مجموعة متنوعة من المهام، ودمجه مع أساليب تعلُّم أخرى، مثل التعلم المعزز.

معالجة اللغة الطبيعية

من أبرز المشكلات التي تؤثِّر في نقل التعلم في معالجة اللغة الطبيعية عدم تطابق السمات. يمكن أن يكون للسمات في النطاقات المختلفة معانٍ مختلفة، وبالتالي دلالات مختلفة (على سبيل المثال، مصطلح الضوء الذي يمكن أن يدل على الوزن أو الضوء). ويؤثر هذا التباين في تمثيلات السمات في مهام تصنيف المشاعر والنماذج اللغوية وغيرها. النماذج القائمة على التعلم العميق، ولا سيما تضمينات الكلمات، تشير إلى أنها تملك إمكانات كبيرة في تصحيح هذه المشكلة من خلال استيعاب العلاقات والمعاني اللغوية الدقيقة لمهام تكييف النطاق.12

رؤية الكمبيوتر

بسبب الصعوبات في الحصول على بيانات كافية مصنَّفة يدويًا لمهام رؤية الكمبيوتر المتنوعة، تدرس مجموعة كبيرة من الأبحاث تطبيقات التعلم بالنقل باستخدام الشبكات العصبية التلافيفية (CNNs). ومن الأمثلة البارزة على ذلك نموذج ResNet، وهو نموذج هيكلي مدرَّب مسبقًا يُظهر أداءً محسَّنًا في مهام تصنيف الصور والكشف عن الكائنات.13 وتحقِّق الأبحاث الحديثة في استخدام مجموعة بيانات ImageNet الشهيرة لنقل التعلم، مشيرةً إلى أنه (على عكس الاعتقاد الشائع في مجال رؤية الكمبيوتر) يمكن الاكتفاء بجزء صغير من هذه المجموعة لتدريب نماذج قابلة للتعميم بشكل موثوق به.14 يستخدم العديد من دروس التعلم بالنقل في رؤية الكمبيوتر نموذج ResNet أو مجموعة ImageNet، أو كليهما، مع مكتبة Keras في TensorFlow.

حلول ذات صلة
IBM watsonx.ai

تدريب الذكاء الاصطناعي التوليدي والتحقق من صحته وضبطه ونشره، وكذلك قدرات نماذج الأساس والتعلم الآلي باستخدام IBM watsonx.ai، وهو استوديو الجيل التالي من المؤسسات لمنشئي الذكاء الاصطناعي. أنشئ تطبيقات الذكاء الاصطناعي بسرعة أكبر وببيانات أقل.

اكتشف watsonx.ai
حلول الذكاء الاصطناعي

استفد من الذكاء الاصطناعي في عملك بالاستعانة بخبرة IBM الرائدة في مجال الذكاء الاصطناعي ومحفظة حلولها المتوفرة لك.

استكشف حلول الذكاء الاصطناعي
الاستشارات والخدمات المتعلقة بالذكاء الاصطناعي

أعدّ ابتكار عمليات ومهام سير العمل الحساسة بإضافة الذكاء الاصطناعي لتعزيز التجارب وصنع القرارات في الوقت الفعلي والقيمة التجارية.

استكشف خدمات الذكاء الاصطناعي
اتخِذ الخطوة التالية

احصل على وصول شامل إلى القدرات التي تغطي دورة حياة تطوير الذكاء الاصطناعي. تمكَّن من إنتاج حلول ذكاء اصطناعي قوية بفضل الواجهات سهلة الاستخدام وعمليات سير العمل السلسة وإمكانية الوصول إلى واجهات برمجة التطبيقات ومجموعات تطوير البرامج القياسية في الصناعة.

استكشف watsonx.ai احجز عرضًا توضيحيًا مباشرًا