ما المقصود بالإفراط في التخصيص؟

في التعلم الآلي، يحدث الإفراط في التخصيص عندما يتطابق النموذج بشكل كبير أو حتى بشكل كامل مع بيانات التدريب الخاصة به، بحيث لا يستطيع إجراء توقعات أو استخلاص استنتاجات دقيقة من أي بيانات أخرى غير بيانات التدريب.

يتعارض الإفراط في التخصيص مع الغرض من نموذج التعلم الآلي. فتعميم النموذج على البيانات الجديدة هو ما يسمح لنا في نهاية المطاف باستخدام خوارزميات التعلم الآلي كل يوم لوضع تنبؤات وتصنيف البيانات.

عندما يتم إنشاء خوارزميات التعلم الآلي، فإنها تستفيد من مجموعة بيانات عيّنة لتدريب النموذج. ومع ذلك، عندما يتدرب النموذج لفترة طويلة جدًا على بيانات العينة أو عندما يكون النموذج معقدًا جدًا، يمكن أن يبدأ في تعلُّم "الضوضاء" أو المعلومات غير ذات الصلة ضمن مجموعة البيانات. عندما يحفظ النموذج الضوضاء ويتخصص بشكل كبير مع مجموعة التدريب، يصبح النموذج "مفرط التخصيص"، ولا يمكنه التعميم بشكل جيد على البيانات الجديدة. وإذا لم يتمكن النموذج من التعميم بشكل جيد على البيانات الجديدة، فلن يكون قادرًا على أداء مهام التصنيف أو التنبؤ التي تم تصميمه من أجلها.

تُعد معدلات الخطأ المنخفضة والتباين العالي مؤشرات واضحة على الإفراط في التخصيص. ومن أجل منع هذا النوع من السلوك، عادةً ما يُنحّى جزء من مجموعة بيانات التدريب جانبًا باعتباره "مجموعة اختبار" للتحقق من عدم وجود إفراط في التخصيص. إذا كانت بيانات التدريب ذات معدل خطأ منخفض وبيانات الاختبار ذات معدل خطأ مرتفع، فهذا يشير إلى الإفراط في التخصيص.

أحدث اتجاهات الذكاء الاصطناعي، يقدمها لك الخبراء

احصل على رؤى منسقة حول أهم أخبار الذكاء الاصطناعي وأكثرها إثارةً للاهتمام. اشترِك في خدمة رسائل Think الإخبارية الأسبوعية. راجع بيان الخصوصية لشركة IBM.

مقارنة بين الإفراط في التخصيص والقصور في التخصيص

إذا أدى الإفراط في التدريب أو تعقيد النموذج إلى الإفراط في التخصيص، فإن الاستجابة الوقائية المنطقية ستكون إيقاف عملية التدريب مؤقتًا في وقت مبكر، والمعروف أيضًا باسم "التوقف المبكر"، أو تقليل التعقيد في النموذج عن طريق استبعاد المدخلات الأقل أهمية. ومع ذلك، إذا توقفت مؤقتًا في وقت مبكر جدًا أو استبعدت الكثير من الميزات المهمة، فقد تواجه المشكلة المعاكسة، وبدلًا من ذلك، قد تواجه مشكلة نقص تخصيص النموذج الخاص بك. يحدث النقص في التخصيص عندما لا يكون النموذج قد تدرَّب لفترة كافية أو عندما لا تكون متغيّرات المدخلات مهمة بما يكفي لتحديد علاقة ذات مغزى بين متغيّرات المدخلات والمخرجات.

في كِلتا الحالتين، لا يستطيع النموذج تحديد التوجه السائد في مجموعة بيانات التدريب. نتيجةً لذلك، يعاني النقص في التخصيص أيضًا من ضعف القدرة على التعميم على البيانات غير المرئية. ولكن على عكس الإفراط في التخصيص، تشهد النماذج ناقصة التخصيص من تحيّز مرتفع وتباين أقل في تنبؤاتها. يوضِّح الإفراط في التخصيص مقابل النقص في التخصيص مفاضلة التحيز والتباين، التي تحدث عندما يتحول نموذج غير متكيف إلى حالة الإفراط في التخصيص. كلما تعلم النموذج، قلَّت تحيزاته، لكن يمكن أن يزداد التباين عندما يصبح النموذج مفرط التخصيص. عند تخصيص النموذج، يكون الهدف هو العثور على "التوازن المثالي" بين النقص في التخصيص والإفراط في التخصيص، بحيث يمكن أن يضع النموذج توجهًا سائدًا ويطبِّقه على نطاق واسع على مجموعات البيانات الجديدة.

Mixture of Experts | 12 ديسمبر، الحلقة 85

فك تشفير الذكاء الاصطناعي: تقرير إخباري أسبوعي

انضمّ إلى نخبة من المهندسين والباحثين وقادة المنتجات وغيرهم من الخبراء وهم يقدّمون أحدث الأخبار والرؤى حول الذكاء الاصطناعي، بعيدًا عن الضجيج الإعلامي.

شاهد جميع حلقات برنامج Mixture of Experts

كيفية اكتشاف النماذج المفرطة التخصيص

لفهم دقة نماذج التعلم الآلي، من المهم اختبار مدى تخصيص النموذج. يُعد التحقق التبادلي K-fold أحد أكثر الأساليب شيوعًا لتقييم دقة النموذج.

في التحقق التبادلي K-fold، تُقسم البيانات إلى مجموعات فرعية k متساوية الحجم تسمى أيضًا "الطيات". ستكون إحدى الطيات k بمثابة مجموعة اختبار، والمعروفة أيضًا باسم مجموعة الاحتفاظ أو مجموعة التحقق من الصحة، وستدرب الطيات المتبقية النموذج. تتكرر هذه العملية حتى تُستخدم كل طية من الطيات كطية احتفاظ. وبعد كل تقييم، يُحتفظ بالدرجات، وعندما تكتمل كل التكرارات، يُحسب متوسط الدرجات لتقييم أداء النموذج الكلي.

كيفية تجنب الإفراط في التخصيص

بينما يساعدنا استخدام نموذج خطي على تجنب الإفراط في التخصيص، فإن العديد من المشكلات الواقعية هي مشكلات غير خطية. وبالإضافة إلى فهم كيفية اكتشاف الإفراط في التخصيص، من المهم فهم كيفية تجنب الإفراط في التخصيص من الأساس. فيما يلي عدد من الأساليب التي يمكنك استخدامها لمنع الإفراط في التخصيص:

التوقف المبكر: كما ذكرنا سابقًا، تسعى هذه الطريقة إلى إيقاف التدريب مؤقتًا قبل أن يبدأ النموذج في تعلُّم الضوضاء داخل النموذج. يخاطر هذا النهج بإيقاف عملية التدريب في وقت مبكر جدًا، ما يؤدي إلى مشكلة عكسية تتمثل في النقص في التخصيص. والهدف النهائي هنا هو العثور على "التوازن المثالي" بين النقص في التخصيص والإفراط في التخصيص.
التدريب باستخدام المزيد من البيانات: يمكن أن يؤدي توسيع مجموعة التدريب لتشمل المزيد من البيانات إلى زيادة دقة النموذج من خلال توفير المزيد من الفرص لتحليل العلاقة السائدة بين متغيّرات المدخلات والمخرجات. ومع ذلك، فإن هذه الطريقة تكون أكثر فاعلية عند إدخال بيانات سليمة وذات صلة في النموذج. وإلا فإنك قد تستمر في إضافة المزيد من التعقيد إلى النموذج، ما يؤدي إلى الإفراط في التخصيص.
تعزيز البيانات: في حين أنه من الأفضل إدخال بيانات سليمة وذات صلة في بيانات التدريب الخاصة بك، فإنه في بعض الأحيان تُضاف بيانات مشوشة لجعل النموذج أكثر استقرارًا. ومع ذلك، يجب استخدام هذه الطريقة بحذر.
اختيار الميزات: عند إنشاء نموذج، سيكون لديك عدد من المَعلمات أو الميزات التي تُستخدم للتنبؤ بنتيجة معينة، ولكن في كثير من الأحيان، قد تكون هذه الميزات مكررة. اختيار الميزات هو عملية تحديد أهم الميزات في بيانات التدريب ثم التخلص من الميزات غير ذات الصلة أو الزائدة عن الحاجة. عادةً ما يُخلط بين هذا المفهوم وتقليل الأبعاد، ولكنهما مختلفان. ومع ذلك، تساعد كِلتا الطريقتين على تبسيط نموذجك لتحديد التوجه السائد في البيانات.
التنظيم: إذا حدث الإفراط في التخصيص عندما يكون النموذج معقدًا للغاية، فمن المنطقي بالنسبة إلينا تقليل عدد الميزات. ولكن ماذا لو لم نكن نعرف المدخلات التي يجب إزالتها في أثناء عملية اختيار الميزات؟ إذا كنا لا نعرف الميزات التي يجب إزالتها من نموذجنا، فقد تكون طرق التنظيم مفيدة بشكل خاص.

يطبِّق التنظيم "عقوبة" على مَعلمات المدخلات ذات القيم الأكبر، ما يَحُدّ لاحقًا من مقدار التباين في النموذج. وفي حين أن هناك عددًا من طرق التنظيم، مثل تنظيم لاسو وانحدار ريدج والإسقاط، فإنها تسعى كلها إلى تحديد الضوضاء وتقليلها داخل البيانات.
طرق التجميع: تتكون طرق التعلم التجميعي من مجموعة من المصنِّفات - على سبيل المثال: أشجار القرار والتي يتم تجميع توقعاتها لتحديد النتائج الأكثر شيوعًا. أكثر طرق التجميع شهرة هي التعبئة والتعزيز. في التعبئة، يتم تحديد عينة عشوائية من البيانات في مجموعة تدريب مع الاستبدال - ما يعني أنه يمكن اختيار نقاط البيانات الفردية أكثر من مرة. ثم بعد إنشاء العديد من عيّنات البيانات، يتم تدريب هذه النماذج بشكل مستقل، اعتمادًا على نوع المهمة، مثل الانحدار أو التصنيف، ثم ينتج عن متوسط تلك التوقعات أو معظمها تقديرٌ أكثر دقة. يُستخدم هذا عادةً لتقليل التباين ضمن مجموعة بيانات مليئة بالضوضاء.

الأبحاث الحديثة

في حين أن التعريف المذكور أعلاه هو التعريف المعروف للإفراط في التخصيص، تُشير الأبحاث الحديثة إلى أن النماذج المعقدة، مثل نماذج التعلم العميق والشبكات العصبية، تعمل بدقة عالية على الرغم من تدريبها على "التوافق أو الاستيفاء بدقة". تتعارض هذه النتيجة بشكل مباشر مع المؤلفات التاريخية حول هذا الموضوع، وهي تتضح من خلال منحنى مخاطر "الانحدار المزدوج" أدناه. يمكنك ملاحظة أنه عندما يتعلم النموذج ما بعد حد الاستيفاء، يتحسَّن أداء النموذج. ويمكن للطرق التي ذكرناها سابقًا لتجنُّب الإفراط في التخصيص، مثل التوقف المبكر والتنظيم، أن تمنع الاستيفاء.

علم البيانات وعمليات التعلم الآلي لقادة البيانات

تعاوَن مع قادة آخرين لتعزيز الركائز الثلاث الأساسية لعمليات التعلم الآلي (MLOps) والذكاء الاصطناعي الجدير بالثقة: الثقة في البيانات والثقة في النماذج والثقة في العمليات.

الموارد

طوِّر مستوى خبرتك في التعلم الآلي

تعلّم المفاهيم الأساسية وطوّر مهاراتك من خلال المختبرات العملية والدورات التدريبية والمشاريع الموجهة والتجارب وغيرها.

أطلق العنان لقوة الذكاء الاصطناعي التوليدي والتعلم الآلي (ML)

تعرّف على كيفية دمج الذكاء الاصطناعي التوليدي والتعلّم الآلي بثقة في أعمالك

شرح التعلم الآلي

يشرح كتاب Techsplainers من IBM أساسيات التعلم الآلي، من المفاهيم الرئيسية إلى حالات الاستخدام الواقعية. حلقات واضحة وقصيرة تساعدك على تعلُّم الأساسيات بسرعة.

التفعيل المثمر للذكاء الاصطناعي: جني الأرباح وعائد الاستثمار باستخدام الذكاء الاصطناعي التوليدي

هل ترغب في زيادة عائد استثماراتك في الذكاء الاصطناعي؟ تعرّف على كيفية تأثير توسيع نطاق الذكاء الاصطناعي التوليدي في المجالات الرئيسية، من خلال مساعدة أفضل العقول لديك على وضع حلول مبتكرة جديدة وطرحها.

كيفية اختيار نموذج الأساس المناسب

تعرّف على كيفية اختيار نموذج أساس الذكاء الاصطناعي الأكثر ملاءمة لحالة الاستخدام الخاصة بك.

استكشف IBM Granite

تُعَد IBM® Granite مجموعة من نماذج الذكاء الاصطناعي المفتوحة والموثوق بها وذات الأداء العالي والتي تم تصميمها خصيصًا للأعمال وجرى الارتقاء بها على النحو الأمثل لتوسيع نطاق تطبيقات الذكاء الاصطناعي لديك. استكشِف خيارات اللغة والتعليمات البرمجية والسلاسل الزمنية وآليات الحماية.

كيف تزدهر في عصر الذكاء الاصطناعي الجديد بثقة وثبات

تعمّق في العناصر الثلاثة ذات الأهمية البالغة لإستراتيجية الذكاء الاصطناعي القوية: إنشاء ميزة تنافسية، وتوسيع نطاق الذكاء الاصطناعي عبر الأعمال، وتطوير الذكاء الاصطناعي الجدير بالثقة.

حلول ذات صلة

IBM watsonx.ai

تدريب الذكاء الاصطناعي التوليدي والتحقق من صحته وضبطه ونشره، وكذلك قدرات نماذج الأساس والتعلم الآلي باستخدام IBM watsonx.ai، وهو استوديو الجيل التالي من المؤسسات لمنشئي الذكاء الاصطناعي. أنشئ تطبيقات الذكاء الاصطناعي بسرعة أكبر وببيانات أقل.

اكتشف watsonx.ai

حلول الذكاء الاصطناعي

استفد من الذكاء الاصطناعي في عملك بالاستعانة بخبرة IBM الرائدة في مجال الذكاء الاصطناعي ومحفظة حلولها المتوفرة لك.

استكشف حلول الذكاء الاصطناعي

الاستشارات والخدمات المتعلقة بالذكاء الاصطناعي

أعدّ ابتكار عمليات ومهام سير العمل الحساسة بإضافة الذكاء الاصطناعي لتعزيز التجارب وصنع القرارات في الوقت الفعلي والقيمة التجارية.

استكشف خدمات الذكاء الاصطناعي

اتخِذ الخطوة التالية

احصل على وصول شامل إلى القدرات التي تغطي دورة حياة تطوير الذكاء الاصطناعي. تمكَّن من إنتاج حلول ذكاء اصطناعي قوية بفضل الواجهات سهلة الاستخدام وعمليات سير العمل السلسة وإمكانية الوصول إلى واجهات برمجة التطبيقات ومجموعات تطوير البرامج القياسية في الصناعة.

ما المقصود بالإفراط في التخصيص؟