أحدث اتجاهات الذكاء الاصطناعي، يقدمها لك الخبراء
احصل على رؤى منسقة حول أهم أخبار الذكاء الاصطناعي وأكثرها إثارةً للاهتمام. اشترِك في خدمة رسائل Think الإخبارية الأسبوعية. راجع بيان الخصوصية لشركة IBM.
في التعلم الآلي، يحدث الإفراط في التخصيص عندما يتطابق النموذج بشكل كبير أو حتى بشكل كامل مع بيانات التدريب الخاصة به، بحيث لا يستطيع إجراء توقعات أو استخلاص استنتاجات دقيقة من أي بيانات أخرى غير بيانات التدريب.
يتعارض الإفراط في التخصيص مع الغرض من نموذج التعلم الآلي. فتعميم النموذج على البيانات الجديدة هو ما يسمح لنا في نهاية المطاف باستخدام خوارزميات التعلم الآلي كل يوم لوضع تنبؤات وتصنيف البيانات.
عندما يتم إنشاء خوارزميات التعلم الآلي، فإنها تستفيد من مجموعة بيانات عيّنة لتدريب النموذج. ومع ذلك، عندما يتدرب النموذج لفترة طويلة جدًا على بيانات العينة أو عندما يكون النموذج معقدًا جدًا، يمكن أن يبدأ في تعلُّم "الضوضاء" أو المعلومات غير ذات الصلة ضمن مجموعة البيانات. عندما يحفظ النموذج الضوضاء ويتخصص بشكل كبير مع مجموعة التدريب، يصبح النموذج "مفرط التخصيص"، ولا يمكنه التعميم بشكل جيد على البيانات الجديدة. وإذا لم يتمكن النموذج من التعميم بشكل جيد على البيانات الجديدة، فلن يكون قادرًا على أداء مهام التصنيف أو التنبؤ التي تم تصميمه من أجلها.
تُعد معدلات الخطأ المنخفضة والتباين العالي مؤشرات واضحة على الإفراط في التخصيص. ومن أجل منع هذا النوع من السلوك، عادةً ما يُنحّى جزء من مجموعة بيانات التدريب جانبًا باعتباره "مجموعة اختبار" للتحقق من عدم وجود إفراط في التخصيص. إذا كانت بيانات التدريب ذات معدل خطأ منخفض وبيانات الاختبار ذات معدل خطأ مرتفع، فهذا يشير إلى الإفراط في التخصيص.
احصل على رؤى منسقة حول أهم أخبار الذكاء الاصطناعي وأكثرها إثارةً للاهتمام. اشترِك في خدمة رسائل Think الإخبارية الأسبوعية. راجع بيان الخصوصية لشركة IBM.
إذا أدى الإفراط في التدريب أو تعقيد النموذج إلى الإفراط في التخصيص، فإن الاستجابة الوقائية المنطقية ستكون إيقاف عملية التدريب مؤقتًا في وقت مبكر، والمعروف أيضًا باسم "التوقف المبكر"، أو تقليل التعقيد في النموذج عن طريق استبعاد المدخلات الأقل أهمية. ومع ذلك، إذا توقفت مؤقتًا في وقت مبكر جدًا أو استبعدت الكثير من الميزات المهمة، فقد تواجه المشكلة المعاكسة، وبدلًا من ذلك، قد تواجه مشكلة نقص تخصيص النموذج الخاص بك. يحدث النقص في التخصيص عندما لا يكون النموذج قد تدرَّب لفترة كافية أو عندما لا تكون متغيّرات المدخلات مهمة بما يكفي لتحديد علاقة ذات مغزى بين متغيّرات المدخلات والمخرجات.
في كِلتا الحالتين، لا يستطيع النموذج تحديد التوجه السائد في مجموعة بيانات التدريب. نتيجةً لذلك، يعاني النقص في التخصيص أيضًا من ضعف القدرة على التعميم على البيانات غير المرئية. ولكن على عكس الإفراط في التخصيص، تشهد النماذج ناقصة التخصيص من تحيّز مرتفع وتباين أقل في تنبؤاتها. يوضِّح الإفراط في التخصيص مقابل النقص في التخصيص مفاضلة التحيز والتباين، التي تحدث عندما يتحول نموذج غير متكيف إلى حالة الإفراط في التخصيص. كلما تعلم النموذج، قلَّت تحيزاته، لكن يمكن أن يزداد التباين عندما يصبح النموذج مفرط التخصيص. عند تخصيص النموذج، يكون الهدف هو العثور على "التوازن المثالي" بين النقص في التخصيص والإفراط في التخصيص، بحيث يمكن أن يضع النموذج توجهًا سائدًا ويطبِّقه على نطاق واسع على مجموعات البيانات الجديدة.
لفهم دقة نماذج التعلم الآلي، من المهم اختبار مدى تخصيص النموذج. يُعد التحقق التبادلي K-fold أحد أكثر الأساليب شيوعًا لتقييم دقة النموذج.
في التحقق التبادلي K-fold، تُقسم البيانات إلى مجموعات فرعية k متساوية الحجم تسمى أيضًا "الطيات". ستكون إحدى الطيات k بمثابة مجموعة اختبار، والمعروفة أيضًا باسم مجموعة الاحتفاظ أو مجموعة التحقق من الصحة، وستدرب الطيات المتبقية النموذج. تتكرر هذه العملية حتى تُستخدم كل طية من الطيات كطية احتفاظ. وبعد كل تقييم، يُحتفظ بالدرجات، وعندما تكتمل كل التكرارات، يُحسب متوسط الدرجات لتقييم أداء النموذج الكلي.
بينما يساعدنا استخدام نموذج خطي على تجنب الإفراط في التخصيص، فإن العديد من المشكلات الواقعية هي مشكلات غير خطية. وبالإضافة إلى فهم كيفية اكتشاف الإفراط في التخصيص، من المهم فهم كيفية تجنب الإفراط في التخصيص من الأساس. فيما يلي عدد من الأساليب التي يمكنك استخدامها لمنع الإفراط في التخصيص:
في حين أن التعريف المذكور أعلاه هو التعريف المعروف للإفراط في التخصيص، تُشير الأبحاث الحديثة إلى أن النماذج المعقدة، مثل نماذج التعلم العميق والشبكات العصبية، تعمل بدقة عالية على الرغم من تدريبها على "التوافق أو الاستيفاء بدقة". تتعارض هذه النتيجة بشكل مباشر مع المؤلفات التاريخية حول هذا الموضوع، وهي تتضح من خلال منحنى مخاطر "الانحدار المزدوج" أدناه. يمكنك ملاحظة أنه عندما يتعلم النموذج ما بعد حد الاستيفاء، يتحسَّن أداء النموذج. ويمكن للطرق التي ذكرناها سابقًا لتجنُّب الإفراط في التخصيص، مثل التوقف المبكر والتنظيم، أن تمنع الاستيفاء.
تدريب الذكاء الاصطناعي التوليدي والتحقق من صحته وضبطه ونشره، وكذلك قدرات نماذج الأساس والتعلم الآلي باستخدام IBM watsonx.ai، وهو استوديو الجيل التالي من المؤسسات لمنشئي الذكاء الاصطناعي. أنشئ تطبيقات الذكاء الاصطناعي بسرعة أكبر وببيانات أقل.
استفد من الذكاء الاصطناعي في عملك بالاستعانة بخبرة IBM الرائدة في مجال الذكاء الاصطناعي ومحفظة حلولها المتوفرة لك.
أعدّ ابتكار عمليات ومهام سير العمل الحساسة بإضافة الذكاء الاصطناعي لتعزيز التجارب وصنع القرارات في الوقت الفعلي والقيمة التجارية.