ما هو نقص التجهيز؟

أحدث اتجاهات الذكاء الاصطناعي، يقدمها لك الخبراء

احصل على رؤى منسقة حول أهم أخبار الذكاء الاصطناعي وأكثرها إثارةً للاهتمام. اشترِك في خدمة رسائل Think الإخبارية الأسبوعية. راجع بيان الخصوصية لشركة IBM.

شكرًا لك! لقد اشتركت بنجاح.

سيتم تسليم اشتراكك باللغة الإنجليزية. ستجد رابط إلغاء الاشتراك في كل رسالة إخبارية. يمكنك إدارة اشتراكاتك أو إلغاء اشتراكك هنا. راجع بيان خصوصية IBM لمزيد من المعلومات.

ما هو نقص التجهيز؟

نقص التجهيز هو سيناريو في علم البيانات حيث يكون نموذج البيانات غير قادر على التقاط العلاقة بين متغيرات الإدخال والمخرجات بدقة، مما يولد معدل خطأ مرتفع على كل من مجموعة التدريب والبيانات غير المرئية.

يحدث النقص في التكيف عندما يكون النموذج بسيطًا جدًا، وقد يكون ذلك نتيجة حاجة النموذج إلى مزيد من وقت التدريب أو المزيد من الميزات أو تقليل التنظيم.

مثل الإفراط في التخصيص، عندما يكون النموذج غير مجهز بشكل كافٍ، فإنه لا يمكنه تحديد التوجه السائد داخل البيانات، ما يؤدي إلى أخطاء في التدريب وضعف أداء النموذج. إذا لم يستطع النموذج التعميم جيدًا على بيانات جديدة، فلن يكون قابلًا للاستخدام في مهام التصنيف أو التنبؤ. فالتعميم للنموذج على بيانات جديدة هو ما يُتيح لنا في النهاية استخدام خوارزميات التعلم الآلي يوميًا لإجراء التنبؤات وتصنيف البيانات.

يعد التحيز العالي والتباين المنخفض من المؤشرات الواضحة على نقص التجهيز. نظرًا لأن هذا السلوك يمكن رؤيته أثناء استخدام مجموعة بيانات التدريب، عادةً ما يكون تحديد النماذج ناقصة التجهيز أسهل من تحديد النماذج زائدة التجهيز.

Mixture of Experts | 28 أغسطس، الحلقة 70

فك تشفير الذكاء الاصطناعي: تقرير إخباري أسبوعي

انضمّ إلى نخبة من المهندسين والباحثين وقادة المنتجات وغيرهم من الخبراء وهم يقدّمون أحدث الأخبار والرؤى حول الذكاء الاصطناعي، بعيدًا عن الضجيج الإعلامي.

نقص التجهيز مقابل التجهيز الزائد

ببساطة، التجهيز الزائد هو عكس نقص التجهيز، ويحدث عندما يتم تدريب النموذج بشكل مفرط أو عندما يحتوي على قدر كبير جدًا من التعقيد، مما يؤدي إلى معدلات خطأ عالية في بيانات الاختبار. يعد التجهيز الزائد للنموذج أكثر شيوعًا من نقص تجهيز النموذج، ويحدث نقص التجهيز عادة في محاولة لتجنب التجهيز الزائد من خلال عملية تسمى "التوقف المبكر".

إذا كان نقص التدريب أو عدم التعقيد يؤدي إلى نقص التخصيص، فإن استراتيجية المنع المنطقية ستكون زيادة مدة التدريب أو إضافة المزيد من المدخلات ذات الصلة. ومع ذلك، إذا قمت بتدريب النموذج أكثر من اللازم أو أضفت الكثير من السمات إليه، فقد تفرط في تعديل نموذجك، ما يؤدي إلى تحيّز منخفض ولكن تباين كبير (أي مفاضلة التحيّز والتباين). في هذا السيناريو، يتطابق النموذج الإحصائي بشكل كبير مع بيانات التدريب، ما يجعله غير قادر على التعميم بشكل جيد على نقاط بيانات جديدة. من المهم ملاحظة أن بعض أنواع النماذج قد تكون أكثر عرضة للإفراط في التخصيص من غيرها، مثل أشجار القرار أو KNN.

قد يكون تحديد التجهيز الزائد أكثر صعوبة من نقص التجهيز لأنه على عكس التجهيز الناقص، تعمل بيانات التدريب بدقة عالية في نموذج زائد التجهيز. لتقييم دقة خوارزمية ما، تُستخدم عادةً تقنية تُعرف باسم التحقق المتقاطع k-fold.

في التحقق التبادلي K-fold، تُقسم البيانات إلى مجموعات فرعية k متساوية الحجم تسمى أيضًا "الطيات". ستكون إحدى الطيات k بمثابة مجموعة اختبار، والمعروفة أيضًا باسم مجموعة الاحتفاظ أو مجموعة التحقق من الصحة، وستدرب الطيات المتبقية النموذج. تتكرر هذه العملية حتى تُستخدم كل طية من الطيات كطية احتفاظ. وبعد كل تقييم، يُحتفظ بالدرجات، وعندما تكتمل كل التكرارات، يُحسب متوسط الدرجات لتقييم أداء النموذج الكلي.

السيناريو المثالي عند تركيب نموذج هو إيجاد التوازن بين التجهيز الزائد ونقص التجهيز. تحديد هذه "النقطة المثالية" بين الاثنين يسمح لنماذج التعلم الآلي بإجراء تنبؤات بدقة.

كيفية تجنب نقص التجهيز

نظرًا لأنه يمكننا اكتشاف نقص التجهيز بناءً على مجموعة التدريب، يمكننا المساعدة بشكل أفضل في تحديد العلاقة السائدة بين متغيرات الإدخال والمخرجات في البداية. من خلال الحفاظ على تعقيد النموذج المناسب، يمكننا تجنب نقص التجهيز وتقديم تنبؤات أكثر دقة. فيما يلي بعض التقنيات التي يمكن استخدامها لتقليل نقص التجهيز:

تقليل التنظيم

يُستخدم التنظيم عادةً لتقليل التباين في النموذج من خلال تطبيق عقوبة على مَعلمات المدخلات ذات المعاملات الأكبر. هناك عدد من الطرق المختلفة، مثل تنظيم L1 وتنظيم Lasso والتسرّب وغيرها، التي تساعد على تقليل الضوضاء والقيم المتطرفة داخل النموذج. ومع ذلك، إذا أصبحت سمات البيانات موحَّدة للغاية، فلن يتمكن النموذج من تحديد التوجه السائد، ما يؤدي إلى نقص تخصيص النموذج. من خلال تقليل مقدار التنظيم، يتم إدخال المزيد من التعقيد والتباين في النموذج، ما يسمح بالتدريب الناجح للنموذج.

زيادة مدة التدريب

كما ذكرنا سابقًا، فإن التوقف عن التدريب في وقت مبكر جدًا يمكن أن يؤدي أيضًا إلى نموذج ناقص التجهيز. لذلك، من خلال تمديد مدة التدريب، يمكن تجنبه. "ومع ذلك، من المهم أن تكون على دراية بالتدريب الزائد، وبالتالي، بالتجهيز الزائدة." سيكون إيجاد التوازن بين السيناريوهين أمرًا أساسيًا.

اختيار الميزات

مع أي نموذج، يتم استخدام سمات محددة لتحديد نتيجة معينة. في حالة عدم وجود سمات تنبؤية كافية، يجب تقديم المزيد من السمات أو السمات ذات الأهمية الأكبر. على سبيل المثال، في الشبكة العصبية، يمكنك إضافة المزيد من الخلايا العصبية المخفية أو في الغابة العشوائية، يمكنك إضافة المزيد من الأشجار. ستضفي هذه العملية مزيدًا من التعقيد على النموذج، مما يؤدي إلى نتائج تدريب أفضل.

حلول ذات صلة
IBM watsonx.ai

تدريب الذكاء الاصطناعي التوليدي والتحقق من صحته وضبطه ونشره، وكذلك قدرات نماذج الأساس والتعلم الآلي باستخدام IBM watsonx.ai، وهو استوديو الجيل التالي من المؤسسات لمنشئي الذكاء الاصطناعي. أنشئ تطبيقات الذكاء الاصطناعي بسرعة أكبر وببيانات أقل.

اكتشف watsonx.ai
حلول الذكاء الاصطناعي

استفد من الذكاء الاصطناعي في عملك بالاستعانة بخبرة IBM الرائدة في مجال الذكاء الاصطناعي ومحفظة حلولها المتوفرة لك.

استكشف حلول الذكاء الاصطناعي
الاستشارات والخدمات المتعلقة بالذكاء الاصطناعي

أعدّ ابتكار عمليات ومهام سير العمل الحساسة بإضافة الذكاء الاصطناعي لتعزيز التجارب وصنع القرارات في الوقت الفعلي والقيمة التجارية.

استكشف خدمات الذكاء الاصطناعي
اتخِذ الخطوة التالية

احصل على وصول شامل إلى القدرات التي تغطي دورة حياة تطوير الذكاء الاصطناعي. تمكَّن من إنتاج حلول ذكاء اصطناعي قوية بفضل الواجهات سهلة الاستخدام وعمليات سير العمل السلسة وإمكانية الوصول إلى واجهات برمجة التطبيقات ومجموعات تطوير البرامج القياسية في الصناعة.

استكشف watsonx.ai احجز عرضًا توضيحيًا مباشرًا