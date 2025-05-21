دعنا نتعمق في الأسس الرياضية للمفاضلة بين التحيز والتباين. بالإشارة إلى المثال السابق، نهدف إلى تقليل الخطأ الكلي للقيم المتوقعة والقيم الفعلية. يتكون هذا الخطأ من ثلاثة عناصر: التحيز، والتباين، والخطأ غير القابل للاختزال. يمكننا تحليل خطأ التنبؤ التربيعي المتوقع للنموذج:
f^(x)
مقارنة بالدالة الحقيقية: f(x)،
حيث يتم تعلم f ^ (x) من مجموعة بيانات التدريب D، وx هي الدالة الحقيقية (غير المعروفة).
دعنا:
y=f(x)+ε,ε∼N(0,σ2)
هذا يعني أنه بالنسبة للدالة y=f(x)+ε، يتم توزيع الخطأ (المشار إليه ب ε) عادةً بمتوسط 0 وتباين σ2، وσ يشير إلى الانحراف المعياري للتوزيع
f^(x) هي القيمة المتوقعة للنموذج عند الإدخال x
يتم أخذ التوقع (أو المتوسط) على مجموعات بيانات التدريب المختلفة D والضجيج ε . يستخدم الرمز E للتعبير عن "التوقع" أو "القيمة المتوقعة"، وهي قيمة حقيقية لمتوسط التوزيع
نحن مهتمون بالخطأ المتوقع في التنبؤ عند نقطة واحدة x :
ED,ε[(y-f^(x))2]
بديل:
y=f(x)+ε
لذا يصبح التعبير
=ED,ε[(f(x)+ε-f^(x))2]
توسيع المربع:
$=ED,ε[(f(x)-f^(x))2+2(f(x)-f^(x))ε+ε2]$
قسم التوقع باستخدام الخطية (الخطية هي مفهوم جبري بسيط، على سبيل المثال، E[A+B]=E[A]+E[B]):
=ED[(f(x)-f^(x))2]+2ED,ε[(f(x)-f^(x))ε]+Eε[ε2]
الآن، ما دام:
E[ε]=0⇒E[(f(x)-f^(x))ε]=0
E[ε2]=σ2
فسنحصل على:
ED[(f(x)-f^(x))2]+σ2