يأتي عدم اليقين في نوعين أساسيين: عدم اليقين القائم على البيانات وعدم اليقين القائم على النموذج. في كلتا الحالتين، قد يكون من المفيد معرفة مدى موثوقية التنبؤ قبل إجراؤه وبعد إجرائه.
يمكنك اعتبار هذا بمثابة نموذج يتوقع عدد دورات فتح وإغلاق مفصل الباب قبل تعطله، مع خطأ تقديري بزيادة أو نقصان 1000 عملية. كما يمكن للتقدير الكمي لعدم اليقين أن يُظهر مدى احتمالية أن تتسبب عملية إغلاق مفصل الباب هذه المرة في كسره (فشله).
الطرق القائمة على أخذ العينات
تعد الأساليب القائمة على أخذ العينات من أكثر الأساليب استخدامًا للتقدير الكمي لعدم اليقين؛ لأنها تتعامل مع أي نوع من تعقيد النموذج وتوفر توصيفًا بديهيًا شاملًا لعدم اليقين. فمن خلال إنشاء العديد من السيناريوهات المحتملة، يمكن لأخذ العينات بناء صورة إحصائية للنتائج المحتملة ومدى عدم اليقين في توقعاتنا عند تطبيقها على بيانات العالم الحقيقي. وبدلًا من حساب عدم اليقين تحليليًا، فإن هذه الطرق تستخدم التحليل الإحصائي للعديد من مخرجات العينات لتوصيف توزيعات عدم اليقين.
وتعد محاكاة مونت كارلو واحدة من أكثر الأساليب شيوعًا. حيث يقوم هذا بتشغيل الآلاف من عمليات محاكاة النماذج مع إدخالات متنوعة بشكل عشوائي لمعرفة نطاق المخرجات المحتملة. وهذا أمر شائع بشكل خاص في نماذج المعلمات، حيث تُقارن فترات الثقة ومخرجات النماذج المختلفة معًا لتحديد النطاق الكامل لجميع القيم المحتملة للتنبؤ.
يوجد شكل آخر يُسمَّى أخذ عينات المكعبات اللاتينية المفرطة، وهو نسخة أكثر كفاءة من محاكاة مونت كارلو، إذ يحقق تغطية جيدة لمساحة المُدخلات بأكملها باستخدام عدد أقل من الأشواط التشغيلية.
إسقاط مونت كارلو هو أسلوب آخر يُبقي الإسقاط نشطًا أثناء التنبؤ، حيث يتم تشغيل عدة تمريرات أمامية للحصول على توزيع المخرجات.2 حيث يُستخدم الإسقاط في المقام الأول كأسلوب تنظيم، وهي طريقة تُستخدم للضبط الدقيق لنماذج التعلم الآلي. وتهدف إلى تحسين دالة الخسارة المعدَّلة مع تجنب مشكلات الإفراط في التجهيز أو نقص التجهيز.
يُطبق "إسقاط مونت كارلو" أسلوب الإسقاط في وقت الاختبار، ويُجري عدة تمريرات أمامية باستخدام أقنعة إسقاط مختلفة. وهذا يجعل النموذج ينتج توزيعًا للتنبؤات بدلًا من تقدير نقطة واحدة. حيث يوفر التوزيع رؤى حول عدم اليقين النموذجي بشأن التنبؤات. فهو أسلوب فعال من الناحية الحسابية للحصول على توزيعات مخرجات الشبكات العصبية دون حاجة إلى تدريب الشبكات العصبية عدة مرات.
عندما يكون تشغيل النموذج الفعلي عدة مرات مكلفا جدًا، يقوم الإحصائيون بإنشاء نماذج "بديلة" مبسطة باستخدام أساليب مثل انحدار العملية الغاوسية (GPR).5 حيث يعد انحدار العملية الغاوسية (GPR) نهج بايزي لنمذجة اليقين في التنبؤات مما يجعله أداة قيمة للتحسين والتنبؤ بالسلاسل الزمنية والتطبيقات. يعتمد انحدار العملية الغاوسية (GPR) على مفهوم "العملية الغاوسية"، وهي مجموعة من المتغيرات العشوائية التي لها توزيع غاوسي مشترك.
يمكنك اعتبار العملية الغاوسية توزيعًا للدوال. حيث يضع انحدار العملية الغاوسية (GPR) توزيعًا مسبقًا على الدوال ثم يستخدم البيانات المرصودة لإنشاء توزيع خلفي. واستخدام انحدار العملية الغاوسية (GPR) لحساب عدم اليقين لا يتطلب تدريبًا إضافيًا أو تشغيل النموذج لأن الإخراج يعبر بطبيعته عن مدى يقين النموذج أو عدم اليقين بشأن التقدير من خلال التوزيع. توفر مكتبات مثل Scikit-learn تطبيقات انحدار العملية الغاوسية (GPR) لتحليل عدم اليقين.
يعتمد اختيار طريقة أخذ العينات على السمات (الخصائص) الأكثر أهمية للنموذج والسيناريو الخاص بك. وتجمع معظم التطبيقات في العالم الحقيقي بين عدة مناهج.
طرق بايزي
الإحصاء البايزي هو منهج للاستدلال الإحصائي يستخدم نظرية بايز لدمج المعتقدات المُسبقة مع البيانات المرصودة وتحديث احتمال فرضية ما. حيث يتعامل الإحصاء البايزي صراحةً مع عدم اليقين عن طريق إسناد (أو تعيين) توزيع احتمالي بدلًا من قيمة ثابتة مفردة. فبدلًا من إعطاء تقدير "أفضل" واحد لمعلمة النموذج، توفر طرق الإحصاء البايزي توزيعًا لاحتمالية التقديرات المحتملة.
يقوم الاستدلال البايزي بتحديث التنبؤات مع توفر بيانات جديدة، والتي تتضمن بشكل طبيعي عدم اليقين طوال عملية تقدير المتغيرات المشتركة. تساعد أساليب مونت كارلو لسلاسل ماركوف (MCMC) في تطبيق المناهج البايزية عندما تكون الحلول الرياضية معقدة. حيث يقوم نهج MCMC بأخذ عينات من توزيعات احتمالية معقدة وعالية الأبعاد لا يمكن أخذ عينات منها مباشرة، لا سيما التوزيعات الخلفية في الاستدلال البايزي.
تتميز الشبكات العصبية البايزية (BNN) بأنها تختلف عن الشبكات العصبية التقليدية، حيث إنها تتعامل مع أوزان الشبكة كتوزيعات احتمالية بدلًا من تقديرات النقطة الثابتة. وهذا النهج الاحتمالي يتيح القياس الكمّي لعدم اليقين على أساس مبدئي وصارم. فبدلًا من تقديرات النقطة الواحدة للأوزان، تحافظ هذه التقديرات على توزيعات الاحتمالات على جميع معلمات الشبكة. التوقعات تتضمن عادةًً
- تقديرات المتوسط والتباين للتوزيع التنبؤي
- عينات من التوزيع التنبؤي
- فترات موثوق بها، مشتقة من التوزيع
توجد العديد من المكتبات مصدر مفتوح الشهيرة لتنفيذ شبكات BNN مثل مكتبة PyMC ومكتبة Tensorflow-Probability.
طرق التجميع
والفكرة الأساسية وراء تحديد مقدار عدم اليقين القائم على المجموعة هي أنه إذا اختلفت عدة نماذج مدرَّبة بشكل مستقل على التنبؤ، فإن هذا الاختلاف يشير إلى حالة من عدم اليقين بشأن الإجابة الصحيحة.4 وعلى العكس، عندما تتفق جميع النماذج في المجموعة، فإن هذا يشير إلى ثقة أعلى في التنبؤ. وهذا الحدس يُترجم إلى مقاييس ملموسة لعدم اليقين من خلال تباين تنبؤات المجموعة أو انتشارها.
إذا كانت f₁, f₂, ..., fₙ تمثل مقدرات أعضاء المجموعة N للإدخال x، يمكن إجراء التقدير الكمي لعدم اليقين على النحو التالي
حيث f̄(x) هو متوسط المجموعة. تدريب نماذج متنوعة متعددة (بنى مختلفة أو مجموعات فرعية لبيانات التدريب أو التهيئة) والجمع بين تنبؤاتها. والعيب الرئيسي لهذا النهج هو التكلفة الحسابية؛ حيث يتطلب تدريبًا وتشغيل نماذج متعددة.
التنبؤ المطابق
التنبؤ المطابق هو أسلوب لتحديد كمية عدم اليقين. حيث إنه يوفر إطار عمل خاليًا من التوزيع ولا يعتمد على النماذج لإنشاء فترات تنبؤ (لسيناريوهات الانحدار) أو مجموعات تنبؤ (لتطبيقات التصنيف).3 وهذا يوفر ضمانات تغطية صالحة مع أدنى حد من الافتراضات حول النموذج أو البيانات. وبالتالي فإن هذا يجعل التنبؤ المطابق مفيدًا بشكل خاص عند العمل مع نماذج الصندوق الأسود المدرَّبة مسبقًا.
يتميز التنبؤ المطابق بالعديد من السمات (الخصائص) التي تجعله قابلًا للتطبيق على نطاق واسع. على سبيل المثال، فهو لا يتطلب إلا أن تكون نقاط البيانات قابلة للتبادل، بدلًا من اشتراط أن تكون مستقلة وموزَّعة بشكل متطابق. كما أنه يمكن أيضًا تطبيق التنبؤ المطابق على أي نموذج تنبؤي مما يسمح لك بتعيين عدم اليقين التنبؤي المسموح به للنموذج.
على سبيل المثال، في مهمة الانحدار، قد ترغب في تحقيق تغطية 95%، مما يعني أن النموذج يجب أن يُخرج نطاقًا يقع فيه الرقم الحقيقي في فترة إخراج بنسبة 95% من الوقت. فهذا النهج مستقل عن النموذج لا يتوقف عليه، ويعمل بشكل جيد مع التصنيف، والانحدار، والشبكات العصبية، ومجموعة كبيرة من نماذج السلاسل الزمنية.
لاستخدام التنبؤ المطابق، يمكنك تقسيم بياناتك إلى ثلاث مجموعات: مجموعة تدريب ومجموعة اختبار أساسية ومجموعة معايرة. حيث تُستخدم مجموعة المعايرة لحساب درجات عدم المطابقة، وغالبًا ما يشار إليها باسم si. وهذه الدرجة تقيس مدى غرابة التنبؤ. وبالنظر إلى إدخال جديد، يمكنك تشكيل فاصل زمني للتنبؤ بناءً على هذه الدرجات لضمان التغطية.
في مهمة التصنيف، يكون التنبؤ المطابق لدرجة عدم المطابقة مقياسًا لمدى انحراف مثيل جديد عن المثيلات الموجودة في مجموعة التدريب. وهذا يحدد ما إذا كان المثيل الجديد ينتمي إلى فئة معينة أم لا. بالنسبة للتصنيف متعدد الفئات، يكون هذا عادةً هو (1 - احتمال الفئة المتوقعة للتصنيف المحدد).
إذن إذا كان الاحتمال المتوقع لمثيل جديد ينتمي إلى فئة معينة مرتفعًا، فإن درجة عدم المطابقة ستكون منخفضة، والعكس صحيح. ويتمثل النهج الشائع في حساب درجات si لكل مثيل في مجموعة المعايرة وفرز الدرجات من منخفضة (مؤكدة) إلى عالية (غير مؤكدة).
للوصول إلى 95% التغطية المطابقة، احسب العتبة q حيث تكون 95% من درجات si أقل. وبالنسبة لأمثلة الاختبار الجديدة، يمكنك تضمين التسمية في مجموعة التنبؤات إذا كانت si الخاصة بها أقل من العتبة q.
إذا كنت بحاجة إلى ضمان أن نموذجك يحتوي على تغطية مطابقة بنسبة 95%، فستحصل على متوسط درجات si لجميع الفئات. ثم بعد ذلك، ستجد عتبة درجات si تحتوي على 95% من البيانات. ثم يمكنك التأكد من أن المصنِّف الخاص بك يحدد بشكل صحيح 95% من المثيلات الجديدة عبر جميع الفئات.
هذا يختلف قليلًا عن دقة المصنِّف لأن التنبؤ المطابق قد يحدد فئات متعددة. ففي المصنِّف متعدد الفئات، يظهر التنبؤ المطابق أيضًا التغطية لجميع الفئات. يمكنك تعيين معدل تغطية للفئات الفردية بدلًا من مجموعة التدريب بأكملها.