إن النمذجة باستخدام التعلم الآلي موجودة؛ بسبب عدم اليقين. فإذا كان بوسعنا ربط المدخلات بالمخرجات بشكل مثالي، فلن تكون هناك حاجة إلى النماذج. لكن بيانات العالم الواقعي فوضوية وغير مكتملة وضجيجية - لذا نقوم بنمذجة الاحتمالات بدلًا من اليقين. والتعرف على الاحتمالات يضع أساسيات كل ما يتعلق بالتعلم الآلي والذكاء الاصطناعي. تسمح لنا النظريات في الاحتمالات بفهم البيانات التي استخدمناها لنمذجتها بطريقة جميلة وأنيقة. ويمثل دورًا حساسًا في نمذجة عدم اليقين في تنبؤات نماذج التعلم الآلي. ويساعدنا على تحديد كمية الاحتمالية والرجحان واليقين في نموذج إحصائي، لكي نتمكن من قياس مخرجات النماذج التي ننشئها بثقة. ويساعد التعمق في عالم الاحتمالات وتعلم الأساسيات على ضمان فهمك لأساس جميع نماذج التعلم الإحصائي وكيف تظهر تنبؤاتها. وسوف تتعلم كيف يمكننا الاستدلال وإنتاج نتائج احتمالية.
ولكي تتمكن من تعلم التوزيعات الشائعة ونمذجة بياناتك بثقة، دعنا ننتقل الآن إلى الأساسيات ونوضح بعض المصطلحات.
المتغير العشوائي: تمثيل عددي لناتج ظاهرة عشوائية. فهو متغير تكون قيمه الممكنة عبارة عن نتائج عددية لعملية عشوائية.
المتغير العشوائي المتقطع: متغير عشوائي يمكن أن يأخذ عددًا محدودًا أو غير محدود من القيم المختلفة. على سبيل المثال، نتيجة قلب العملة (الرؤوس = 1، Tails = 0)، أو عدد رسائل البريد الإلكتروني غير المرغوب فيها المستلمة في ساعة.
المتغير العشوائي المتواصل: متغير عشوائي يمكن أن يأخذ أي قيمة ضمن نطاق معين. على سبيل المثال، ارتفاع الشخص أو درجة الحرارة في الغرفة أو كمية هطول الأمطار.
الحدث: مجموعة من ناتج واحد أو أكثر من عملية عشوائية. على سبيل المثال، الحصول على رقم زوجي على حجر النرد (النتائج: 2، 4، 6) أو تخلي العميل عن الخدمة.
النتيجة: نتيجة واحدة محتملة لتجربة عشوائية. على سبيل المثال، عند رمي العملة المعدنية سيظهر إما "وجه" أو "ظهر".
الاحتمالية مقياس رقمي لاحتمالية وقوع حدث: سوف يحدث، يتراوح من 0 (مستحيل) إلى 1 (مؤكد).
الاحتمال الشرطي : احتمال وقوع الحدث يحدث، بالنظر إلى أن الحدث قد حدث بالفعل. هذه الخطوة حاسمة في التعلم الآلي، حيث نريد غالبًا التنبؤ بنتيجة بالنظر إلى سمات محددة.
الاحتمال هو مقياس لمدى احتمال وقوع حدث ما، من 0 (مستحيل) إلى 1 (مؤكد).
في التعلم الآلي، غالبًا ما يأخذ هذا شكل الاحتمال الشرطي
مثال: قد يقول نموذج الانحدار اللوجستي
> "بافتراض أن العمر = 45، والدخل = 60 ألف دولار أمريكي، والسجل السابق،
> فإن احتمال تخلي العميل عن الخدمة هو 0.82".
هذا المثال لا يعني أن العميل سوف يتخلى عن الخدمة بالضرورة، بل هو اعتقاد مبني على الأنماط الإحصائية الموجودة في بيانات التدريب.
في العصر الحديث للذكاء الاصطناعي التوليدي، تمثل النماذج الاحتمالية مثل الانحدار دورًا كبيرًا في تحديد النتائج ومخرجات النموذج. وغالبًا ما يكون هذا الدور في شكل دالة تنشيط في طبقات الشبكات العصبية.