ما هي نماذج التصنيف؟

31 يوليو 2024

المؤلفين

Jacob Murel Ph.D.

Senior Technical Content Creator

Eda Kavlakoglu

Program Manager

نماذج التصنيف هي نوع من النمذجة التنبؤية التي تنظم البيانات في فئات محددة مسبقًا وفقًا لقيم السمات.

نماذج التصنيف هي نوع من نماذج التعلم الآلي التي تقسم نقاط البيانات إلى مجموعات محددة مسبقًا تسمى الفئات.المصنفات هي نوع من النمذجة التنبؤية التي تتعلم خصائص الفئة من إدخال البيانات وتتعلم تعيين الفئات المحتملة للبيانات الجديدة وفقًا لتلك الخصائص المكتسبة.1 تُستخدم خوارزميات التصنيف على نطاق واسع في علم البيانات للتنبؤ بالأنماط والتنبؤ بالنتائج. في الواقع، لديهم مجموعة من حالات الاستخدام الواقعية، مثل تصنيف المرضى حسب المخاطر الصحية المحتملة وتصفية البريد الإلكتروني العشوائي.

يمكن أن تكون مهام التصنيف ثنائية أو متعددة الفئات. في مشاكل التصنيف الثنائي، يتنبأ النموذج بين فئتين. على سبيل المثال، يصنف عامل تصفية البريد الإلكتروني العشوائي فيها رسائل البريد الإلكتروني على أنها عشوائية أو غير عشوائية. تصنف مشاكل التصنيف متعدد الفئات البيانات بين أكثر من فئتين من التصنيفات. على سبيل المثال، قد يقوم مصنف الصور بتصنيف صور الحيوانات الأليفة باستخدام عدد لا يحصى من تصنيفات الفئات، مثل الكلب ، والقط واللاما وخلد الماء والمزيد.

تشير بعض المصادر، خاصة عبر الإنترنت، إلى التصنيف كشكل من أشكال التعلم الآلي الخاضع للإشراف. لكن المصنفات لا تندرج حصرياً ضمن مجال التعلم الخاضع للإشراف.كانت مناهج التعلم غير الخاضعة للإشراف لمشاكل التصنيف محورًا رئيسيًا للأبحاث الحديثة.

تصميم ثلاثي الأبعاد لكرات تتدحرج على مسار

أحدث الأخبار والرؤى حول الذكاء الاصطناعي 


تتوفر معارف وأخبار منسقة بمهارة حول الذكاء الاصطناعي والسحابة وغيرها في نشرة Think الإخبارية الأسبوعية. 

كيف تعمل نماذج التصنيف

وبالطبع، تختلف كل خوارزمية من خوارزميات تصنيف التعلم الآلي في عمليات المعلومات الداخلية.ومع ذلك، يلتزم الجميع بعملية تصنيف البيانات العامة المكونة من خطوتين:

التعلُّم.في التعلم الخاضع للإشراف، يقوم المعلق البشري بتعيين تصنيف لكل نقطة بيانات في مجموعة بيانات التدريب. وتُعرَّف هذه النقاط بأنها عدد من متغيرات الإدخال (أو المتغيرات المستقلة)، والتي قد تكون رقمية أو سلاسل نصية أو سمات الصورة وما إلى ذلك. من الناحية الرياضية، يعتبر النموذج كل نقطة بيانات كمجموعة x.إن المجموعة هي مجرد تسلسل رقمي مرتب يتم تمثيله على النحو التالي: x = (x1,x2,x3…xn). كل قيمة في المجموعة هي سمة معينة لنقطة البيانات. يستخدم النموذج سمات كل نقطة بيانات مع تصنيف فئتها لفك تشفير السمات التي تحدد كل فئة. من خلال تعيين بيانات التدريب وفقًا لهذه المعادلة، يتعلم النموذج تلك السمات العامة (أو المتغيرات) المرتبطة بكل تصنيف للفئة.

التصنيف.الخطوة الثانية في مهام التصنيف هي التصنيف نفسه.في هذه المرحلة، ينشر المستخدمون النموذج على مجموعة اختبار من البيانات غير المرئية. تعد البيانات غير المستخدمة سابقًا مثالية لتقييم تصنيف النموذج لتجنب الإفراط في الملاءمة.يستخدم النموذج دالة التنبؤ المكتسبة y=f(x) لتصنيف البيانات غير المرئية عبر فئات مميزة وفقًا لسمات كل عينة. ثم يقوم المستخدمون بتقييم دقة النموذج وفقًا لعدد عينات بيانات الاختبار المتوقعة بشكل صحيح.2

التنبؤات

تُخرج نماذج التصنيف نوعين من التنبؤات: منفصلة ومستمرة.

المنفصلة.التنبؤات المنفصلة هي تصنيفات الفئة المتوقعة لكل نقطة بيانات. على سبيل المثال، يمكننا استخدام المتنبئ لتصنيف المرضى الطبيين إلى مصابين بالسكري أو غير مصابين بالسكري استنادًا إلى البيانات الخاصة بالصحة.فئتا السكري وغير السكري هي التنبؤات الفئوية المنفصلة.

المستمرة.تقوم المصنفات بتعيين تنبؤات الفئة كاحتمالات مستمرة تسمى درجات الثقة. هذه الاحتمالات هي قيم تتراوح بين 0 و 1، وتمثل النسب المئوية. قد يصنف نموذجنا المريض على أنه مريض بالسكري بمعدل احتمال0.82. هذا يعني أن النموذج يعتقد أن المريض لديه فرصة بنسبة 82% للإصابة بمرض السكري وفرصة بنسبة 18% لعدم الإصابة بمرض السكري.

يقوم الباحثون عادة بتقييم النماذج باستخدام تنبؤات منفصلة أثناء استخدام التنبؤات المستمرة كعتبات. يتجاهل المصنف أي تنبؤ تحت عتبة معينة. على سبيل المثال، إذا كان متنبئنا بمرض السكري لديه عتبة .4 (40%) ويصنف المريض على أنه مريض بالسكري مع احتمالية أن تصل إلى .35 (35%)، ثم يتجاهل النموذج هذا التصنيف ولن يعين المريض في فئة مرضى السكري .3

Mixture of Experts | بودكاست

فك تشفير الذكاء الاصطناعي: تقرير إخباري أسبوعي

انضم إلى لجنة عالمية المستوى من المهندسين والباحثين وقادة المنتجات وغيرهم وهم يجتازون طريق الذكاء الاصطناعي لتزويدك بأحدث أخباره والمعارف المتعلقة به.

مقاييس التقييم

يستخدم الباحثون والمطورون مجموعة واسعة من مقاييس التقييم لنماذج التصنيف.يعتمد تقييم المقاييس المختار على مهمة التصنيف المحددة. تقيس جميعها الدقة التي يتنبأ بها المتعلم (أي المصنف) بدقة بفئات النموذج.

تستخدم مقاييس التصنيف مصطلحات شائعة. الإيجابيات الحقيقية (TP) هي عينات البيانات التي يتنبأ بها النموذج بشكل صحيح في فئتها الخاصة.الإيجابيات الكاذبة (FP) هي تلك الحالات من الفئة السلبية التي تم تحديدها بشكل غير صحيح على أنها حالات إيجابية. السلبيات الكاذبة (FN) هي حالات إيجابية فعلية تم التنبؤ بها خطأ على أنها سلبية. السلبيات الحقيقية (TN) هي مثيلات الفئة السلبية الفعلية التي يصنفها النموذج بدقة على أنها سلبية.

الدقة. يُطلق عليها قيمة التنبؤ الإيجابية (PPV).هي النسبة المئوية لتوقعات الفئة الإيجابية التي تنتمي فعليًا إلى الفئة المعنية.على سبيل المثال، في عامل تصفية البريد العشوائي، الدقة هي نسبة الرسائل التي يصنفها النموذج على أنها رسائل عشوائية والتي هي في الواقع رسائل عشوائية.والتي يتم تمثيلها بالمعادلة التالية:4

الاستدعاء.وكذلك الحساسية أو المعدل الإيجابي الحقيقي (TPR)، يشير الاستدعاء إلى النسبة المئوية لمثيلات الفئة التي اكتشفها النموذج. بالعودة إلى عامل تصفية البريد العشوائي، يشير الاستدعاء إلى عدد رسائل البريد العشوائي الفعلية التي يصنفها النموذج بالفعل على أنها رسائل عشوائية. ويتم تمثيله بالمعادلة التالية:5

درجة F1.يمكن أن تشترك الدقة والاستدعاء في علاقة عكسية؛ فبينما يُرجع المصنف المزيد من النتائج الإيجابية الصحيحة (زيادة الاستدعاء)، فإن المصنف يُخطئ حتمًا في تصنيف الحالات غير الصحيحة (أي النتائج الإيجابية الخاطئة) أيضًا، مما يقلل من الدقة. تهدف درجة F1 إلى حل هذه المفاضلة. تجمع F1 (أو F-score) بشكل فعال بين الدقة والاستدعاء لتمثيل الدقة الإجمالية للنموذج. ويتم تمثيلها بالمعادلة التالية:6

عرض مصور للبيانات

تساعد أدوات العرض المصور للبيانات في توضيح النتائج في تحليل البيانات. يستخدم علماء البيانات وباحثو التعلم الآلي أداتين أساسيتين لتصور أداء المصنف:

مصفوفة الإرباك. تُعد مصفوفة الإرباك جدول الأعمدة فيه تمثل القيم المتوقعة لفئة معينة بينما الصفوف تمثل القيم الفعلية، أو العكس.يشير المربع العلوي الأيسر إلى عدد الإيجابيات الحقيقية. المربع أدناه هو الإيجابيات الكاذبة. المربع العلوي الأيمن هو عدد السلبيات الكاذبة. المربع السفلي الأيمن هو عدد السلبيات الحقيقية.حيث يُوفر جمع قيم كل من هذه المتغيرات العدد الإجمالي لتوقعات النموذج.7قد تبدو مصفوفة الإرباك لمصنِّف ثنائي كما يلي:

منحنى ROC.منحنى خاصية التشغيل المُستقبِل (ROC) يصور نسبة الإيجابيات الحقيقية إلى السلبيات الحقيقية. يرسم الرسم البياني المعدل الإيجابي الحقيقي مقابل المعدل السلبي الحقيقي لكل عتبة مستخدمة في تصنيف النموذج.تنشأ إحصائية المنطقة الواقعة تحت المنحنى (AUC) من منحنى ROC. تقيس AUC مدى احتمالية أن تكون درجة الثقة في النتيجة الإيجابية المختارة عشوائيًا أعلى من السلبية العشوائية. تتراوح قيم AUC من 0 إلى 1. يشير الأول إلى أن النموذج يسجل جميع السلبيات ذات الاحتمالات الأعلى من الإيجابيات، بينما يعني الرقم 1 أن النموذج يسجل كل نتيجة إيجابية باحتمالية أعلى.8

أنواع خوارزميات التصنيف

هناك العديد من أنواع خوارزميات التصنيف المختلفة.على الرغم من وجود حالات استخدام متداخلة، إلا أن بعضها مناسب لتطبيقات معينة أكثر من غيرها. فيما يلي نظرة عامة على ثلاث خوارزميات شائعة للتعلم الآلي للتصنيف. يمكن تنفيذ الثلاثة معًا بسهولة في Python باستخدام مكتبات scikit-learn المختلفة.

الانحدار اللوجستي

غالبًا ما تقارن المصادر عبر الإنترنت بين تصنيف التعلم الآلي ومهام الانحدار. ولكن هذا تبسيط مبالغ فيه. الانحدار اللوجستي هو مصنف احتمالي مشتق من نماذج الانحدار الخطي. يستخدم الانحدار متغيرًا مستقلًا واحدًا أو أكثر للتنبؤ بقيمة متغير مستقل، يمكن أن تكون قيمته أي عدد نسبي متصل. الانحدار اللوجستي هو تعديل للانحدار الخطي بحيث تكون قيمة المخرجات (أو المتغير المستقل) محدودة بأي قيمة بين 0 و 1. يقوم بذلك من خلال تطبيق اللوغاريتم—أو لوغاريتم الاحتمالات— للتحويل على صيغة الانحدار الخطي القياسية:9

تعد نماذج الانحدار اللوجستي مفيدة للتصنيف الثنائي لمشاكل الانحدار متعدد المتغيرات. والتطبيقات الشائعة هي الكشف عن الغش والتنبؤات الطبية الحيوية. على سبيل المثال، تم تنفيذ الانحدار اللوجستي للمساعدة في التنبؤ بوفيات المرضى الناجمة عن الصدمات وأمراض القلب التاجية.10

بايز الساذج (Naïve Bayes)

تعد مصنفات بايز الساذج (المصممة أيضًا باسم Naive Bayes) نوعًا شائعًا من المصنفات استنادًا إلى نظرية بايز. أحد اختلافاتها الرئيسية عن المصنفات الأخرى هو أنها تحسب الاحتمال اللاحق للتنبؤات الصفية.هذا يعني أن مصنف بايز الساذج يقوم بتحديث تنبؤات الفئة الأولية (تسمى الاحتمالات السابقة) مع كل جزء جديد من البيانات.على سبيل المثال، لنفترض أننا نحاول تصنيف احتمالية إصابة المريض بمرض السكري. تعمل البيانات الطبية لهذا المريض—مثل ضغط الدم والعمر ومستويات السكر في الدم والمزيد—كمتغيرات مستقلة. للتنبؤ، يقوم مصنف بايز بحساب الانتشار الحالي المتوقع لمرض السكري بين السكان (الاحتمال السابق) مع احتمال ظهور قيم البيانات الطبية لمريضنا في شخص مصاب بداء السكري (الاحتمال الشرطي).يتبع مصنفو بايز الساذج معادلة قاعدة بايز:11

يعرف مصنف بايز الساذج بأنه مصنف توليدي. هذا يعني أن مصنف بايز، يستخدم القيم المتغيرة لملاحظات معينة، ويحسب الفئة التي من المرجح أن تكون قد ولدت الملاحظة. وقد قام باحثو معالجة اللغة الطبيعية (NLP) بتطبيق مصنف بايز الساذج على نطاق واسع لمهام تصنيف النصوص، مثل تحليل المشاعر.باستخدام نموذج bag of words، حيث تشكل كل كلمة متغيرًا، مصنف بايز الساذج لتحليل المشاعر يتنبأ ما إذا كانت فئة إيجابية أو سلبية أنتجت النص المعني.12

خوارزميّة الجيران الأقرب

تعيّن خوارزميّة الجيران الأقرب (KNN) نقاط البيانات على فضاء متعدد الأبعاد.فهي تقوم بتجميع نقاط البيانات ذات القيم المتشابهة في مجموعات أو فئات منفصلة.لتصنيف عينات البيانات الجديدة، ينظر المصنف ببساطة إلى عدد k من النقاط الأقرب إلى إدخال اختبار عينة بيانات معين جديد x، ويحسب عدد أعضاء كل فئة يشكلون المجموعة الفرعية المجاورة، ويعيد هذه النسبة كتقدير للفئة لنقطة البيانات الجديدة.بعبارة أخرى، يقوم النموذج بتعيين نقطة بيانات جديدة إلى أي فئة تضم غالبية جيران تلك النقطة.يقارن نموذج KNN عادةً المسافة بين نقاط البيانات بالمسافة الإقليدية:13

أقرب جار تقريبي (ANN) هو أحد أشكال KNN.في مساحات البيانات عالية الأبعاد، يمكن أن يصبح العثور على جيران نقطة بيانات معينة بالضبط مكلفًا من الناحية الحسابية. تقليل الأبعاد هو إحدى وسائل حل هذه المشكلة. ANN هي شيء آخر. بدلًا من العثور على أقرب جار لنقطة بيانات معينة، تجد ANN أقرب جار تقريبي ضمن مسافة معينة. وقد أظهرت الأبحاث الحديثة نتائج واعدة لنموج أقرب جار تقريبي (ANN) في سياق التصنيف متعدد التسميات.14

لاحظ أن العديد من هذه التقنيات يمكن أن تتأثر سلبًا بالقيم المتطرفة. ولحسن الحظ، يمكن لعدد من تقنيات الضبط أن تساعد في حساب عوامل التأثير السلبي هذه. هناك أيضًا العديد من الخوارزميات الأخرى للتصنيف في التعلم الآلي.بعض الخوارزميات الإضافية هي أشجار القرار والغابات العشوائية وتعزيز التدرج وآلات المتجهات الداعمة (SVM).

حلول ذات صلة
IBM watsonx.ai

تدريب الذكاء الاصطناعي التوليدي والتحقق من صحته وضبطه ونشره، وكذلك قدرات نماذج الأساس والتعلم الآلي باستخدام IBM watsonx.ai، وهو استوديو الجيل التالي من المؤسسات لمنشئي الذكاء الاصطناعي. أنشئ تطبيقات الذكاء الاصطناعي بسرعة أكبر وببيانات أقل.

اكتشف watsonx.ai
حلول الذكاء الاصطناعي

استفد من الذكاء الاصطناعي في عملك بالاستعانة بخبرة IBM الرائدة في مجال الذكاء الاصطناعي ومحفظة حلولها المتوفرة لك.

استكشف حلول الذكاء الاصطناعي
الاستشارات والخدمات المتعلقة بالذكاء الاصطناعي

أعدّ ابتكار عمليات ومهام سير العمل الحساسة بإضافة الذكاء الاصطناعي لتعزيز التجارب وصنع القرارات في الوقت الفعلي والقيمة التجارية.

استكشف خدمات الذكاء الاصطناعي
اتخِذ الخطوة التالية

احصل على وصول شامل إلى القدرات التي تغطي دورة حياة تطوير الذكاء الاصطناعي. تمكَّن من إنتاج حلول ذكاء اصطناعي قوية بفضل الواجهات سهلة الاستخدام وعمليات سير العمل السلسة وإمكانية الوصول إلى واجهات برمجة التطبيقات ومجموعات تطوير البرامج القياسية في الصناعة.

استكشف watsonx.ai احجز عرضًا توضيحيًا مباشرًا
الحواشي

1 Chris Drummond, “Classification,” Encyclopedia of Machine Learning and Data Mining, Springer, 2017.

2 Jaiwei Han, Micheline Kamber, and Jian Pei, Data Mining: Concepts and Techniques, 3rd edition, Morgan Kaufman, 2012.

3 Max Kuhn and Kjell Johnson, Applied Predictive Modeling, Springer, 2016.

4 Ethan Zhang and Yi Zhang, “Precision,” Encyclopedia of Database Systems, Springer, 2018.

5 Ethan Zhang and Yi Zhang, “Recall,” Encyclopedia of Database Systems, Springer, 2018.

6 Ben Carterette, “Precision and Recall,” Encyclopedia of Database Systems, Springer, 2018.

7 Kai Ming Ting, “Confusion matrix,” Encyclopedia of Machine Learning and Data Mining, Springer, 2017.

8 Peter Flach, “ROC Analysis,” Encyclopedia of Machine Learning and Data Mining, Springer, 2017.

9 Max Kuhn and Kjell Johnson, Applied Predictive Modeling, Springer, 2016. Gareth James, Daniela Witten, Trevor Hastie, Robert Tibshirani, and Jonathan Taylor, An Introduction to Statistical Learning with Applications in Python, Springer, 2023

10 Lisa X. Deng, Abigail May Khan, David Drajpuch, Stephanie Fuller, Jonathan Ludmir, Christopher E. Mascio, Sara L. Partington, Ayesha Qadeer, Lynda Tobin, Adrienne H. Kovacs, and Yuli Y. Kim, "Prevalence and Correlates of Post-traumatic Stress Disorder in Adults With Congenital Heart Disease," The American Journal of Cardiology, Vol. 117, No. 5, 2016, pp. 853-857, https://www.sciencedirect.com/science/article/abs/pii/S0002914915023590 .

11 Max Kuhn and Kjell Johnson, Applied Predictive Modeling, Springer, 2016. William Bolstad and James Curran, Introduction to Bayesian Statistics, 3rd edition, Wiley, 2016.

12 Daniel Jurafsky and James Martin, Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition, 3rd edition, 2023.

13 Max Kuhn and Kjell Johnson, Applied Predictive Modeling, Springer, 2016. Kevin Murphy, Machine Learning: A Probabilistic Perspective, MIT Press, 2012.

14 Ville Hyvönen, Elias Jääsaari, Teemu Roos, “A Multilabel Classification Framework for Approximate Nearest Neighbor Search,” Journal of Machine Learning Research, Vol. 25, No. 46, 2024, pp. 1−51, https://www.jmlr.org/papers/v25/23-0286.html .