ما هو التصنيف في التعلم الآلي؟

المؤلفون

Ivan Belcic

Staff writer

ما هو التصنيف في التعلم الآلي؟

التصنيف في التعلم الآلي هو عملية نمذجة تنبؤية تقوم من خلالها نماذج التعلم الآلي باستخدام خوارزميات التصنيف للتنبؤ بالتصنيف الصحيح لبيانات الإدخال. 

ونظرًا لأن نماذج الذكاء الاصطناعي تتعلم تحليل البيانات وتصنيفها في مجموعات بيانات تدريب خاصة بها، فإنها تصبح أكثر كفاءة في تحديد أنواع البيانات المختلفة واكتشاف الاتجاهات السائدة وإجراء تنبؤات أدق. 

في نهاية عملية تدريب النموذج، يتم تقييم أداء النموذج باستخدام بيانات الاختبار. فبعد أن يعمل النموذج بشكل جيد باستمرار، يتم تقديمه إلى بيانات العالم الحقيقي التي لم يرها النموذج من قبلُ. تطبق الشبكات العصبية المدرَّبة ما تعلمته أثناء التدريب لعمل تنبؤات ناجحة باستخدام بيانات جديدة. 

أحدث اتجاهات الذكاء الاصطناعي، يقدمها لك الخبراء

احصل على رؤى منسقة حول أهم أخبار الذكاء الاصطناعي وأكثرها إثارةً للاهتمام. اشترِك في خدمة رسائل Think الإخبارية الأسبوعية. راجع بيان الخصوصية لشركة IBM.

شكرًا لك! لقد اشتركت بنجاح.

سيتم تسليم اشتراكك باللغة الإنجليزية. ستجد رابط إلغاء الاشتراك في كل رسالة إخبارية. يمكنك إدارة اشتراكاتك أو إلغاء اشتراكك هنا. راجع بيان خصوصية IBM لمزيد من المعلومات.

ما هي نماذج التصنيف؟

نموذج التصنيف هو نوع من نماذج التعلم الآلي يقوم بفرز نقاط البيانات إلى مجموعات محددة مسبقًا تُسمَّى الفئات. حيث تتعلم المصنفات خصائص الفئة من بيانات الإدخال، ثم تتعلم كيفية تعيين الفئات المحتملة للبيانات الجديدة التي لم يرها من قبلُ وفق تلك الخصائص المكتسبة.1

أكاديمية الذكاء الاصطناعي

تسخير الذكاء الاصطناعي في العمل لخدمة العملاء

اكتشف كيف يمكن للذكاء الاصطناعي التوليدي إدخال السرور على العملاء من خلال تقديم تجربة أكثر سلاسة وزيادة إنتاجية المؤسسة في هذه المجالات الثلاثة الرئيسية: الخدمة الذاتية، والوكلاء البشريين، وعمليات مركز الاتصال.

ما هي خوارزميات التصنيف؟

خوارزمية التصنيف هي خوارزمية تعلم آلي تركز على التصنيف وتفرز بيانات الإدخال إلى فئات متخلفة أو أصناف مختلفة. تستخدم نماذج الذكاء الاصطناعي خوارزميات التصنيف لمعالجة مجموعات بيانات الإدخال مقابل مصنِّف محدد يحدد معايير كيفية فرز البيانات. وتستخدم خوارزميات التصنيف على نطاق واسع في علم البيانات للتنبؤ بالأنماط والتنبؤ بالنتائج. 

كيف تعمل نماذج التصنيف؟

رغم عدم وجود خوارزميتين متشابهتين تمامًا في تصنيف التعلّم الآلي، إلا أن كل الخوارزميات تتبع جميعها نفس عملية تصنيف البيانات العامة المكونة من خطوتين: 

  1. التعلُّم
  2. التصنيف 

الخطوة 1: التعلم

بشكل تقليدي ظل التصنيف نوعًا من التعلم الآلي الخاضع للإشراف، مما يعني أنه يستخدم البيانات المسماة "المصنَّفة" لتدريب النماذج. في التعلّم الخاضع للإشراف، تحتوي كل نقطة بيانات في بيانات التدريب على متغيرات مدخلات (معروفة أيضًا باسم المتغيرات المستقلة أو السمات "الخصائص")، ومتغير إخراج أو تسمية. 

في التدريب على التصنيف، تتمثل مهمة النموذج في فهم العلاقات بين السمات وتسميات الفئات، ثم تطبيق هذه المعايير على مجموعات البيانات المستقبلية. وتستخدم نماذج التصنيف سمات كل نقطة بيانات مع تسمية الفئة الخاصة بها لفك تشفير السمات التي تحدد كل فئة. من الناحية الرياضية، يُعدُّ النموذج كل نقطة بيانات كمجموعة x. التوأم هو متتابعة عددية مرتبة يتم تمثيلها على شكل x = (x1,x2,x3…xn).

كل قيمة في المجموعة هي سمة لنقطة البيانات. ومن خلال تعيين بيانات التدريب بهذه المعادلة، يتعرف النموذج على السمات المرتبطة بكل تسمية فئة. 

الغرض من التدريب هو تقليل الأخطاء أثناء النمذجة التنبؤية. تُدرِّب خوارزميات الانحدار التدرجي النماذج عن طريق تقليل الفجوة بين النتائج المتوقعة والنتائج الفعلية. ثم يمكن لاحقًا ضبط النماذج بدقة من خلال مزيد من التدريب لأداء مهام أكثر تحديدًا. 

ظلت مناهج التعلم غير الخاضع للإشراف لمشكلات التصنيف محورًا رئيسيًا للأبحاث الحديثة. حيث تعمل طرق التعلم غير الخاضعة للإشراف على تمكين النماذج من اكتشاف الأنماط، في البيانات غير المصنفة، بنفسها. ونلاحظ أن عدم وجود تسميات هو ما يميز التعلم غير الخاضع للإشراف والتعلم الخاضع للإشراف

وفي الوقت نفسه، يجمع التعلم شبه الخاضع للإشراف بين البيانات المصنفة وغير المصنفة لتدريب النماذج لأغراض التصنيف والانحدار. أما في الحالات التي يكون فيها الحصول على مجموعات بيانات كبيرة من البيانات المصنفة أمرًا غير ممكن، يبرز التعلم شبه الخاضع للإشراف كبديل قابل للتطبيق. 

الخطوة 2: التصنيف 

الخطوة الثانية في مهام التصنيف هي عملية التصنيف نفسه. وفي هذه المرحلة، ينشر المستخدمون النموذج على مجموعة اختبار من البيانات الجديدة. ثم يتم استخدام البيانات غير المستخدمة سابقًا لتقييم أداء النموذج لتجنب الإفراط في التجهيز: عندما يعتمد النموذج بشدة على بيانات التدريب الخاصة به ويصبح غير قادر على إجراء تنبؤات دقيقة في العالم الحقيقي. 

يستخدم النموذج دالته المتوقعة المكتسبة لتصنيف البيانات الجديدة عبر فئات مختلفة وفقًا لميزة كل عينة. ثم يقوم المستخدمون بتقييم دقة النموذج وفقًا لعدد عينات بيانات الاختبار المتوقعة بشكل صحيح.2

ما هي أنواع التصنيفات الموجودة؟

يتم تمييز مهام النمذجة التنبؤية القائمة على التصنيف عن بعضها البعض بناءً على عدد الفئات ودرجة حصرية الفئات: 

  • التصنيف الثنائي يقوم بتقسيم البيانات إلى فئتين حصريتين. 

  • التصنيف متعدد الفئات يصنف البيانات إلى أكثر من فئتين حصريتين. 

  • التصنيف متعدد التسميات يقوم بتصنيف البيانات إلى فئات غير حصرية. 

  • يتميز التصنيف غير المتوازن بتوزيع غير متساوٍ لنقاط البيانات عبر الفئات. 

التصنيف الثنائي

في مشكلات التصنيف الثنائي، يتنبأ النموذج بما إذا كانت البيانات تتناسب مع إحدى فئتين. طرق وأساليب التعلم التي يتم تطبيقها أثناء التدريب تقوم بتقييم النماذج للميزات في بيانات التدريب والتنبؤ بأي من التسميتين المحتملتين تنطبق على كل نقطة بيانات: إيجابية أو سلبية، صواب أو خطأ، نعم أو لا. 

على سبيل المثال، يصنف عامل تصفية البريد الإلكتروني العشوائي فيها رسائل البريد الإلكتروني على أنها عشوائية فيها أو غير عشوائية. وبالإضافة إلى الكشف عن الرسائل غير المرغوب فيها، فإن نماذج التصنيف الثنائي تقدم تنبؤات سلوكية موثوقًا بها: هل العميل الجديد المحتمل سيهرب منا أم سيشتري منتجًا معينًا؟ كما أنها مفيدة أيضًا في معالجة اللغة الطبيعية (NLP)، وتحليل المشاعر، وتصنيف الصور، والكشف عن الغش.

التصنيف متعدد الفئات

ونلاحظ أن مشكلات التصنيف متعدد الفئات تصنف البيانات بأكثر من تسميتين للفئة، وكلها متبادلة الاستبعاد (يستبعد بعضها بعضًا). وبهذه الطريقة، تشبه التحديات متعددة الفئات مهام التصنيف الثنائي، باستثناء المزيد من الفئات. 

تحتوي نماذج التصنيف متعددة الفئات على العديد من حالات الاستخدام في العالم الحقيقي. وبالإضافة إلى تحديد ما إذا كانت رسائل البريد الإلكتروني مزعجة أو غير مزعجة، فإن حل التصنيف متعدد الطبقات سيكون قادرًا أيضًا على تحديد ما إذا كانت رسائل البريد الإلكتروني ترويجية أو ذات أولوية عالية. قد يصنف مصنِّف الصور صور الحيوانات الأليفة باستخدام عدد لا يحصى من تسميات الفئة، مثل الكلب والقط واللاما وخلد الماء والمزيد

الهدف من طريقة تعلّم التصنيف متعدد الطبقات هو تعليم نموذج لتعيين الإدخال بدقة إلى نطاق أوسع من الفئات الممكنة. وتُعد دالة خسارة الإنتروبيا المتقاطعة الفئوية دالة هدف شائعة في تدريب التصنيف متعدد الفئات، وهي تقيِّم الفجوة بين توقعات النموذج باستخدام بيانات الاختبار مقابل التسميات الصحيحة لكل نقطة بيانات.

التصنيف متعدد التسميات

يتم استخدام التصنيف متعدد التسميات في الحالات التي يمكن فيها تعيين تسميات متعددة غير حصرية لكل نقطة بيانات. على عكس أنواع التصنيف القائمة على الاستبعاد، يسمح التصنيف متعدد التسميات باحتمال أن تُظهر نقاط البيانات خصائص أكثر من فئة واحدة، وهو ما يعكس بشكل أقرب الغموض الواقعي في مجموعات البيانات الضخمة. 

غالبًا ما يتم إنجاز مهام التصنيف متعدد التسميات من خلال الجمع بين تنبؤات العديد من نماذج التصنيف الثنائية أو متعددة الفئات.

التصنيف غير المتوازن

يتطلب التصنيف غير المتوازن، حيث تحتوي بعض الفئات على نقاط بيانات أكثر من غيرها، نهجًا متخصصًا. فكلما جمعت مجموعات معينة مزيدًا من نقاط البيانات، أصبحت بعض نماذج التصنيف متحيزة لتلك المجموعات وتتنبأ بشكل متزايد لصالحها. 

تشمل الإجراءات المضادة خوارزميات مُعَدَّة بحيث تُرجِّح كلفة التنبؤات الخاطئة بوزن أكبر، أو أساليب أخذ العينات التي إما أن تزيل عينات الأغلبية أو تُفرط في أخذ العينات من المجموعات المُمَثَّلة تمثيلًا ناقصًا. 

التنبؤات المنفصلة والمستمرة

تنتج النماذج التنبؤية نوعين من التنبؤات: 

  • تقوم التنبؤات المنفصلة بفرز البيانات بشكل قاطع ونهائي في فئات منفصلة متميزة. 

  • تقوم التنبؤات المستمرة بتعيين فئة بناءً على احتمالية من الاحتمالات. 

التنبؤات المنفصلة

التنبؤات المنفصلة هي تصنيفات الفئة المتوقعة لكل نقطة بيانات. على سبيل المثال، يمكن لمتنبئ الرعاية الصحية تصنيف المرضى الطبيين على أنهم مرضى السكري أو غير السكري بناءً على البيانات الصحية. فئتا السكري وغير السكري هما التنبؤات الفئوية المنفصلة.

التنبؤات المستمرة

تقوم المصنِّفات المستمرة بتعيين تنبؤات الفئة كاحتمالات مستمرة تُسمَّى درجات الثقة. وهذه الاحتمالات هي قيم تتراوح بين 0 و1، وتمثل النسب المئوية. قد يصنف نموذج التنبؤ بالسكري المريض على أنه مصاب بالسكري باحتمال 0.82. حيث يرى النموذج أن فرصة إصابة المريض بالسكري تبلغ 82%. 

يقوم الباحثون عادة بتقييم النماذج باستخدام تنبؤات منفصلة أثناء استخدام التنبؤات المستمرة كعتبات. ويتجاهل المصنِّف أي تنبؤ تحت عتبة معينة. إذا كان مؤشر مرض السكري لدينا يحتوي على عتبة 0.4 (40٪) ويصنف المريض على أنه مصاب بمرض السكري باحتمال 0.35 (35٪)، فإن النموذج سيتجاهل هذه التسمية ولن يعيِّن المريض إلى فئة مرضى السكري.3

التصنيف مقابل الانحدار

هناك فرق بين التصنيف والانحدار، فبينما يتنبأ التصنيف بفئة نقطة البيانات، نجد الانحدار يتنبأ بقيمة عددية حقيقية مرتبطة. وكل من التصنيف والانحدار نوعان من النمذجة التنبؤية لكن بحالات استخدام متميز بعضها عن بعض. 

نماذج التصنيف تصنف نقاط البيانات إلى فئات. والتصنيف هو عملية تدريب نموذج التعلم العميق لاكتشاف الدالة التي تصنف نقاط البيانات. 

تتناول نماذج الانحدار نقاط بيانات مختلفة للتنبؤ بقيمة عددية متصلة لمتغير آخر. على سبيل المثال، قد يتنبأ نموذج الانحدار في مكان العمل براتب العامل بناءً على العمر والخبرة وموقع العمل والتعليم. 

من الناحية العملية، غالبًا ما يكون الاثنان مرتبطين ارتباطًا وثيقًا. على سبيل المثال، نجد أن خوارزمية الانحدار اللوجستي تستخدم الانحدار لإنجاز مهام التصنيف.

أنواع خوارزميات التصنيف

هناك العديد من أنواع خوارزميات التصنيف المختلفة. ورغم وجود حالات استخدام متداخلة، إلا أن بعضها مناسب لتطبيقات معينة أكثر من غيرها. تتضمن بعض خوارزميات التصنيف الأكثر شيوعا ما يلي: 

  • الانحدار اللوجستي

  • شجرة القرار 

  • غابة عشوائية

  • آلة المتجهات الداعمة (SVM) 

  • خوارزميّة أقرب جار (K) 

  • بايز الساذج

يمكن تنفيذ العديد من هذه الخوارزميات بسهولة في Python باستخدام مكتبات scikit-learn. وفي الوقت نفسه، فإن الطرق التجميعية ونماذج المحولات تُعدُّ تطورات أحدث يتم تطبيقها على مشكلات التصنيف.

الانحدار اللوجستي

تُستخدم خوارزميات الانحدار اللوجستي غالبًا لأداء مهام التصنيف. الانحدار اللوجستي هو مصنِّف احتمالية مشتق من نماذج الانحدار الخطي . حيث يستخدم الانحدار الخطي متغيرًا مستقلًا واحدًا أو أكثر للتنبؤ بقيمة متغير مستقل. ويمكن أن تكون هذه القيمة أي عدد نسبي مستمر. 

الانحدار اللوجستي هو تعديل للانحدار الخطي بحيث تكون قيمة المخرجات (أو المتغير المستقل) محدودة بأي قيمة بين 0 و1. يقوم بذلك من خلال تطبيق اللوغاريتم—أو لوغاريتم الأرجحية— للتحويل على صيغة الانحدار الخطي القياسية:9

المعادلة اللوغاريتمية للانحدار اللوجستي

تُستخدم نماذج الانحدار للتصنيف الثنائي في مشكلات الانحدار متعدد المتغيرات: فمن منظور المتغيرات المتعددة، هل تنتمي نقطة البيانات إلى فئة واحدة أو أخرى؟ والتطبيقات الشائعة هي الكشف عن حالات الغش والتنبؤات الطبية الحيوية التي تهدف لتوقع النتائج الصحية. على سبيل المثال، نجح تنفيذ الانحدار اللوجستي للمساعدة على التنبؤ بوفيات المرضى الناجمة عن الإصابات الجسدية الخطيرة كالصدمات وأمراض القلب التاجية.10

شجرة القرار

يتم استخدام شجرة القرار لكل من التصنيف والانحدار، وتقسم مجموعة البيانات إلى مجموعات أصغر تدريجيًا في سلسلة من أحكام التصنيف الثنائي. ويشبه الهيكل الناتج شجرة، تتفرع إلى الخارج من حكم أولي إلى أوراق لاحقة أو عُقد لاحقة. 

رسم تخطيطي لخوارزمية شجرة القرار

إن طبيعة شجرة القرار الشبيهة بالمخططات الانسيابية تجعلها واحدة من أكثر النماذج بديهية بالنسبة لمستخدم الأعمال لفهمها. تُضيف شجرة القرار، التي يسهل تصورها، الوضوح والشفافية على عملية التصنيف من خلال تمثيلها الواضح لـعمليات القرار والمعايير المستخدمة لتصنيف البيانات. 

الغابة العشوائية

الغابة العشوائية هي طريقة تجميعية تجمع بين ناتج شجرة القرار المتعددة في النتائج واحدة. حيث تعمل "الغابة" الناتجة على تحسين دقة التنبؤ على دقة شجرة واحدة مع مواجهة الإفراط في التجهيز. مثل شجرة القرار، يمكن للغابات العشوائية التعامل مع كل من مهام التصنيف والانحدار. 

رسم تخطيطي لخوارزمية غابة عشوائية

تُنشئ خوارزميات الغابة العشوائية شجرة قرار متعددة لكل مهمة، وتجمع تنبؤات جميع الأشجار، ثم تختار شجرة القرار الأكثر شيوعًا كنتيجة نهائية. وتأخذ كل شجرة في الاعتبار مجموعة فرعية عشوائية من ميزات البيانات، مما يساعد على ضمان ارتباط منخفض بين الأشجار. 

آلة دعم المتجهات الداعمة (SVM)

تقوم خوارزميات آلة المتجهات الداعمة (SVM) برسم نقاط البيانات في فضاء متعدد الأبعاد، مع عدد الأبعاد المقابلة لعدد السمات في البيانات. وهدف الخوارزمية هو اكتشاف الخط الأمثل (المعروف أيضًا باسم المستوى الفائق أو حدود القرار) الذي يقسّم نقاط البيانات إلى فئات بأفضل شكل. 

المستوى الفائق الأمثل هو المستوى الذي يحتوي على أوسع هامش، وهو المسافة بين المستوى الفائق وأقرب نقاط بيانات في كل فئة. تعرف نقاط البيانات القريبة هذه باسم متجهات الدعم. تُعدُّ النماذج التي تفصل البيانات باستخدام مستوًى فائق نماذج خطية، ولكن يمكن لخوارزميات آلة المتجهات الداعمة (SVM) أيضًا التعامل مع مهام التصنيف غير الخطية مع مجموعات بيانات أكثر تعقيدًا. 

يعد كل من الانحدار اللوجستي وشجرة القرار والغابات العشوائية وخوارزميات آلة المتجهات الداعمة (SVM) أمثلة على نماذج التعلم المتحمسة (جاهزة ومدرَّبة مسبقًا): الخوارزميات التي تبني نماذج من بيانات التدريب ثم تطبق هذه النماذج على التنبؤات المستقبلية. ويستغرق التدريب وقتًا أطول، لكن بعد أن تبني الخوارزمية نموذجًا جيدًا، تكون التنبؤات أسرع. 

خوارزمية الجيران الأقرب (KNN)

تقوم خوارزميات أقرب جار (K) بتعيين نقاط البيانات على فضاء متعدد الأبعاد. حيث تقوم بتجميع نقاط البيانات ذات القيم المتشابهة في مجموعات منفصلة أو فئات منفصلة. ولتصنيف عينات البيانات الجديدة، ينظر المصنف إلى عدد k من النقاط الأقرب إلى البيانات الجديدة، ويحسب أعضاء كل فئة تضم المجموعة الفرعية المجاورة، ثم يعيد تلك النسبة كتقدير للفئة لنقطة البيانات الجديدة. 

بعبارة أخرى، يقوم النموذج بتعيين نقطة بيانات جديدة لأي فئة تضم غالبية جيران تلك النقطة. تُعد نماذج أقرب الجيران (KNN) من نماذج التعلم التي توصف بأنها نماذج كسالى؛ نظرًا لأنها خوارزميات لا تبني نموذجًا من بيانات التدريب بشكل فوري، بل تعتمد بدلًا من ذلك على بيانات التدريب وتُقارن البيانات الجديدة بها. وعادة ما يستغرق الأمر وقتًا أطول لهذه النماذج لعمل تنبؤات أكثر من نماذج التعلم المتحمسة. 

عادة ما تقارن نماذج أقرب الجيران (KNN) المسافة بين نقاط البيانات عادةً باستخدام المسافة الإقليدية:6

معادلة المسافة الإقليدية

أقرب جار تقريبي (ANN) هو شكل مُعدَّل (متغيّر/نسخة) من خوارزمية أقرب الجيران (KNN). في فضاءات البيانات ذات الأبعاد العالية، يعد العثور على جيران دقيقين لنقطة بيانات ما أمرًا مكلفًا من الناحية الحاسوبية. تقليل الأبعاد وأقرب جار تقريبي (ANN) هما حلان لهذه المشكلة. 

بدلًا من العثور على أقرب جار محدد لنقطة بيانات معينة، تعثر ANN على أقرب جار تقريبي ضمن مسافة محددة. وقد أظهرت الأبحاث الحديثة نتائج واعدة لـ ANN في سياق التصنيف متعدد التسميات.7

بايز الساذج

بناءً على نظرية بايز الرياضية، تحسب مصنِّفات بايز الساذج (Naive Bayes) الاحتمال اللاحق لتنبؤات الفئة. تقوم مصنِّفات Naive Bayes بتحديث تنبؤات الفئة الأولية، أو الاحتمالات السابقة، مع كل جزء جديد من البيانات. 

باستخدام مؤشر مرض السكري، نجد أن البيانات الطبية للمريض - كضغط الدم والعمر ومستويات السكر في الدم والمزيد - تُعدُّ من المتغيرات المستقلة. يجمع المصنِّف البايزي بين الانتشار الحالي لمرض السكري عبر السكان (الاحتمال المسبق) مع الاحتمال الشرطي لظهور قيم البيانات الطبية للمريض في شخص مصاب بداء السكري. 

تتبع مصنفات بايز الساذجة معادلة قاعدة بايز:8

معادلة قاعدة بايز

يعرف مصنِّف بايز الساذج بأنه مصنف توليدي. فباستخدام القيم المتغيرة للملاحظة، يحسب مصنِّف بايز الفئة التي من المرجح أن تكون قد ولدت الملاحظة. 

قام باحثو معالجة اللغة الطبيعية (NLP) بتطبيق خوارزمية Naïve Bayes على نطاق واسع لمهام تصنيف النص، مثل تحليل المشاعر. باستخدام نموذج كيس الكلمات (bag of words)، حيث تشكل كل كلمة متغيرا، يتنبأ مصنف Naive Bayes بما إذا كانت الفئة الإيجابية أو السلبية قد أنتجت النص المعني أم لا.9

طرق التجميع

تجمع الطرق التجميعية وأساليب التعلّم الآلي بين نماذج متعددة أصغر في مصنف واحد للحصول على أفضل نتائج ممكنة. وتجمع الطرق التجميعية العميقة نماذج التعلم العميق المتعددة معًا لإنشاء مصنفات تجميعية أكثر قوة. يمكن للمجموعات ذات نماذج التعلم المتعمقة التعامل مع مهام التصنيف المعقدة متعددة التسميات. 

تعزيز التدرج هو طريقة تجميعية أظهرت زيادة في دقة التنبؤ. فهو نوع من التعزيز، وهو أسلوب تجميعي يتعلم فيه العديد من نماذج التعلم الضعيفة بعضها من بعض بالتسلسل لتحسين النتائج مع كل تكرار.

نماذج المحولات في التصنيف

بينما تستخدم عادة لمهام البرمجة اللغوية العصبية، فقد تم تطبيق نماذج المحولات أيضًا على مشكلات التصنيف. تستخدم نماذج المحولات مثل GPT وClaude آليات الانتباه الذاتي للتركيز على الأجزاء الأكثر صلة من مجموعة البيانات. يُستخدم الترميز الموضعي لإبلاغ النموذج بمكان وجود كل نقطة بيانات في التسلسل. 

طرق تقييم تعلم التصنيف والتقييم

يقوم الباحثون والمطورون باختيار مقاييس تقييم معينة لنماذج التصنيف بناءً على مهمة التصنيف المحددة. وجميعها تقيس الدقة التي تتنبأ بها نماذج التعلم أو المصنفِّات بدقة بفصول النموذج. 

بعض مقاييس التقييم الأكثر شهرة هي: 

  • الصحة (أي: الدقة الإجمالية) 
  • الدقة (أي: الإحكام) 
  • الاستدعاء 
  • درجة F1
  • مصفوفة الإرباك
  • منحنى ROC

الإيجابيات الحقيقية (TP) هي عينات البيانات التي يتنبأ بها النموذج بشكل صحيح في فئتها الخاصة. الإيجابيات الكاذبة (FP) هي تلك الحالات من الفئة السلبية التي تم تحديدها بشكل غير صحيح على أنها حالات إيجابية. السلبيات الكاذبة (FN) هي حالات إيجابية فعلية تم التنبؤ بها خطأ على أنها سلبية. السلبيات الحقيقية (TN) هي مثيلات الفئة السلبية الفعلية التي يصنفها النموذج بدقة على أنها سلبية.

الدقة

الصحة هي نسبة الإيجابيات الحقيقية لجميع التنبؤات في مجموعة البيانات. وتقيس عدد المرات التي يتنبأ فيها نموذج التعلم الآلي بالنتيجة بشكل صحيح، وفي حالتنا هذه، هي الفئة المناسبة لنقطة البيانات. 

تعطي الصحة نظرة عامة عالية المستوى على أداء النموذج، لكنها لا تكشف ما إذا كان النموذج أفضل في التنبؤ بفئات معينة على فئات أخرى. أما في الحالات التي تكون فيها مجموعات البيانات غير متوازنة إلى حدٍ كبير، يمكن أن يؤدي التركيز على الصحة إلى تجاهل النموذج لجميع مجموعات البيانات الأصغر وتوقع جميع النتائج كفئة الأغلبية. وفي هذه الحالة، ستظل الصحة (الدقة الإجمالية) عالية. 

يكون لمرشح البريد العشوائي مثلًا صحة عالية إذا كانت معظم تخميناته صحيحة، حتى لو فاتته معظم رسائل البريد الإلكتروني غير المرغوب فيها الفعلية. 

الدقة

الدقة (أي: الإحكام)، أو القيمة المتوقعة الإيجابية (PPV)، هي نسبة تنبؤات الفئة الإيجابية التي تنتمي إلى الفئة المحددة. وتكشف الدقة (الإحكام) ما إذا كان النموذج يتنبأ بشكل صحيح بالفئة المستهدفة، مما يجعله مفيدًا لمهام التصنيف غير المتوازنة أو عندما تكون تكلفة الإيجابيات الخاطئة مرتفعة. 

في مرشح البريد العشوائي، تُظهر الدقة عدد رسائل البريد الإلكتروني العشوائية التي تم اكتشافها. فالنماذج التي تصنف البيانات بشكل غير صحيح على أنها إيجابيات خاطئة لها دقة منخفضة، بينما تتمتع النماذج ذات الإيجابيات الخاطئة الأقل بدقة عالية.10

صيغة الدقة

الاستدعاء

يعرف الاستدعاء أيضًا باسم الحساسية أو المعدل الإيجابي الحقيقي (TPR)، ويشير إلى النسبة المئوية لمثيلات الفئة التي اكتشفها النموذج. يُظهر الاستدعاء عدد المرات التي يكتشف فيها النموذج أعضاء الفئة المستهدفة في مجموعة البيانات. بالنسبة لعامل تصفية البريد العشوائي، يعرض الاستدعاء مقدار رسائل البريد الإلكتروني غير المرغوب فيها الفعلية التي يحددها النموذج على أنها رسائل غير مرغوب فيها.11

درجة F1

الدقة والاستدعاء يتشاركان في علاقة عكسية. فنظرًا لأن المصنِّف يرجع المزيد من الإيجابيات الحقيقية التي تظهر زيادة في الاستدعاء، فإنه يمكن أن يخطئ في تصنيف الحالات غير المثيلات، مما يؤدي إلى إنشاء إيجابيات خاطئة وتقليل الدقة. تعمل درجة F1 على حل هذه الموازنة عن طريق الجمع بين الدقة والاستدعاء لتمثيل الصحة الكلية للنموذج على مستوى الفئات.12

صيغة F-score

عرض مصور للبيانات وتقييم النموذج

تساعد أدوات العرض المصور للبيانات على توضيح النتائج في تحليل البيانات. ويستخدم علماء البيانات وباحثو التعلم الآلي أداتين أساسيتين لتصور أداء المصنِّف: 

  • مصفوفة الارتباك، وهي جدول يوضح القيم المتوقعة مقابل القيم الحقيقية. 

  • منحنى ROC، وهو رسم بياني يصور نسبة الإيجابيات الحقيقية إلى السلبيات الحقيقية.

مصفوفة الإرباك

مصفوفة الارتباك هي جدول يمثل القيم المتوقعة والفعلية للفئة. حيث نجد أن مربعات المصفوفة تصور أعداد الإيجابيات الحقيقية والإيجابيات الخاطئة والسلبيات الكاذبة والسلبيات الحقيقية. ويكون إجمالي هذه القيم هو إجمالي عدد تنبؤات النموذج.13

عينة من الإرباك الثنائية

منحنى ROC

منحنى خاصية التشغيل المُستقبِل (ROC) يصور نسبة الإيجابيات الحقيقية إلى السلبيات الحقيقية. ويرسم الرسم البياني المعدل الإيجابي الحقيقي مقابل المعدل السلبي الحقيقي لكل عتبة مستخدمة في تصنيف النموذج. ونحصل على إحصاء المساحة تحت المنحنى (AUC) من منحنى ROC. 

المساحة تحت المنحنى (AUC) تقيس مدى احتمالية أن تكون درجة الثقة في النتيجة الإيجابية المختارة عشوائيًا أعلى من السلبية العشوائية. تتراوح قيم AUC من 0 إلى 1. تشير الدرجة 0 إلى أن النموذج يسجل جميع السلبيات باحتمالات أعلى من الإيجابيات، بينما تعني العلامة 1 أن النموذج يسجل كل إيجابية باحتمالية أعلى.14

حلول ذات صلة
IBM watsonx.ai

تدريب الذكاء الاصطناعي التوليدي والتحقق من صحته وضبطه ونشره، وكذلك قدرات نماذج الأساس والتعلم الآلي باستخدام IBM watsonx.ai، وهو استوديو الجيل التالي من المؤسسات لمنشئي الذكاء الاصطناعي. أنشئ تطبيقات الذكاء الاصطناعي بسرعة أكبر وببيانات أقل.

اكتشف watsonx.ai
حلول الذكاء الاصطناعي

استفد من الذكاء الاصطناعي في عملك بالاستعانة بخبرة IBM الرائدة في مجال الذكاء الاصطناعي ومحفظة حلولها المتوفرة لك.

استكشف حلول الذكاء الاصطناعي
الاستشارات والخدمات المتعلقة بالذكاء الاصطناعي

أعدّ ابتكار عمليات ومهام سير العمل الحساسة بإضافة الذكاء الاصطناعي لتعزيز التجارب وصنع القرارات في الوقت الفعلي والقيمة التجارية.

استكشف خدمات الذكاء الاصطناعي
اتخِذ الخطوة التالية

احصل على وصول شامل إلى القدرات التي تغطي دورة حياة تطوير الذكاء الاصطناعي. تمكَّن من إنتاج حلول ذكاء اصطناعي قوية بفضل الواجهات سهلة الاستخدام وعمليات سير العمل السلسة وإمكانية الوصول إلى واجهات برمجة التطبيقات ومجموعات تطوير البرامج القياسية في الصناعة.

استكشف watsonx.ai احجز عرضًا توضيحيًا مباشرًا
الحواشي

1. Chris Drummond, “Classification,” Encyclopedia of Machine Learning and Data Mining, Springer, 2017.

2. Jaiwei Han, Micheline Kamber, and Jian Pei, Data Mining: Concepts and Techniques, 3rd edition, Morgan Kaufman, 2012.

3. Max Kuhn and Kjell Johnson, Applied Predictive Modeling, Springer, 2016.

4. Max Kuhn and Kjell Johnson, Applied Predictive Modeling, Springer, 2016. Gareth James, Daniela Witten, Trevor Hastie, Robert Tibshirani, and Jonathan Taylor, An Introduction to Statistical Learning with Applications in Python, Springer, 2023

5. Lisa X. Deng, Abigail May Khan, David Drajpuch, Stephanie Fuller, Jonathan Ludmir, Christopher E. Mascio, Sara L. Partington, Ayesha Qadeer, Lynda Tobin, Adrienne H. Kovacs, and Yuli Y. Kim, "Prevalence and Correlates of Post-traumatic Stress Disorder in Adults With Congenital Heart Disease," The American Journal of Cardiology, Vol. 117, No. 5, 2016, pp. 853-857, https://www.sciencedirect.com/science/article/abs/pii/S0002914915023590

6. Max Kuhn and Kjell Johnson, Applied Predictive Modeling, Springer, 2016. Kevin Murphy, Machine Learning: A Probabilistic Perspective, MIT Press, 2012.

7. Ville Hyvönen, Elias Jääsaari, Teemu Roos, “A Multilabel Classification Framework for Approximate Nearest Neighbor Search,” Journal of Machine Learning Research, Vol. 25, No. 46, 2024, pp. 1−51, https://www.jmlr.org/papers/v25/23-0286.html  

8. Max Kuhn and Kjell Johnson, Applied Predictive Modeling, Springer, 2016. William Bolstad and James Curran, Introduction to Bayesian Statistics, 3rd edition, Wiley, 2016.

9. Daniel Jurafsky and James Martin, Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition, 3rd edition, 2023.

10. Ethan Zhang and Yi Zhang, “Precision,” Encyclopedia of Database Systems, Springer, 2018.

11. Ethan Zhang and Yi Zhang, “Recall,” Encyclopedia of Database Systems, Springer, 2018.

12. Ben Carterette, “Precision and Recall,” Encyclopedia of Database Systems, Springer, 2018.

13. Kai Ming Ting, “Confusion matrix,” Encyclopedia of Machine Learning and Data Mining, Springer, 2017.

14. Peter Flach, “ROC Analysis,” Encyclopedia of Machine Learning and Data Mining, Springer, 2017.