3 خطوات جديدة في عملية تعدين البيانات لضمان الذكاء الاصطناعي الجدير بالثقة

صف من الخوادم السوداء مع كابلات زرقاء متشابكة

مؤلف

Karolina Dufour-Kruszewska

IBM Data Scientist

أحيانًا كعلماء بيانات، غالبًا ما نكون مصممين على بناء نموذج مثالي لدرجة أننا قد ندرج التحيز البشري في نماذجنا دون قصد. وفي كثير من الأحيان يتسلل التحيز من خلال بيانات التدريب ثم يتم تضخيمه وإدراجه في النموذج. وإذا دخل هذا النموذج دورة إنتاج، فقد يكون له تداعيات خطيرة موجهة بالتحيز مثل التنبؤ الخاطئ بدرجة الائتمان أو فحص السلامة. عبر مختلف الصناعات، تهدف المتطلبات التنظيمية لعدالة النماذج والذكاء الاصطناعي الجدير بالثقة إلى منع النماذج المتحيزة من دخول دورات الإنتاج.

لكي تكون عالم بيانات مسؤولًا، هناك اعتباران رئيسيان عند إنشاء مسار نموذجي:

  1. التحيز: نموذج يقدم تنبؤات لأشخاص من مجموعة مختلفة (أو عرق أو مجموعة عرقية أو غيرها) يميزهم بانتظام ضد البقية
  2. الظلم: نموذج يقوم بالتنبؤات بطرق تحرم الناس من ممتلكاتهم أو حريتهم دون رؤية واضحة

ليس من السهل اكتشاف وتحديد التحيز والظلم. ولمساعدة علماء البيانات على التفكير وتحديد المخاوف الأخلاقية المحتملة، يجب أن تتضمن العملية القياسية لتعدين البيانات 3 خطوات إضافية: تقييم مخاطر البيانات، وتقييم مخاطر النماذج، ومراقبة الإنتاج.

أحدث الأخبار التقنية، مدعومة برؤى خبراء

ابقَ على اطلاع دائم على أبرز الاتجاهات في مجالات الذكاء الاصطناعي، والأتمتة، والبيانات، وغيرها الكثير من خلال رسالة Think الإخبارية. راجع بيان الخصوصية لشركة IBM.

شكرًا لك! أنت مشترك.

سيصلك محتوى الاشتراك باللغة الإنجليزية. ستجد رابط إلغاء الاشتراك في كل رسالة إخبارية. يمكنك إدارة اشتراكاتك أو إلغاء اشتراكك من هنا. لمزيد من المعلومات، راجع بيان خصوصية IBM.

1. تقييم مخاطر البيانات

تسمح هذه الخطوة لعالم البيانات بتقييم ما إذا كان هناك أي اختلالات بين مجموعات مختلفة من الأشخاص بالنسبة للمتغير المستهدف. على سبيل المثال، ما زلنا نلاحظ أن الرجال يتم قبولهم في مناصب إدارية أكثر من النساء. لكننا جميعًا نعلم أن تقديم وظيفة على أساس النوع أمر غير قانوني، لذا من أجل تحقيق توازن في النموذج، يمكن القول إن النوع لا ينبغي أن يكون له تأثير ويمكن حذفه. ولكن ما الذي يمكن أن تؤثر عليه أيضًا بحذف النوع؟ قبل اتخاذ هذه الخطوة يجب فحص هذه الخطوة مع الخبراء لتحديد ما إذا كانت الفحوصات الحالية كافية للتخفيف من التحيز المحتمل في النموذج أم لا.

والهدف من موازنة البيانات هو محاكاة توزيع البيانات المستخدمة في الإنتاج، وذلك لضمان أن تكون بيانات التدريب في أقرب وقت ممكن من البيانات المستخدمة في الوقت الفعلي في بيئة الإنتاج. لذا، في حين أن رد الفعل الأولي هو إسقاط المتغير المتحيز، فمن غير المرجح أن يحل هذا النهج المشكلة. غالبًا ما تكون المتغيرات مترابطة ويمكن أن يتسلل التحيز من خلال أحد الحقول المترابطة، ليعمل كوكيل في النموذج. لذلك، يجب فحص جميع الارتباطات قبل إزالة التحيز لضمان إزالته بالفعل.

Mixture of Experts | 12 ديسمبر، الحلقة 85

فك تشفير الذكاء الاصطناعي: تقرير إخباري أسبوعي

انضمّ إلى نخبة من المهندسين والباحثين وقادة المنتجات وغيرهم من الخبراء وهم يقدّمون أحدث الأخبار والرؤى حول الذكاء الاصطناعي، بعيدًا عن الضجيج الإعلامي.

2. نموذج لإدارة المخاطر

تنبؤات النموذج لها آثار فورية وخطيرة، في الواقع، يمكنها تغيير حياة شخص ما تمامًا. إذا توقع أحد النماذج أن لديك درجة ائتمان منخفضة، فقد يؤثر ذلك على كل شيء في حياتك، من صعوبة الحصول على بطاقات ائتمان وقروض، إلى إيجاد سكن، والحصول على معدلات فائدة معقولة. بالإضافة إلى ذلك، إذا لم تجد سببًا وراء انخفاض الدرجات، فلا توجد فرصة للتحسين.

تتمثل وظيفة عالم البيانات في التأكد من أن النموذج يعطي أفضل النتائج للجميع. وإذا كانت البيانات متحيزة، فإن النموذج سيتعلم من هذا التحيز ويُصدر تنبؤات غير عادلة. تقدم نماذج الصندوق الأسود نتائج رائعة، لكنها تفتقر إلى القابلية للتفسير والوضوح، مما يجعل من المستحيل التحقق من وجود أي علامات تحذيرية لضمان العدالة. ومن ثم، فإن البحث العميق في نتائج النموذج أمر ضروري. ويحتاج عالم البيانات إلى تقييم المقايضة بين قابلية التفسير والأداء واختيار النماذج التي تلبي المتطلبات بشكل أفضل.

3. مراقبة الإنتاج

بمجرد أن يتم تطوير النموذج من قبل عالم البيانات، فإنه غالبًا ما يتم تسليمه إلى فريق MLOps. وعندما يتم وضع بيانات النموذج الجديد في مرحلة الإنتاج، يمكن أن يؤدي ذلك إلى ظهور إمكانية جديدة للتحيز أو تعزيز التحيز الذي تم التغاضي عنه في السابق دون وجود مراقبة مناسبة. ويمكن أن تؤدي بيانات الإنتاج إلى انحراف في الأداء أو الاتساق، ويبث التحيز في النموذج والبيانات. ومن المهم جدًا مراقبة النماذج من خلال إدخال تنبيهات مناسبة تشير إلى تدهور أداء النموذج وآلية لتحديد متى يتم إيقاف نموذج لم يعد صالحًا للاستخدام باستخدام أداة مثل IBM Watson Studio. ومرة أخرى، يجب تتبع جودة البيانات من خلال مقارنة توزيع بيانات الإنتاج بالبيانات المستخدمة لتدريب النموذج.

يعني علم البيانات المسؤول التفكير في النموذج بما يتجاوز الرمز والأداء، وهو يتأثر بشكل كبير بالبيانات التي تعمل عليها ومدى موثوقيتها. وفي نهاية المطاف، يُعد التخفيف من التحيز عملية حساسة ولكنها حاسمة، تساعد في ضمان أن تتبع النماذج الإجراءات الإنسانية الصحيحة. وهذا لا يعني أنك بحاجة إلى القيام بأي شيء جديد، ولكن من المهم إعادة التفكير وإعادة صياغة ما نقوم به بالفعل كعلماء بيانات لضمان القيام به بطريقة مسؤولة.

للتعرف على المزيد حول كيفية تأثير البيانات على قدرتك على إنشاء الذكاء الاصطناعي الجدير بالثقة، قم بزيارة موقعنا الإلكتروني.

 
حلول ذات صلة
أدوات التحليلات والحلول ذات الصلة بها

لكي تزدهر الشركات، يجب عليها استخدام البيانات لتعزيز ولاء العملاء، وأتمتة عمليات الأعمال، والابتكار باستخدام الحلول المستندة إلى الذكاء الاصطناعي.

استكشف حلول التحليلات
خدمات الاستشارات في مجال البيانات والتحليلات

استفِد من قيمة بيانات المؤسسة مع IBM Consulting لبناء مؤسسة تعتمد على الرؤى لتحقيق ميزة تنافسية في الأعمال.

اكتشف خدمات التحليلات
IBM Cognos Analytics

تعرَّف على Cognos Analytics 12.0، رؤى مدعومة بالذكاء الاصطناعي لتحسين عملية اتخاذ القرارات.

استكشف Cognos Analytics
اتخِذ الخطوة التالية

لكي تزدهر الشركات، يجب عليها استخدام البيانات لتعزيز ولاء العملاء، وأتمتة عمليات الأعمال، والابتكار باستخدام الحلول المستندة إلى الذكاء الاصطناعي.

استكشف حلول التحليلات اكتشف خدمات التحليلات