أحيانًا كعلماء بيانات، غالبًا ما نكون مصممين على بناء نموذج مثالي لدرجة أننا قد ندرج التحيز البشري في نماذجنا دون قصد. وفي كثير من الأحيان يتسلل التحيز من خلال بيانات التدريب ثم يتم تضخيمه وإدراجه في النموذج. وإذا دخل هذا النموذج دورة إنتاج، فقد يكون له تداعيات خطيرة موجهة بالتحيز مثل التنبؤ الخاطئ بدرجة الائتمان أو فحص السلامة. عبر مختلف الصناعات، تهدف المتطلبات التنظيمية لعدالة النماذج والذكاء الاصطناعي الجدير بالثقة إلى منع النماذج المتحيزة من دخول دورات الإنتاج.
لكي تكون عالم بيانات مسؤولًا، هناك اعتباران رئيسيان عند إنشاء مسار نموذجي:
ليس من السهل اكتشاف وتحديد التحيز والظلم. ولمساعدة علماء البيانات على التفكير وتحديد المخاوف الأخلاقية المحتملة، يجب أن تتضمن العملية القياسية لتعدين البيانات 3 خطوات إضافية: تقييم مخاطر البيانات، وتقييم مخاطر النماذج، ومراقبة الإنتاج.
النشرة الإخبارية الخاصة بالمجال
ابقَ على اطلاع دائم على أبرز الاتجاهات في مجالات الذكاء الاصطناعي، والأتمتة، والبيانات، وغيرها الكثير من خلال رسالة Think الإخبارية. راجع بيان الخصوصية لشركة IBM.
سيصلك محتوى الاشتراك باللغة الإنجليزية. ستجد رابط إلغاء الاشتراك في كل رسالة إخبارية. يمكنك إدارة اشتراكاتك أو إلغاء اشتراكك من هنا. لمزيد من المعلومات، راجع بيان خصوصية IBM.
تسمح هذه الخطوة لعالم البيانات بتقييم ما إذا كان هناك أي اختلالات بين مجموعات مختلفة من الأشخاص بالنسبة للمتغير المستهدف. على سبيل المثال، ما زلنا نلاحظ أن الرجال يتم قبولهم في مناصب إدارية أكثر من النساء. لكننا جميعًا نعلم أن تقديم وظيفة على أساس النوع أمر غير قانوني، لذا من أجل تحقيق توازن في النموذج، يمكن القول إن النوع لا ينبغي أن يكون له تأثير ويمكن حذفه. ولكن ما الذي يمكن أن تؤثر عليه أيضًا بحذف النوع؟ قبل اتخاذ هذه الخطوة يجب فحص هذه الخطوة مع الخبراء لتحديد ما إذا كانت الفحوصات الحالية كافية للتخفيف من التحيز المحتمل في النموذج أم لا.
والهدف من موازنة البيانات هو محاكاة توزيع البيانات المستخدمة في الإنتاج، وذلك لضمان أن تكون بيانات التدريب في أقرب وقت ممكن من البيانات المستخدمة في الوقت الفعلي في بيئة الإنتاج. لذا، في حين أن رد الفعل الأولي هو إسقاط المتغير المتحيز، فمن غير المرجح أن يحل هذا النهج المشكلة. غالبًا ما تكون المتغيرات مترابطة ويمكن أن يتسلل التحيز من خلال أحد الحقول المترابطة، ليعمل كوكيل في النموذج. لذلك، يجب فحص جميع الارتباطات قبل إزالة التحيز لضمان إزالته بالفعل.
تنبؤات النموذج لها آثار فورية وخطيرة، في الواقع، يمكنها تغيير حياة شخص ما تمامًا. إذا توقع أحد النماذج أن لديك درجة ائتمان منخفضة، فقد يؤثر ذلك على كل شيء في حياتك، من صعوبة الحصول على بطاقات ائتمان وقروض، إلى إيجاد سكن، والحصول على معدلات فائدة معقولة. بالإضافة إلى ذلك، إذا لم تجد سببًا وراء انخفاض الدرجات، فلا توجد فرصة للتحسين.
تتمثل وظيفة عالم البيانات في التأكد من أن النموذج يعطي أفضل النتائج للجميع. وإذا كانت البيانات متحيزة، فإن النموذج سيتعلم من هذا التحيز ويُصدر تنبؤات غير عادلة. تقدم نماذج الصندوق الأسود نتائج رائعة، لكنها تفتقر إلى القابلية للتفسير والوضوح، مما يجعل من المستحيل التحقق من وجود أي علامات تحذيرية لضمان العدالة. ومن ثم، فإن البحث العميق في نتائج النموذج أمر ضروري. ويحتاج عالم البيانات إلى تقييم المقايضة بين قابلية التفسير والأداء واختيار النماذج التي تلبي المتطلبات بشكل أفضل.
بمجرد أن يتم تطوير النموذج من قبل عالم البيانات، فإنه غالبًا ما يتم تسليمه إلى فريق MLOps. وعندما يتم وضع بيانات النموذج الجديد في مرحلة الإنتاج، يمكن أن يؤدي ذلك إلى ظهور إمكانية جديدة للتحيز أو تعزيز التحيز الذي تم التغاضي عنه في السابق دون وجود مراقبة مناسبة. ويمكن أن تؤدي بيانات الإنتاج إلى انحراف في الأداء أو الاتساق، ويبث التحيز في النموذج والبيانات. ومن المهم جدًا مراقبة النماذج من خلال إدخال تنبيهات مناسبة تشير إلى تدهور أداء النموذج وآلية لتحديد متى يتم إيقاف نموذج لم يعد صالحًا للاستخدام باستخدام أداة مثل IBM Watson Studio. ومرة أخرى، يجب تتبع جودة البيانات من خلال مقارنة توزيع بيانات الإنتاج بالبيانات المستخدمة لتدريب النموذج.
يعني علم البيانات المسؤول التفكير في النموذج بما يتجاوز الرمز والأداء، وهو يتأثر بشكل كبير بالبيانات التي تعمل عليها ومدى موثوقيتها. وفي نهاية المطاف، يُعد التخفيف من التحيز عملية حساسة ولكنها حاسمة، تساعد في ضمان أن تتبع النماذج الإجراءات الإنسانية الصحيحة. وهذا لا يعني أنك بحاجة إلى القيام بأي شيء جديد، ولكن من المهم إعادة التفكير وإعادة صياغة ما نقوم به بالفعل كعلماء بيانات لضمان القيام به بطريقة مسؤولة.
للتعرف على المزيد حول كيفية تأثير البيانات على قدرتك على إنشاء الذكاء الاصطناعي الجدير بالثقة، قم بزيارة موقعنا الإلكتروني.
لكي تزدهر الشركات، يجب عليها استخدام البيانات لتعزيز ولاء العملاء، وأتمتة عمليات الأعمال، والابتكار باستخدام الحلول المستندة إلى الذكاء الاصطناعي.
استفِد من قيمة بيانات المؤسسة مع IBM Consulting لبناء مؤسسة تعتمد على الرؤى لتحقيق ميزة تنافسية في الأعمال.
تعرَّف على Cognos Analytics 12.0، رؤى مدعومة بالذكاء الاصطناعي لتحسين عملية اتخاذ القرارات.