كلنا نريد أن نرى قيمنا الإنسانية المثالية متجسدة في تقنياتنا. نتوقع من تقنيات مثل الذكاء الاصطناعي ألا تكذب علينا، ولا تميز، وأن يكون استخدامها آمنًا لنا ولأطفالنا. ومع ذلك، يواجه العديد من منشئي الذكاء الاصطناعي حاليا ردود فعل سلبية بسبب التحيزات والأخطاء والممارسات الإشكالية في البيانات التي يتم كشفها في نماذجهم. تتطلب هذه المشكلات أكثر من مجرد حل تقني أو خوارزمي أو قائم على الذكاء الاصطناعي. في الواقع، يلزم اتباع نهج اجتماعي تقني شامل.
جميع النماذج التنبؤية، بما في ذلك الذكاء الاصطناعي، تكون أكثر دقة عندما تدمج ذكاء وتجارب بشرية متنوعة. هذا لا يعبر عن رأي شخصي، بل له أساس صحيح يستند إلى أدلة عملية. ضع في اعتبارك نظرية التنبؤ بالتنوع. ببساطة، عندما يزداد التنوع داخل مجموعة ما، يتقلص الخطأ الجماعي، وهو ما يدعم مفهوم "حكمة الجماعة". في دراسة مؤثرة، تبين أن المجموعات المتنوعة من ذوي القدرة المنخفضة على حل المشكلات يمكن أن تتفوق على مجموعات من ذوي القدرة العالية على حل المشكلات(Hong وPage، عام 2004).
بلغة الرياضيات: كلما كان التباين لديك أوسع، كان المتوسط لديك أقرب إلى المعيار. تبدو المعادلة على النحو التالي:
حيث أن
c = متوسط التنبؤ بالجماعة
𝜽 = القيمة الفعلية
si = التنبؤ بالفرد n
ith = عدد الأفراد
وقد قدمت دراسة أخرى عمليات حسابية إضافية تحسِّن من التعريفات الإحصائية للجماعة الحكيمة، بما في ذلك الجهل بتوقعات الأعضاء الآخرين وإدراج أولئك الذين لديهم توقعات أو أحكام مختلفة إلى أقصى حد (ذات الارتباط السلبي). لذا، ليس الحجم فقط، بل التنوع أيضًا هو ما يحسن التوقعات. كيف يمكن أن تؤثر هذه المعارف على تقييم نماذج الذكاء الاصطناعي؟
على حد تعبير المقولة الشائعة، كل النماذج فيها قدر من الخطأ. وهذا ينطبق على مجالات الإحصاء والعلوم والذكاء الاصطناعي. يمكن أن تؤدي النماذج التي تم إنشاؤها مع نقص الخبرة في المجال إلى مخرجات خاطئة.
في الوقت الحالي، تحدد مجموعة صغيرة ومتجانسة من الأفراد نوعية البيانات المستخدمة لتدريب نماذج الذكاء الاصطناعي التوليدي، وتُستمد هذه البيانات من مصادر تطغى عليها اللغة الإنجليزية. بالنسبة إلى معظم اللغات في العالم التي يتجاوز عددها 6,000 لغة، فإن البيانات النصية المتاحة لا تكفي لتدريب نموذج أساس واسع النطاق" (نقلاً عن "حول فرص ومخاطر نماذج الأساس"، Bommasani وآخرون، 2022).
علاوة على ذلك، يتم إنشاء النماذج نفسها بناءً على هياكل معمارية محدودة: "جميع نماذج معالجة اللغات الطبيعية الحديثة تقريباً مستخلصة الآن من عدد قليل من نماذج الأساس، مثل BERT، وRoBERTa، وBART، وT5، وغيرها. في حين أن هذا التجانس يخلق تأثيراً كبيراً للغاية (فأي تحسينات تطرأ على نماذج الأساس يمكن أن تؤدي إلى فوائد فورية عبر مجال معالجة اللغات الطبيعية بأكمله)، إلا أنه يمثل أيضاً نقطة ضعف؛ فقد ترث جميع أنظمة الذكاء الاصطناعي التحيزات الإشكالية نفسها لعدد قليل من النماذج (Bommasani وآخرون)"
لتحقيق أفضل تمثيل للمجتمعات المتنوعة التي يقدم لها الذكاء الاصطناعي التوليدي خدماته، من الضروري إشراك بيانات بشرية من نطاق أوسع بكثير ضمن النماذج.
يسير تقييم دقة النموذج جنبًا إلى جنب مع تقييم التحيُّز. يجب أن نسأل، ما المقصود بالنموذج ولمن يتم تحسينه؟ فكر مثلاً في من يحصل على فائدة أكثر من خوارزميات توصية المحتوى وخوارزميات محركات البحث. قد يكون لدى أصحاب المصلحة اهتمامات وأهداف مختلفة تمامًا. تتطلب الخوارزميات والنماذج وجود أهداف أو بدائل لخطأ بايز (Bayes error)، وهو الحد الأدنى للخطأ الذي يجب على النموذج أن يسعى لتحسينه. غالبًا ما يكون هذا الوكيل شخصًا، كخبير متخصص لديه دراية واسعة بالمسألة.
تؤكد اللوائح الذكاء الاصطناعي الناشئة وخطط العمل بشكل متزايد على أهمية نماذج التقييم الخوارزمية. يتمثل الهدف من هذه النماذج في جمع معلومات مهمة بشأن نماذج الذكاء الاصطناعي حتى تتمكن فرق الحوكمة من تقييم ومعالجة مخاطرها قبل أن يتم نشرها. تتضمن الأسئلة النموذجية ما يلي:
على الرغم من أن نماذج الذكاء الاصطناعي هذه مُصممة بنوايا جيدة، فإن المشكلة تكمن في أن غالبية مالكيها لا يدركون كيفية تقييم المخاطر المرتبطة بحالات استخدامهم. غالباً ما يتردد هذا التساؤل: "ما هي احتمالية تحيّز النموذج الخاص بي رغم عدم قيامه بجمع بيانات تحديد الهوية الشخصية (PII)؟" ونتيجة لذلك، نادراً ما تُملأ النماذج بالتمعن الكافي الذي تتطلبه أنظمة الحوكمة لتحديد عوامل الخطر بدقة.
وبالتالي، يتم التأكيد على الطبيعة الاجتماعية والتقنية للحل. لا يمكن ببساطة إعطاء مالك النموذج - أي الفرد - قائمة من خانات الاختيار لتقييم ما إذا كانت حالة الاستخدام الخاصة به ستسبب ضررًا أم لا. المطلوب بدلاً من ذلك هو تجمّع مجموعات من الأفراد ذوي الخبرات الحياتية شديدة التباين في مجتمعات توفر لهم الأمان النفسي، لإجراء محادثات صعبة حول التأثير المتباين.
تؤمن IBM باتباع نهج "العميل صفر"، والذي يشمل تطبيق التوصيات والأنظمة التي ستقدمها لعملائها عبر الحلول الاستشارية والمنتجات الموثوقة. يمتد هذا النهج إلى الممارسات الأخلاقية، ولهذا السبب قامت IBM بإنشاء مركز التميز (COE) للذكاء الاصطناعي الجدير بالثقة.
كما شرح أعلاه، تنوع التجارب والمهارات يعد أمرًا حساسًا بالنسبة إلى تقييم تأثيرات الذكاء الاصطناعي تقييمًا سليمًا. بيد أن احتمال الانضمام إلى مركز التميز قد يكون أمراً شاقاً في شركة تزخر بالمبتكرين والخبراء والمهندسين المتميزين في الذكاء الاصطناعي، ولذا فإن بناء مجتمع يتمتع بالأمان النفسي يعد أمراً حتمياً. تعبر IBM عن ذلك بوضوح بقولها: "هل أنت مهتم بالذكاء الذكاء الاصطناعي؟ هل تهتم بأخلاقيات الذكاء الاصطناعي؟ لديك مقعد على هذه الطاولة".
يقدم مركز التميز تدريبًا في مجال أخلاقيات الذكاء الاصطناعي للممارسين على جميع المستويات. ويتم تقديم كل من التعلم المتزامن (بوجود المعلم والطلاب في قاعة الدرس) والتعلم غير التزامني (التعلم الموجّه ذاتياً).
لكن التدريب التطبيقي في مركز التميز هو ما يمنح ممارسينا أعمق الرؤى، حيث يعملون مع فرق عالمية متنوعة ومتعددة التخصصات على مشاريع حقيقية لفهم التأثيرات المتباينة بشكل أفضل. كما يستفيدون من أطر التفكير التصميمي التي تستخدمها مجموعة التصميم من أجل الذكاء الاصطناعي في IBM داخليا ومع العملاء لتقييم الآثار غير المقصودة لنماذج الذكاء الاصطناعي، ما يبقي الفئات المهمشة غالبًا في صدارة الاهتمام. (للاطلاع على أمثلة عن كيفية تقاطع الخصائص الشخصية مع امتيازات الأشخاص أو تهميشهم، انظر "Wheel of Power and Privilege" من إبداع Sylvia Duckworth). تبرعت IBM أيضًا بالعديد من أطر العمل لمجتمع المصدر المفتوح Design Ethically.
فيما يلي بعض التقارير التي نشرتها IBM علنًا عن هذه المشاريع:
أدوات حوكمة نماذج الذكاء الاصطناعي الآلية ضرورية لاستخلاص رؤى حول كيفية أداء نموذج الذكاء الاصطناعي الخاص بك. ولكن لاحظ أن رصد المخاطر والتعامل معها، قبل وقت طويل من تطوير النموذج ووصوله إلى مرحلة التشغيل، هو الخيار الأفضل. من خلال إنشاء مجتمعات من الممارسين المتنوعين ومتعددي التخصصات توفر مساحة آمنة للناس لإجراء محادثات صعبة حول التأثير المتباين، يمكنك بدء رحلتك لتطبيق مبادئك وتطوير الذكاء الاصطناعي بمسؤولية.
عند توظيف ممارسي الذكاء الاصطناعي، ضع في اعتبارك أن أكثر من %70 من الجهد في إنشاء النماذج يذهب إلى تنسيق البيانات المناسبة، فأنت تريد توظيف أشخاص يعرفون كيفية جمع البيانات التي تُعدُّ تمثيلية والتي يتم جمعها أيضاً بموجب موافقة. ومن الضروري أيضاً أن توظف أفراد لديهم القدرة على التعاون الوثيق مع خبراء المجال لضمان تطبيقهم للطريقة السليمة. إن ضمان امتلاك هؤلاء الممارسين للذكاء العاطفي اللازم للتعامل مع تحدي تنسيق الذكاء الاصطناعي بشكل مسؤول بتواضع وبصيرة هو أمر جوهري. ينبغي علينا أن نتعمد التعلم حول كيفية معرفة متى يمكن للذكاء الاصطناعي أن يزيد من اللامساواة، وأن ندرك أن قدرته على زيادة الذكاء البشري لا تقل عن ذلك.
