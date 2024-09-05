مؤسسة التقييمات Smarter Balanced التي يقع مقرها في كاليفورنيا هي مؤسسة عامة يقودها الأعضاء وتوفر أنظمة تقييم للمعلمين في المدارس والجامعات. تأسست المؤسسة في عام 2010، وتتعاون مع وكالات التعليم الحكومية لتطوير أنظمة تقييم مبتكرة ومتوافقة مع المعايير. تدعم Smarter Balanced المعلمين بأدوات ودروس وموارد، بما في ذلك التقييمات التكوينية والمرحلية والنهائية، والتي تساعد المعلمين على تحديد فرص التعلم وتعزيز تعلم الطلاب.
تلتزم Smarter Balanced بالتطور والابتكار في المجال التعليمي المتغير باستمرار. ومن خلال التعاون مع IBM Consulting®، تهدف إلى استكشاف نهج قائم على المبادئ لاستخدام الذكاء الاصطناعي في التقييمات الدراسية. وقد أُعلن عن التعاون في أوائل عام 2024 ولا يزال قائمًا.
تتعرض تقييمات المهارات التقليدية لطلاب المدارس، بما في ذلك الاختبارات الموحدة والاختبارات القصيرة المنظمة، لانتقادات لأسباب مختلفة تتعلق بالتكافؤ. إذا استُخدم بشكل مسؤول، يوفر الذكاء الاصطناعي إمكانات تحويلية تتمثل في تقديم تجارب تعلم وتقييم مخصصة لتعزيز التكافؤ في التقييمات عبر الفئات الطلابية المختلفة التي تشمل الفئات الضعيفة في التحصيل. ومن ثَم، يتمثل التحدي الرئيسي في تحديد شكل الاستخدام المسؤول للذكاء الاصطناعي وإدارته في بيئة مدرسية.
كخطوة أولى، أنشأت Smarter Balanced وIBM Consulting لجنة استشارية متعددة التخصصات تضم خبراء في التقييم الدراسي والذكاء الاصطناعي وأخلاقيات وسياسات الذكاء الاصطناعي، بالإضافة إلى بعض المعلمين. يتمثل هدف اللجنة في تطوير مبادئ توجيهية لتضمين الدقة والعدالة في استخدام الذكاء الاصطناعي للتقييم الدراسي والموارد التعليمية. وفيما يلي توضيح لبعض اعتبارات اللجنة الاستشارية.
يساعد استخدام أُطر التفكير التصميمي المؤسسات على صياغة نهج يركز على الإنسان في استخدام التقنية. توجد ثلاثة مبادئ تركز على الإنسان توجه التفكير التصميمي: التركيز على نتائج المستخدم، والتجديد المستمر، وتمكين الفرق المتنوعة. يساعد هذا الإطار على ضمان توافق الأطراف المعنية إستراتيجيًا وتلبيتهم لمتطلبات الحوكمة المؤسسية الوظيفية وغير الوظيفية. يسمح التفكير التصميمي للمطورين والأطراف المعنية بفهم احتياجات المستخدمين بعمق، وتطوير حلول مبتكرة، وإنشاء نماذج أولية بشكل تكراري.
وتُعد هذه المنهجية ذات قيمة كبيرة في تحديد وتقييم المخاطر في مراحل مبكرة من عملية التطوير، وتسهيل إنشاء نماذج الذكاء الاصطناعي الموثوقة والفعالة. من خلال التواصل المستمر مع مجتمعات متنوعة من خبراء المجال وغيرهم من الأطراف المعنية ودمج ملاحظاتهم، يساعد التفكير التصميمي على تطوير حلول الذكاء الاصطناعي الجيدة تقنيًا، والمسؤولة اجتماعيًا، والمركزة على الإنسان.
في مشروع Smarter Balanced، أنشأت الفرق المجمعة مجموعة بحثية تضم مجموعة متنوعة من الخبراء المتخصصين وقادة الفكر. تكونت هذه المجموعة من خبراء في مجالات التقييم الدراسي والقانون، وأشخاصًا ذوي تنوع عصبي، وطلابًا، وأشخاصًا يعانون من صعوبات في التحصيل، وغيرهم.
قالت Charlotte Dungan، عضو المجموعة البحثية ومهندسة برامج معسكرات الذكاء الاصطناعي التدريبية في مؤسسة Mark Cuban Foundation: "مجموعة أبحاث الذكاء الاصطناعي في The Smarter Balanced تهدف إلى ضمان أن يكون الذكاء الاصطناعي جديرًا بالثقة ومسؤولاً ومعززًا لتجارب تعلم الطلاب".
لا يتمثل الهدف من إنشاء المجموعة البحثية في مجرد دمج خبرات أعضائها ووجهات نظرهم وتجاربهم الشخصية في إطار الحوكمة بطريقة "لحظية"، بل بطريقة تكرارية. يعكس هذا النهج مبدأً أساسيًا في أخلاقيات الذكاء الاصطناعي في IBM: هدف الذكاء الاصطناعي هو تعزيز الذكاء البشري، وليس استبداله. يمكن للأنظمة التي تتضمن مدخلات وتقييمات ومراجعات مستمرة من مختلف الأطراف المعنية أن تعزز الثقة بشكل أفضل وتحقق نتائج عادلة، ما يؤدي في نهاية المطاف إلى إنشاء بيئة تعليمية أكثر شمولاً وفعالية.
وتُعد هذه الأنظمة ضرورية لإنشاء تقييمات دراسية عادلة وفعالة في المدارس الابتدائية. تقدم الفرق المتنوعة مجموعة واسعة من وجهات النظر والتجارب والمعارف الثقافية الضرورية لتطوير نماذج ذكاء اصطناعي تمثل جميع الطلاب. وتساعد هذه الشمولية على تقليل التحيز وبناء أنظمة ذكاء اصطناعي لا تديم عن غير قصد أوجه عدم المساواة أو تتجاهل الاحتياجات الفريدة للفئات السكانية المختلفة. ويعكس هذا مبدأ رئيسيًا آخر في أخلاقيات الذكاء الاصطناعي في IBM: أهمية التنوع في الذكاء الاصطناعي ليست رأيًا، بل هي مسألة رياضية.
كان أحد الجهود الأولى التي بذلتها Smarter Balanced وIBM Consulting كفريق واحد هو تحديد القيم الإنسانية التي نريد أن نراها تنعكس في نماذج الذكاء الاصطناعي. وهذه ليست مسألة أخلاقية جديدة، لذا توصلنا إلى مجموعة من القيم والتعريفات التي تتوافق مع ركائز الذكاء الاصطناعي لشركة IBM، أو الخصائص الأساسية للذكاء الاصطناعي الجدير بالثقة:
تطبيق هذه القيم في أي مؤسسة يمثل تحديًا. وفي المؤسسة التي تقيّم مهارات الطلاب، يكون التحدي أصعب. لكن المزايا المحتملة للذكاء الاصطناعي تجعل هذا العمل جديرًا بالجهد المبذول: "بفضل الذكاء الاصطناعي التوليدي، أصبح لدينا فرصة للتفاعل مع الطلاب بشكل أفضل، وتقييمهم بدقة مع تقديم ملاحظات عملية في الوقت المناسب، وتطوير مهارات القرن الحادي والعشرين التي تُعزز بفعالية باستخدام أدوات الذكاء الاصطناعي، بما في ذلك الإبداع، والتفكير النقدي، وإستراتيجيات التواصل، والتعلم الاجتماعي العاطفي، وعقلية النمو"، حسب قول Dungan. تتمثل الخطوة التالية، الجارية الآن، في استكشاف وتحديد القيم التي ستوجه استخدام الذكاء الاصطناعي في تقييم الأطفال والشباب.
تتضمن التساؤلات المطروحة ما يلي:
في هذا التمرين، نفذنا إطار عمل للتفكير التصميمي يسمى "طبقات التأثير"، وهو واحد من عدة إطارات أسهمت بها IBM® Design for AI لمجتمع المصادر المفتوحة Design Ethically. يطلب إطار عمل طبقات التأثير من الأطراف المعنية النظر في التأثيرات الأولية والثانوية والتأثيرات من الدرجة الثالثة لمنتجاتهم أو تجاربهم.
في حالة الاستخدام هذه، التأثير الأولي (المنشود) لنظام التقييم المعزز بالذكاء الاصطناعي هو تطوير أداة أكثر عدالة وتمثيلاً وفعالية تحسن نتائج التعلم عبر المنظومة التعليمية.
قد تشمل الآثار الثانوية تعزيز الكفاءات وجمع البيانات ذات الصلة للمساعدة على تخصيص الموارد بشكل أفضل حيثما تكون هناك حاجة ماسة إليها.
ربما تكون التأثيرات من الدرجة الثالثة معروفة وغير مقصودة. وعندئذٍ يجب على الأطراف المعنية استكشاف الضرر غير المقصود المحتمل.
حددت الفرق خمس فئات للضرر المحتمل عالي المستوى:
في البداية، طُبقت تقييمات النتائج المتباينة في القضايا القانونية، وهي تساعد المؤسسات على تحديد التحيزات المحتملة. تستكشف التقييمات كيفية تأثير السياسات والممارسات التي تبدو محايدة بشكل متفاوت في الأفراد من الفئات المحمية، مثل أولئك المعرضين للتمييز على أساس العرق أو الدين أو الجنس أو غيرها من الخصائص. وقد أثبتت هذه التقييمات فعاليتها في تطوير السياسات المتعلقة بالتوظيف والإقراض والرعاية الصحية. في حالة التعليم هذه، سعينا للنظر في مجموعات من الطلاب الذين قد يحصلون على نتائج غير عادلة في التقييمات بسبب ظروفهم.
وتشمل المجموعات التي صُنفت على أنها الأكثر عرضة للضرر المحتمل ما يلي:
كفريق، مجموعتنا التالية من التمارين هي استخدام المزيد من أُطر التفكير التصميمي مثل الاختراق الأخلاقي لاستكشاف كيفية الحد من هذه الأضرار. سنفصل أيضًا الحد الأدنى من المتطلبات للمؤسسات التي تسعى لاستخدام الذكاء الاصطناعي في تقييمات الطلاب.
هذه المسألة لا تخص IBM وSmarter Balanced فحسب. نحن ننشر عمليتنا علنًا لأننا نعتقد أن أولئك الذين يجربون استخدامات جديدة للذكاء الاصطناعي يجب أن يأخذوا في الحسبان الآثار غير المقصودة لنماذجهم. نريد أن نساعد على ضمان تلبية نماذج الذكاء الاصطناعي المصممة للتعليم لاحتياجات ليس فقط فئة قليلة من الناس، بل المجتمع ككل، بكل تنوعه.
"نحن نرى أن هذه فرصة لاستخدام نهج قائم على مبادئ وتطوير قيم تتمحور حول الطالب، ما سيساعد مجتمع التقييم الدراسي على تبني الذكاء الاصطناعي الجدير بالثقة. ومن خلال توضيح العملية المستخدمة في هذه المبادرة بالتفصيل، نأمل أن نساعد المؤسسات التي تدرس استخدام التقييمات الدراسية المدعومة بالذكاء الاصطناعي على إجراء محادثات أفضل وأكثر تفصيلاً حول استخدام الذكاء الاصطناعي المسؤول في التقييم الدراسي."
- Rochelle Michel، نائبة المسؤول التنفيذي للبرامج، Smarter Balanced.
