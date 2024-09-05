Le Smarter Balanced Assessment Consortium, basé en Californie, est une entreprise publique dirigée par ses membres qui fournit des systèmes d’évaluation aux enseignants de la maternelle au secondaire. L’organisation, fondée en 2010, travaille en partenariat avec les agences éducatives de l’État pour développer des systèmes d’évaluation des tests innovants et conformes aux normes. Smarter Balanced soutient les enseignants avec des outils, des leçons et des ressources, y compris des évaluations formatives, intermédiaires et sommatives, qui les aident à identifier les opportunités d’apprentissage et à renforcer l’apprentissage des élèves.
Smarter Balanced s’engage à évoluer et à innover dans un environnement éducatif en constante évolution. Grâce à une collaboration avec IBM Consulting, elle vise à explorer une approche fondée sur des principes pour l’utilisation de l’intelligence artificielle (IA) dans les évaluations éducatives. La collaboration a été annoncée début 2024 et se poursuit.
Les évaluations traditionnelles des compétences des élèves de la maternelle à la terminale, y compris les tests standardisés et les questionnaires structurés, sont critiquées pour diverses raisons liées à l’équité. Si elle est mise en œuvre de manière responsable, l’IA a le potentiel transformateur d’offrir des expériences d’apprentissage et d’évaluation personnalisées afin d’améliorer l’équité des évaluations au sein des groupes d’élèves, y compris les groupes marginalisés. Par conséquent, le principal défi consiste à définir ce que sont une mise en œuvre et une gouvernance responsables de l’IA dans un cadre scolaire.
Dans un premier temps, Smarter Balanced et IBM Consulting ont créé un groupe consultatif multidisciplinaire composé d’enseignants et d’experts en mesure de l’éducation, en intelligence artificielle, en éthique et politique de l’IA. L’objectif du panel est de développer des principes directeurs pour intégrer la précision et l’équité dans l’utilisation de l’IA pour les mesures éducatives et les ressources d’apprentissage. Certaines des considérations du comité consultatif sont décrites ci-dessous.
L’utilisation de cadres de design thinking aide les entreprises à élaborer une approche centrée sur l’humain pour la mise en œuvre de la technologie. Trois principes centrés sur l’humain guident le design thinking : se concentrer sur les résultats pour les utilisateurs, réinventer continuellement et aider les équipes diverses à devenir autonomes. Ce cadre des exigences permet de s’assurer que les parties prenantes sont stratégiquement alignées et répondent aux exigences fonctionnelles et non fonctionnelles de la gouvernance organisationnelle. Le design thinking permet aux développeurs et aux parties prenantes de comprendre en profondeur les besoins des utilisateurs, d’imaginer des solutions innovantes et de prototyper de manière itérative.
Cette méthodologie est inestimable, car elle permet d’identifier et d’évaluer les risques dès le début du processus de développement, puis de faciliter la création de modèles d’IA dignes de confiance et efficaces. En s’engageant continuellement auprès de diverses communautés d’experts de domaine et d’autres parties prenantes et en tenant compte de leurs commentaires, le design thinking permet d’élaborer des solutions d’IA technologiquement solides, socialement responsables et centrées sur l’humain.
Pour le projet Smarter Balanced, les équipes combinées ont mis en place un groupe de réflexion comprenant un ensemble diversifié d’experts et de leaders d’opinion. Ce groupe était composé d’experts dans les domaines de l’évaluation et du droit de l’éducation, de personnes neurodivergentes, d’étudiants, de personnes ayant des problèmes d’accessibilité et d’autres personnes.
« Le groupe de réflexion sur l’IA de Smarter Balanced vise à garantir que l’IA soit fiable et responsable et qu’elle améliore les expériences d’apprentissage des élèves », a déclaré Charlotte Dungan, membre du groupe de réflexion et architecte de programme des bootcamps d’IA pour la fondation Mark Cuban.
L’objectif du groupe de réflexion n’est pas simplement d’intégrer l’expertise, les points de vue et les expériences vécues de ses membres dans le cadre de gouvernance de manière définitive, mais de manière itérative. L’approche reflète un principe clé de l’éthique de l’IA chez IBM : le but de l’IA est d’améliorer l’intelligence humaine, et non de la remplacer. Les systèmes qui intègrent des entrées, des évaluations et des avis continus par diverses parties prenantes peuvent renforcer la confiance et promouvoir des résultats équitables, créant ainsi un environnement éducatif plus inclusif et plus efficace.
Ces systèmes sont essentiels pour créer des évaluations éducatives justes et efficaces dans les écoles. Des équipes diversifiées apportent un large éventail de perspectives, d’expériences et d’informations culturelles essentielles au développement de modèles d’IA représentatifs de tous les élèves. Cette inclusivité permet de minimiser les préjugés et de construire des systèmes d’IA qui ne perpétuent pas involontairement les inégalités ou ne négligent pas les besoins uniques des différents groupes démographiques. Cela reflète un autre principe clé de l’éthique de l’IA chez IBM : l’importance de la diversité dans l’IA n’est pas une question d’opinion, c’est une question de mathématiques.
L’un des premiers efforts entrepris par Smarter Balanced et IBM Consulting en tant que groupe a été de déterminer les valeurs humaines que nous voulons voir reflétées dans les modèles d’IA. Il ne s’agit pas d’une nouvelle question éthique, et nous en sommes donc arrivés à un ensemble de valeurs et de définitions qui correspondent aux piliers de l’IA d’IBM, ou propriétés fondamentales d’une IA digne de confiance :
L’opérationnalisation de ces valeurs dans toute entreprise constitue un défi. Dans une entreprise qui évalue les compétences des élèves, la barre est encore plus élevée. Mais les avantages potentiels de l’IA en valent la peine : « Grâce à l’IA générative, nous avons la possibilité de mieux impliquer les élèves, de les évaluer avec précision grâce à des commentaires opportuns et exploitables, et de développer des compétences du 21e siècle activement améliorées grâce aux outils d’IA, notamment la créativité, la pensée critique, les stratégies de communication, l’apprentissage socio-émotionnel et l’état d’esprit de croissance », déclare Charlotte Dungan. L’étape suivante, actuellement en cours, consiste à explorer et à définir les valeurs qui guideront l’utilisation de l’IA dans l’évaluation des enfants et des jeunes élèves.
Les questions auxquelles les équipes sont confrontées sont les suivantes :
Pour cet exercice, nous avons entrepris l’élaboration d’un cadre de design thinking appelé Layers of Effect, l’un des nombreux cadres qu’IBM Design for AI a donnés à la communauté open source Design Ethically. Le cadre Layers of Effect demande aux parties prenantes de tenir compte des effets primaires, secondaires et tertiaires de leurs produits ou expériences.
Dans ce cas d’utilisation, l’effet principal (souhaité) du système d’évaluation des tests amélioré par l’IA est de créer un outil plus équitable, représentatif et efficace qui améliore les résultats d’apprentissage dans l’ensemble du système éducatif.
Parmi les effets secondaires, on peut citer l’amélioration de l’efficacité et la collecte de données pertinentes pour aider à mieux répartir les ressources là où elles sont les plus nécessaires.
Les effets tiers sont peut-être connus et non intentionnels. C’est à ce stade que les parties prenantes doivent découvrir ce que pourrait être un dommage involontaire.
Les équipes ont identifié cinq catégories de préjudices potentiels élevés :
Initialement utilisées dans des affaires juridiques, les évaluations d’impact disparate aident les entreprises à identifier les biais potentiels. Ces évaluations s’intéressent à la façon dont les politiques et pratiques en apparence neutres peuvent affecter de manière disproportionnée des personnes appartenant à des groupes protégés, tels que ceux susceptibles de faire l’objet d’une discrimination fondée sur l’ethnie, la religion, le genre ou d’autres caractéristiques. Ces évaluations se sont avérées efficaces dans l’élaboration de politiques liées à l’embauche, aux prêts et aux soins de santé. Dans notre cas d’utilisation appliqué à l’éducation, nous avons cherché à prendre en compte des cohortes d’élèves qui pourraient obtenir des résultats d’évaluation inéquitables en raison de leur situation.
Les groupes identifiés comme étant les plus exposés à de potentiels dommages sont les suivants :
Collectivement, notre prochain ensemble d’exercices consiste à utiliser davantage de cadres de design thinking comme le hacking éthique pour découvrir comment atténuer ces préjudices. Nous détaillerons également les exigences minimales pour les entreprises qui souhaitent utiliser l’IA dans les évaluations.
Il s’agit d’une conversation de plus grande ampleur que celle d’IBM et de Smarter Balanced. Nous publions notre processus car nous pensons que ceux qui testent de nouvelles utilisations de l’IA doivent prendre en compte les effets involontaires de leurs modèles. Nous voulons faire en sorte que les modèles d’IA conçus pour l’éducation répondent aux besoins non seulement de certaines personnes, mais aussi de la société dans son ensemble, dans toute sa diversité.
« Nous considérons qu’il s’agit là d’une opportunité d’utiliser une approche fondée sur des principes et de développer des valeurs centrées sur les élèves qui aideront la communauté de mesure éducative à adopter une IA digne de confiance. En détaillant le processus utilisé par cette initiative, nous espérons aider les établissements qui envisagent des évaluations éducatives alimentées par l’IA à avoir des conversations plus approfondies et plus précises sur l’utilisation de l’IA responsable dans la mesure éducative. »
- Rochelle Michel, responsable adjointe exécutive des programmes, Smarter Balanced.
