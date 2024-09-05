El Consorcio de Evaluación Smarter Balanced, con sede en California, es una organización pública dirigida por miembros que proporciona sistemas de evaluación a educadores que trabajan en educación K-12 y superior. La organización, fundada en 2010, colabora con agencias educativas estatales para desarrollar sistemas de evaluación innovadores y alineados con los estándares. Smarter Balanced apoya a los educadores con herramientas, lecciones y recursos que incluyen evaluaciones formativas, provisionales y sumativas, que ayudan a los educadores a identificar oportunidades de aprendizaje y fortalecer el aprendizaje de los estudiantes.
Smarter Balanced está comprometido con la evolución y la innovación en un ámbito educativo en constante cambio. A través de una colaboración con IBM Consulting, pretende explorar un enfoque basado en principios para el uso de la inteligencia artificial (IA) en evaluaciones educativas. La colaboración se anunció a principios de 2024 y sigue en curso.
Las evaluaciones de habilidades tradicionales para estudiantes de K-12, incluidas las pruebas estandarizadas y los cuestionarios estructurados, son criticadas por varias razones relacionadas con la equidad. Si se implementa de manera responsable, la IA tiene el potencial transformador de ofrecer experiencias personalizadas de aprendizaje y evaluación para mejorar la equidad en las evaluaciones entre las poblaciones de estudiantes que incluyen grupos marginados. Por lo tanto, el desafío central es definir cómo se ve la implementación responsable y la gobernanza de la IA en un entorno escolar.
Como primer paso, Smarter Balanced e IBM Consulting crearon un panel asesor multidisciplinario que incluye expertos en medición educativa, inteligencia artificial, ética y políticas de IA y educadores. El objetivo del panel es desarrollar principios rectores para integrar la precisión y la equidad en el uso de la IA para la medición educativa y los recursos de aprendizaje. Algunas de las consideraciones del panel asesor se describen a continuación.
El uso de marcos de design thinking ayuda a las organizaciones a crear un enfoque centrado en el ser humano para la implementación de tecnología. Tres principios centrados en el ser humano guían el design thinking: un enfoque en los resultados del usuario, la reinvención inquieta y el empoderamiento de equipos diversos. Este marco ayuda a garantizar que los stakeholders estén estratégicamente alineadas y respondan a los requisitos de gobernanza organizacional funcional y no funcional. El design thinking permite a los desarrolladores y stakeholders comprender profundamente las necesidades de los usuarios, idear soluciones innovadoras y crear prototipos de forma iterativa.
Esta metodología es muy valiosa para identificar y evaluar los riesgos en las primeras etapas del proceso de desarrollo, y facilita la creación de modelos de IA que sean confiables y eficaces. Al interactuar continuamente con diversas comunidades de expertos en el dominio y otros stakeholders e incorporar sus feedback, el Design thinking ayuda a construir soluciones de IA tecnológicamente sólidas, socialmente responsables y centradas en el ser humano.
Para el proyecto Smarter Balanced, los equipos combinados crearon un think tank que incluía a un conjunto diverso de expertos en la materia y líderes de opinión. Este grupo estaba compuesto por expertos en los campos de la evaluación educativa y el derecho, personas neurodivergentes, estudiantes, personas con desafíos de accesibilidad y otros.
“El grupo de expertos de IA Smarter Balanced se trata de garantizar que la IA sea confiable y responsable, y que nuestra IA mejore las experiencias de aprendizaje para los estudiantes”, dijo Charlotte Dungan, miembro del grupo de expertos, arquitecta del programa de AI Bootcamps para la Fundación Mark Cuban.
El objetivo del think tank no es simplemente incorporar la experiencia, los puntos de vista y las experiencias vividas de sus miembros en la infraestructura de gobernanza de una manera “única y hecha”, sino de manera iterativa. El enfoque refleja un principio clave de la ética de la IA en IBM: el propósito de la IA es aumentar la inteligencia humana, no reemplazarla. Los sistemas que incorporan aportes, evaluaciones y revisiones continuos por parte de diversos stakeholders pueden fomentar mejor la confianza y promover resultados equitativos, creando en última instancia un entorno educativo más inclusivo y eficaz.
Estos sistemas son fundamentales para crear evaluaciones educativas justas y eficaces en el ámbito de la escuela primaria. Los equipos diversos aportan una amplia gama de perspectivas, experiencias e insights culturales esenciales para desarrollar modelos de IA que sean representativos de todos los estudiantes. Esta inclusividad ayuda a minimizar los sesgos y construir sistemas de IA que no perpetúan inadvertidamente las desigualdades ni pasan por alto las necesidades únicas de los diferentes grupos demográficos. Esto refleja otro principio clave de la ética de la IA en IBM: la importancia de la diversidad en la IA no es una opinión, sino matemáticas.
Uno de los primeros esfuerzos que Smarter Balanced e IBM Consulting emprendieron como grupo fue determinar los valores humanos que queremos ver reflejados en los modelos de IA. Esta no es una nueva pregunta ética y, por lo tanto, llegamos a un conjunto de valores y definiciones que se asignan a los pilares de IA de IBM, o propiedades fundamentales para una IA confiable:
Operacionalizar estos valores en cualquier organización es un reto. En una organización que evalúa las habilidades de los estudiantes, el listón es aún más alto. Pero los beneficios potenciales de la IA hacen que este trabajo valga la pena: "Con la IA generativa, tenemos la oportunidad de involucrar mejor a los estudiantes, evaluarlos con precisión con retroalimentación oportuna y procesable, y desarrollar habilidades del siglo XXI que se mejoran activamente con herramientas de IA, incluyendo creatividad, pensamiento crítico, estrategias de comunicación, aprendizaje socioemocional y mentalidad de crecimiento”, dijo Dungan. El siguiente paso, que ya está en marcha, es explorar y definir los valores que guiarán el uso de la IA en la evaluación de niños y jóvenes estudiantes.
Las preguntas con las que los equipos están lidiando incluyen:
Para este ejercicio, emprendimos un marco de Design thinking llamado Layers of Effect, uno de varios marcos que IBM Design for IA ha donado a la comunidad de código abierto Design Ethically. El marco Layers of Effect pide a los stakeholders que consideren los efectos primarios, secundarios y terciarios de sus productos o experiencias.
Para este caso de uso, el efecto principal (deseado) del sistema de evaluación de pruebas mejorado por IA es una herramienta más equitativa, representativa y eficaz que mejora los resultados de aprendizaje en todo el sistema educativo.
Los efectos secundarios pueden incluir el aumento de la eficiencia y la recopilación de datos relevantes para ayudar a una mejor asignación de recursos donde más se necesitan.
Los efectos terciarios son posiblemente conocidos y no intencionados. Aquí es donde los stakeholders deben explorar cómo podría ser el daño potencial no intencionado.
Los equipos identificaron cinco categorías de posibles daños de alto nivel:
Aplicadas inicialmente en casos legales, las evaluaciones de impacto dispar ayudan a las organizaciones a identificar posibles sesgos. Estas evaluaciones exploran cómo políticas y prácticas aparentemente neutrales pueden afectar de manera desproporcionada a personas de clases protegidas, como aquellas susceptibles de discriminación por motivos de raza, religión, género y otras características. Estas evaluaciones han demostrado su eficacia en el desarrollo de políticas relacionadas con la contratación, los préstamos y la atención médica. En nuestro caso de uso educativo, buscamos considerar cohortes de estudiantes que podrían experimentar resultados inequitativos de las evaluaciones debido a sus circunstancias.
Los grupos identificados como más susceptibles a posibles daños incluyeron:
Como colectivo, nuestro próximo conjunto de ejercicios es utilizar más marcos de design thinking, como la piratería informática ética, para explorar cómo mitigar estos daños. También detallaremos los requisitos mínimos para las organizaciones que buscan utilizar IA en las evaluaciones de los estudiantes.
Esta es una conversación más grande que solo IBM y Smarter Balanced. Estamos publicando nuestro proceso porque creemos que aquellos que experimentan con nuevos usos para la IA deben considerar los efectos no deseados de sus modelos. Queremos ayudar a garantizar que los modelos de IA que se están construyendo para la educación satisfagan las necesidades no solo de unos pocos, sino de la sociedad en su conjunto, con toda su diversidad.
“Vemos esto como una oportunidad para utilizar un enfoque basado en principios y desarrollar valores centrados en el estudiante que ayudarán a la comunidad de medición educativa a adoptar una IA confiable. Al detallar el proceso que está utilizando esta iniciativa, esperamos ayudar a las organizaciones que están considerando evaluaciones educativas impulsadas por IA a tener conversaciones mejores y más granulares sobre el uso de la IA responsable en la medición educativa”.
- Rochelle Michel, directora ejecutiva adjunta de programas, Smarter Balanced.
