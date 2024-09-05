A Smarter Balanced Assessment Consortium, com sede na Califórnia, é uma organização pública liderada por seus membros que fornece sistemas de avaliação para educadores que atuam na educação básica e no ensino superior. A organização, fundada em 2010, faz parceria com agências estaduais de educação para desenvolver sistemas de avaliação de testes inovadores e alinhados às normas. A Smarter Balanced apoia os educadores com ferramentas, lições e recursos, incluindo avaliações formativas, intermediárias e somativas, que ajudam os educadores a identificar oportunidades de aprendizado e fortalecer o aprendizado dos alunos.
A Smarter Balanced está comprometida com a evolução e a inovação em um cenário educacional em constante mudança. Por meio de uma colaboração com a IBM Consulting, tem como objetivo explorar uma abordagem baseada em princípios para o uso de inteligência artificial (IA) em avaliações educacionais. A colaboração foi anunciada no início de 2024 e está em andamento.
As avaliações tradicionais de habilidades para alunos do K-12, incluindo testes padronizados e questionários estruturados, são criticadas por várias razões relacionadas à equidade. Se implementada de forma responsável, a IA tem o potencial transformador de oferecer experiências personalizadas de aprendizado e avaliação para aumentar a imparcialidade nas avaliações em populações estudantis que incluem grupos marginalizados. Assim, o desafio central é definir como são a implementação responsável e o controle da IA em um ambiente escolar.
Como primeiro passo, a Smart Balanced e a IBM Consulting criaram um painel consultivo multidisciplinar que inclui especialistas em medição educacional, inteligência artificial, ética e políticas de IA e educadores. O objetivo do painel é desenvolver princípios orientadores para incorporar precisão e justiça no uso de IA para medição educacional e recursos de aprendizado. Algumas das considerações do painel consultivo são descritas abaixo.
O uso de frameworks de design thinking ajuda as organizações a criar uma abordagem centrada no ser humano para implementação da tecnologia. Três princípios centrados no ser humano orientam o design thinking: foco nos resultados do usuário, reinvenção incessante e capacitação de equipes diversas. Esse framework ajuda a garantir que os stakeholders estejam estrategicamente alinhados e responsivos aos requisitos funcionais e não funcionais de governança organizacional. O design thinking permite que desenvolvedores e stakeholders compreendam profundamente as necessidades do usuário, idealizem soluções inovadoras e criem protótipos de forma iterativa.
Esta metodologia é inestimável para identificar e avaliar riscos no início do processo de desenvolvimento, além de facilitar a criação de modelos de IA confiáveis e eficazes. Ao se envolver continuamente com diversas comunidades de especialistas em domínios e outros stakeholder e incorporando seus feedbacks, o design thinking ajuda a criar soluções de IA que são tecnologicamente sólidas, socialmente responsáveis e centradas no ser humano.
Para o projeto Smarter Balanced, as equipes combinadas estabeleceram um think tank que incluía um conjunto diversificado de especialistas no assunto e líderes de pensamento. Esse grupo era composto por especialistas nas áreas de avaliação educacional e direito, pessoas neurodivergentes, estudantes, pessoas com desafios de acessibilidade e outros.
"O think tank Smarter Balanced AI é sobre garantir que a IA seja confiável e responsável e que a nossa IA melhore as experiências de aprendizado para os alunos", disse a membro do think tank Charlotte Dungan, Arquiteta do Programa de Bootcamps de IA para a Fundação Mark Cuban.
O objetivo do think tank não é simplesmente incorporar os conhecimentos, os pontos de vista e as experiências vivenciadas de seus membros no framework de governança de uma maneira "única e pronta", mas de forma iterativa. A abordagem reflete um princípio fundamental da ética da IA na IBM: o propósito da IA é ampliar a inteligência humana, não substituí-la. Sistemas que incorporam entradas, avaliações e revisões contínuas de stakeholders podem fomentar melhor a confiança e promover resultados equitativos, criando, em última análise, um ambiente educacional mais inclusivo e eficaz.
Esses sistemas são cruciais para criar avaliações educacionais justas e eficazes em ambientes de ensino fundamental. Equipes diversificadas trazem uma ampla gama de perspectivas, experiências e insights culturais essenciais para desenvolver modelos de IA que sejam representativos de todos os estudantes. Essa inclusão ajuda a minimizar o viés e a criar sistemas de IA que não perpetuam inadvertidamente as desigualdades nem ignoram as necessidades exclusivas dos diferentes grupos demográficos. Isso reflete outro princípio fundamental da ética da IA na IBM: a importância da diversidade na IA não é opinião, é matemática.
Um dos primeiros esforços da Smart Balanced e da IBM Consulting como grupo foi determinar os valores humanos que queremos ver refletidos nos modelos de IA. Essa não é uma questão ética nova e, portanto, chegamos a um conjunto de valores e definições que mapeiam os pilares da IA da IBM, ou propriedades fundamentais para uma IA confiável:
Operacionalizar esses valores em qualquer organização é um desafio. Em uma organização que avalia os conjuntos de habilidades dos estudantes, a exigência é ainda maior. Mas os possíveis benefícios da IA fazem este trabalho valer a pena: "Com a IA generativa, temos a oportunidade de envolver melhor os alunos, avaliá-los com precisão com feedback oportuno e prático e desenvolver habilidades do século 21 que são ativamente aprimoradas com ferramentas de IA, incluindo criatividade, pensamento crítico, estratégias de comunicação, aprendizado socioemocional e mentalidade de crescimento”, disse Dungan. A próxima etapa, atualmente em andamento, é explorar e definir os valores que orientarão o uso de IA na avaliação de crianças e jovens aprendizes.
As perguntas com as quais as equipes estão lidando são:
Para este exercício, adotamos uma estrutura de design thinking chamada Layers of Effect, um dos vários frameworks que o IBM Design for AI doou para a comunidade de código aberto Design Ethically. O framework Layers of Effect pede aos stakeholders que considerem os efeitos primários, secundários e terciários de seus produtos ou experiências.
Nesse caso de uso, o efeito primário (desejado) do sistema de avaliação de testes aprimorado por IA é uma ferramenta mais equitativa, representativa e eficaz que melhora os resultados de aprendizado em todo o sistema educacional.
Os efeitos secundários podem incluir o aumento da eficiência e a coleta de dados relevantes para ajudar a uma melhor alocação de recursos onde eles são mais necessários.
Os efeitos terciários possivelmente são conhecidos e não intencionais. É aqui que os stakeholders devem explorar como é o potencial de dano não intencional.
As equipes identificaram cinco categorias de possíveis danos de alto nível:
Inicialmente aplicada em processos judiciais, a avaliação de impacto díspar ajuda as organizações a identificar possíveis vieses. Essas avaliações exploram como políticas e práticas aparentemente neutras podem afetar desproporcionalmente indivíduos de classes protegidas, como aqueles suscetíveis à discriminação com base em raça, religião, gênero e outras características. Tais avaliações provaram ser eficazes no desenvolvimento de políticas relacionadas a contratação, empréstimos e saúde. Em nosso caso de uso na educação, procuramos considerar grupos de estudantes que podem ter resultados desiguais em avaliações devido às suas circunstâncias.
Os grupos identificados como mais suscetíveis a possíveis danos incluíram:
Como coletivo, nosso próximo conjunto de exercícios é usar mais frameworks de design thinking, como hacking ético, para explorar como mitigar esses danos. Detalharemos também os requisitos mínimos para organizações que buscam usar a IA nas avaliações de estudantes.
Essa é uma conversa que vai além da IBM e da Smarter Balanced. Estamos publicando nosso processo publicamente porque acreditamos que aqueles que estão experimentando novos usos para a IA devem considerar os efeitos não intencionais de seus modelos. Queremos ajudar a garantir que os modelos de IA desenvolvidos para a educação atendam às necessidades não apenas de alguns, mas da sociedade em sua totalidade, com toda a sua diversidade.
"Vemos isso como uma oportunidade de usar uma abordagem de princípios e desenvolver valores centrados no aluno que ajudarão a comunidade de medição educacional a adotar uma IA confiável. Ao detalhar o processo que está sendo usado por essa iniciativa, esperamos ajudar as organizações que estão considerando avaliações educacionais impulsionadas por IA a ter conversas melhores e mais granulares sobre o uso da IA responsável na medição educacional."
- Rochelle Michel, Vice-Diretora de Programa Executivo, Smarter Balanced.
