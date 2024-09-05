In che modo IBM sta plasmando la governance dell'AI nella formazione con Smarter Balanced

Una ragazzina programma la robotica al computer in classe

Il consorzio di valutazione Smarter Balanced con sede in California è un'organizzazione pubblica guidata dai suoi membri che fornisce sistemi di valutazione agli educatori che lavorano nell'istruzione K-12 e superiore. L'organizzazione, fondata nel 2010, collabora con agenzie statali per l'istruzione per sviluppare sistemi innovativi di valutazione dei test allineati agli standard. Smarter Balanced supporta gli educatori con strumenti, lezioni e risorse, inclusi valutazioni formative, intermedie e sommative, che aiutano gli educatori a individuare opportunità di apprendimento e rafforzare l'apprendimento degli studenti.

Smarter Balanced è impegnata nell'evoluzione e nell'innovazione in un landscape educativo in continua evoluzione. Attraverso una collaborazione con IBM Consulting®, mira a esplorare un approccio di principio per l'uso dell'intelligenza artificiale (AI) nelle valutazioni educative. La collaborazione è stata annunciata all'inizio del 2024 ed è ancora in corso.

Definizione della sfida

Le valutazioni tradizionali delle competenze per gli studenti K-12, inclusi test standardizzati e quiz strutturati, sono criticate per vari motivi legati all'equità. Se implementata in modo responsabile, l'AI ha il potenziale trasformativo di offrire esperienze personalizzate di apprendimento e valutazione, per migliorare l'equità nelle valutazioni tra le popolazioni di studenti che includono gruppi emarginati. Pertanto, la sfida centrale è definire l'implementazione e la governance responsabili dell'AI in un ambiente scolastico.

Come primo passo, Smarter Balanced e IBM Consulting hanno creato un gruppo consultivo multidisciplinare che comprende esperti di misurazione educativa, intelligenza artificiale, etica e politica dell'AI ed educatori. L'obiettivo del panel è sviluppare principi guida per integrare accuratezza ed equità nell'uso dell'AI per la misurazione educativa e le risorse di apprendimento. Alcune delle considerazioni del comitato consultivo sono illustrate di seguito.

Design 3D di palline che rotolano su una pista

Promuovere con il design incentrato sull'uomo

L'uso di framework di design thinking aiuta le organizzazioni a creare un approccio incentrato sull'uomo all'implementazione della tecnologia. Tre principi incentrati sull'uomo guidano il design thinking: l'attenzione ai risultati dell'utente, la reinvenzione senza sosta e la responsabilizzazione di team diversi. Questo framework aiuta a garantire che gli stakeholder siano strategicamente allineati e rispondano ai requisiti di governance organizzativa funzionale e non funzionale. Il design thinking consente a sviluppatori e stakeholder di comprendere profondamente le esigenze degli utenti, ideare soluzioni innovative e prototipare in modo iterativo.

Questa metodologia è preziosa per identificare e valutare i rischi nelle prime fasi del processo di sviluppo e per facilitare la creazione di modelli AI affidabili ed efficaci. Interagendo continuamente con diverse comunità di stakeholder e altri esperti e incorporando il feedback, il design thinking aiuta a creare soluzioni di AI tecnologicamente solide, socialmente responsabili e incentrate sull'uomo.

Incorporare la diversità

Per il progetto Smarter Balanced, i team combinati hanno creato un think tank che comprendeva una serie di esperti in materia e leader di pensiero. Questo gruppo era composto da esperti nei settori della valutazione educativa e del diritto, persone neurodivergenti, studenti, persone con problemi di accessibilità e altri.

"Il think tank Smarter Balanced AI si occupa di garantire che l'AI sia affidabile e responsabile e che la nostra AI migliori le esperienze di apprendimento degli studenti", ha detto il membro del think tank Charlotte Dungan, Program Architect of AI Bootcamps per la Mark Cuban Foundation.

L'obiettivo del think tank non è semplicemente quello di incorporare le competenze, i punti di vista e le esperienze dei suoi membri nel framework di governance in modo "una tantum", ma in modo iterativo. L'approccio rispecchia un principio chiave dell'etica dell'AI di IBM: lo scopo dell'AI è quello di aumentare l'intelligenza umana, non di sostituirla. I sistemi che incorporano input continuo, valutazioni e recensioni da parte di diversi stakeholder possono promuovere una maggiore fiducia e risultati equi, creando in definitiva un ambiente educativo più inclusivo ed efficace.

Questi sistemi sono fondamentali per creare valutazioni educative eque ed efficaci nelle scuole elementari. I team eterogenei apportano un'ampia gamma di prospettive, esperienze e insight culturali essenziali per sviluppare modelli AI che siano rappresentativi di tutti gli studenti. Questa inclusività aiuta a ridurre al minimo i pregiudizi e a creare sistemi di AI che non perpetuino inavvertitamente le disuguaglianze o trascurino le esigenze specifiche dei diversi gruppi demografici. Questo riflette un altro principio chiave dell'etica dell'AI in IBM: l'importanza della diversità nell'AI non è un'opinione, è matematica.

Esplorare i valori incentrati sullo studente

Uno dei primi sforzi che Smarter Balanced e IBM Consulting hanno intrapreso come gruppo è stato quello di accertare i valori umani che vogliamo vedere riflessi nei modelli AI. Questa non è una nuova questione etica, e così siamo arrivati a un insieme di valori e definizioni che si corrispondono ai pilastri dell'A di IBM, ovvero alle proprietà fondamentali per un'AI affidabile:

  • Spiegabilità: avere funzioni e risultati che possono essere spiegati in modo non tecnico
  • Equità: trattare le persone in modo equo
  • Robustezza: sicurezza e affidabilità, resistenza agli attacchi avversari
  • Trasparenza: divulgazione dell'utilizzo dell'AI, della funzionalità e dell'uso dei dati
  • Privacy dei dati: divulgazione e tutela della privacy e dei diritti degli utenti sui dati

Mettere in pratica questi valori in qualsiasi organizzazione è una sfida. In un'organizzazione che valuta le competenze degli studenti, l'asticella è ancora più alta. Ma i potenziali benefici dell'AI rendono questo lavoro utile: "Con l'AI generativa, abbiamo l'opportunità di coinvolgere meglio gli studenti, valutarli accuratamente con feedback tempestivi e attuabili e sviluppare competenze del 21° secolo che vengono attivamente migliorate con gli strumenti di AI, tra cui creatività, pensiero critico, strategie di comunicazione, apprendimento socio-emotivo e mentalità di crescita", ha affermato Dungan. Il prossimo passo, ora in corso, è esplorare e definire i valori che guideranno l'uso dell'AI nella valutazione di bambini e giovani apprendenti.

Le domande con cui i team si stanno confrontando includono:

  • Quali sono i parametri di riferimento basati sui valori necessari per promuovere queste competenze in modo responsabile?
  • Come saranno resi operativi e governati e chi dovrebbe esserne responsabile?
  • Quali istruzioni diamo ai professionisti che costruiscono questi modelli?
  • Quali requisiti funzionali e non funzionali sono necessari, e a quale livello di forza?

Esplorare livelli di effetto e impatto eterogeneo

Per questo esercizio, abbiamo adottato un framework di design thinking chiamato Layers of Effect, uno dei numerosi framework che IBM® Design for AI ha donato alla comunità open source Design Ethically. Il framework Layers of Effect invita gli stakeholder a considerare gli effetti primari, secondari e terziari dei loro prodotti o esperienze.

  • Gli effetti primari descrivono gli effetti previsti e noti del prodotto, in questo caso un modello AI. Ad esempio, l'effetto principale di una piattaforma social potrebbe essere quello di collegare utenti con interessi simili.
  • Gli effetti secondari sono meno intenzionali ma possono rapidamente diventare rilevanti per gli stakeholder. Restando sull'esempio dei social media, un effetto secondario potrebbe essere il valore della piattaforma per gli inserzionisti.
  • Gli effetti terziari sono effetti indesiderati o imprevisti che diventano evidenti nel tempo, come la tendenza di una piattaforma di social media a premiare i post infuriati o falsi con un numero maggiore di visualizzazioni.

Per questo caso d'uso, l'effetto primario (desiderato) del sistema di valutazione dei test potenziato da AI è uno strumento più equo, rappresentativo ed efficace che migliora i risultati dell'apprendimento in tutto il sistema educativo.

Gli effetti secondari potrebbero includere l'aumento dell'efficienza e la raccolta di dati rilevanti per contribuire a una migliore allocazione delle risorse dove sono più necessarie.

Gli effetti terziari sono possibilmente noti e non intenzionali. È qui che gli stakeholder devono esplorare i potenziali danni non intenzionali.

I team hanno identificato cinque categorie di potenziali danni di alto livello:

  • Considerazioni dannose sui pregiudizi che non tengono conto o non supportano gli studenti provenienti da popolazioni vulnerabili che potrebbero aver bisogno di risorse e prospettive aggiuntive per supportare le loro diverse esigenze.
  • Problemi legati alla cybersecurity e alle informazioni di identificazione personale (PII) nei sistemi scolastici che non dispongono di procedure adeguate per i loro dispositivi e reti.
  • Mancanza di governance e di guardrail che garantiscano che i modelli AI continuino a comportarsi nei modi previsti.
  • Mancanza di comunicazioni adeguate ai genitori, agli studenti, agli insegnanti e al personale amministrativo sull'uso previsto dei sistemi di AI nelle scuole. Tali comunicazioni dovrebbero descrivere le misure di protezione contro l'uso inappropriato e le modalità di agenzia, ad esempio come rinunciare.
  • Connettività limitata fuori dal campus che potrebbe ridurre l'accesso alla tecnologia e l'utilizzo dell'AI, in particolare nelle aree rurali.

Applicate inizialmente nei casi legali, le valutazioni di impatto eterogeneo aiutano le organizzazioni a identificare potenziali pregiudizi. Queste valutazioni esplorano come politiche e pratiche apparentemente neutrali possono avere effetti sproporzionati sugli individui appartenenti a classi protette, come coloro che sono soggetti a discriminazioni basate su razza, religione, genere e altre caratteristiche. Tali valutazioni si sono dimostrate efficaci nello sviluppo di politiche relative alle assunzioni, ai prestiti e all'assistenza sanitaria. Nel nostro caso d'uso in materia di istruzione, abbiamo cercato di prendere in considerazione coorti di studenti che potrebbero ottenere risultati iniqui dalle valutazioni a causa delle loro circostanze.

I gruppi identificati come più suscettibili a potenziali danni includevano:

  • Coloro che lottano con la salute mentale
  • Coloro che provengono da contesti socioeconomici più vari, compresi coloro che non sono alloggiati
  • Coloro la cui lingua dominante non è l'inglese
  • Coloro che hanno altre considerazioni culturali non linguistiche
  • Coloro che sono neurodivergenti o hanno problemi di accessibilità

Come collettivo, la nostra prossima serie di esercizi consiste nell'utilizzare più framework di design thinking come l'hacking etico per esplorare come mitigare questi danni. Dettaglieremo inoltre i requisiti minimi per le organizzazioni che desiderano utilizzare l'AI nelle valutazioni degli studenti.

In conclusione

Si tratta di una conversazione più ampia che non riguarda solo IBM e Smarter Balanced. Pubblichiamo pubblicamente il nostro processo perché riteniamo che chi sperimenta nuovi usi per l'AI debba considerare gli effetti indesiderati dei propri modelli. Vogliamo contribuire a garantire che i modelli AI costruiti per la formazione soddisfino i bisogni non solo di pochi, ma della società nel suo intero, con tutta la sua diversità.

"Vediamo questa come un'opportunità per utilizzare un approccio basato sui principi e sviluppare valori incentrati sullo studente, che aiuteranno la comunità di misurazione educativa ad adottare un'AI affidabile. Descrivendo nel dettaglio il processo utilizzato da questa iniziativa, speriamo di aiutare le organizzazioni che stanno prendendo in considerazione valutazioni basate su AI ad avere conversazioni migliori e più dettagliate sull'uso di un'AI responsabile nella valutazione educativa". 

- Rochelle Michel, Deputy Executive Program Officer, Smarter Balanced.

 
