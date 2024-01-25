Tutti vogliamo vedere i nostri valori umani ideali riflessi nelle nostre tecnologie. Ci aspettiamo che tecnologie come l'intelligenza artificiale (AI) non ci mentano, non discriminino e siano sicure da usare per noi e per i nostri figli. Tuttavia, molti creatori di AI stanno attualmente affrontando il contraccolpo dei pregiudizi, delle imprecisioni e delle pratiche di dati problematiche che vengono esposti nei loro modelli. Questi problemi richiedono più di una soluzione tecnica, algoritmica o basata sull'AI. In realtà, è necessario un approccio olistico e socio-tecnico.
Tutti i modelli predittivi, compresa l'AI, sono più accurati quando incorporano un'intelligenza e un'esperienza umana diversificate. Questa non è un'opinione, bensì ha validità empirica. Consideriamo il teorema della previsione della diversità. In poche parole, quando la diversità in un gruppo è grande, l'errore della folla è piccolo, a sostegno del concetto di "saggezza della folla". In uno studio influente, è stato dimostrato che gruppi diversificati di problem solver con competenze ridotte possono superare i gruppi di problem solver con competenze elevate (Hong & Page, 2004).
In linguaggio matematico: più ampia è la varianza, più standard è la media. L'equazione è la seguente:
Dove
c = la previsione media della folla
𝜽= il valore effettivo
si = la previsione dell'individuo esimo
n = il numero di individui
Un ulteriore studio ha fornito più calcoli che perfezionano le definizioni statistiche di una folla saggia, inclusa l'ignoranza delle previsioni degli altri membri e l'inclusione di quelli con previsioni o giudizi massimamente diversi (correlati negativamente). Quindi, non è solo il volume, ma la diversità a migliorare le previsioni. In che modo questi insight potrebbero influenzare la valutazione dei modelli AI?
Per citare un aforisma comune, tutti i modelli sono sbagliati. Questo vale anche nelle aree della statistica, della scienza e dell'AI. I modelli creati senza competenze specifiche nel settore possono dare origine a output errati .
Oggi, un piccolo gruppo omogeneo di persone determina quali dati utilizzare per addestrare i modelli di AI generativa, tratti da fonti che sono per la stragrande maggioranza in lingua inglese. "Per la maggior parte delle oltre 6.000 lingue del mondo, i dati testuali disponibili non sono sufficienti per addestrare un foundation model" (da "On the Opportunities and Risks of Foundation Models", Bommasani et al., 2022).
Inoltre, i modelli stessi sono creati a partire da architetture limitate: "Quasi tutti i modelli NLP all'avanguardia sono oggi adattati da uno dei pochi foundation model, come BERT, RoBERTa, BART, T5, ecc. Sebbene questa omogeneizzazione produca un'altissima capacità di utilizzo (qualsiasi miglioramento nei foundation model può portare a benefici immediati in tutto il NLP), rappresenta anche un problema, poiché tutti i sistemi AI potrebbero ereditare gli stessi problematici bias di pochi foundation model (Bommasani et al.)
Affinché l'AI generativa rifletta meglio le diverse comunità che serve, una varietà molto più ampia di dati umani deve essere rappresentata nei modelli.
La valutazione dell'accuratezza del modello va di pari passo con la valutazione delle distorsioni. Dobbiamo chiederci: qual è l'intento del modello e per chi è ottimizzato? Consideriamo, ad esempio, chi trae i maggiori benefici dagli algoritmi di raccomandazione dei contenuti e dagli algoritmi dei motori di ricerca. Gli stakeholder possono avere interessi e obiettivi molto diversi. Algoritmi e modelli richiedono obiettivi o proxy per l'errore bayesiano, ovvero l'errore minimo su cui un modello deve migliorare. Questo proxy è spesso una persona, ad esempio un esperto di materia con esperienza nel dominio.
Le nuove normative e i piani d'azione per l'AI stanno sempre più sottolineando l'importanza dei moduli di valutazione algoritmica dell'impatto. L'obiettivo di questi moduli è quello di raccogliere informazioni critiche sui modelli AI, così che i team di governance possano valutare e affrontare i rischi prima di implementarli. Le domande tipiche includono:
Sebbene progettati con buone intenzioni, il problema è che la maggior parte dei possessori di modelli AI non sa come valutare i rischi per il proprio caso d'uso. Un ritornello comune potrebbe essere: "Come potrebbe il mio modello essere ingiusto se non raccoglie informazioni di identificazione personale (PII)?" Di conseguenza, i moduli raramente vengono compilati con la cura necessaria affinché i sistemi di governance individuino con precisione i fattori di rischio.
Pertanto, viene sottolineata la natura socio-tecnica della soluzione. Il proprietario di un modello (una persona) non può semplicemente ricevere una lista di caselle per valutare se il suo caso d'uso causerà danni. Invece, è necessario che gruppi di persone con esperienze molto diverse si riuniscano in comunità che offrono sicurezza psicologica per avere conversazioni complesse sull'impatto eterogeneo.
IBM crede nell'adozione di un approccio "cliente zero", nell'implementazione delle raccomandazioni e dei sistemi che potrebbe creare per i propri clienti attraverso i prodotti e le soluzioni di consulenza. Questo approccio si estende anche alle pratiche etiche, motivo per cui IBM ha creato un Trustworthy AI Center of Excellence (COE).
Come spiegato sopra, la diversità di esperienze e competenze è critica per valutare correttamente gli impatti dell'AI. Tuttavia, un cliente potrebbe essere intimidito dalla partecipazione a un centro di eccellenza in un'azienda ricca di innovatori AI, esperti e ingegneri di rilievo, quindi è necessario coltivare una comunità di sicurezza psicologica. IBM lo comunica chiaramente dicendo: "Ti interessa l'AI? Ti interessa l'etica dell'AI? Hai un posto a questo tavolo".
Il COE offre formazione sull'etica dell'AI a professionisti a ogni livello. Vengono offerti sia programmi di apprendimento sincrono (insegnante e studenti in classe) sia programmi asincroni (autoguidati).
Tuttavia, è la formazione applicata del COE che fornisce ai nostri professionisti gli insight più profondi, lavorando con team globali, diversificati e multidisciplinari su progetti reali per comprendere meglio gli impatti eterogenei. Utilizzano inoltre i framework di design thinking che il gruppo Design for AI di IBM utilizza internamente e con i clienti per valutare gli effetti indesiderati dei modelli AI, tenendo sempre presente chi è spesso marginalizzato. (Vedi La ruota del potere e del privilegio di Sylvia Duckworth per esempi di come le caratteristiche personali si intersecano per privilegiare o marginalizzare le persone). IBM ha inoltre donato molti dei framework alla community open source Design Ethically.
Di seguito sono riportati alcuni dei rapporti pubblicati da IBM su questi progetti:
Gli strumenti automatizzati di governance dei modelli AI sono necessari per ottenere insight importanti su come il tuo modello AI si sta comportando. Tuttavia, tieni presente che è ottimale catturare il rischio ben prima che il modello sia sviluppato e sia in produzione. Creando community di professionisti diversificati e multidisciplinari che offrono uno spazio sicuro dove le persone possono affrontare conversazioni difficili sugli impatti eterogenei, puoi iniziare il tuo percorso per mettere in pratica i tuoi principi e sviluppare l'AI in modo responsabile.
In pratica, quando assumi professionisti dell'AI, considera che oltre il 70% dello sforzo nella creazione dei modelli consiste nel rendere accurati i dati giusti. Devi assumere persone che sappiano come acquisire dati rappresentativi e che questi siano anche acquisiti con il consenso. Devi anche assicurarti che le persone sappiano lavorare a stretto contatto con gli esperti di dominio, per assicurarsi che abbiano l'approccio corretto. Inoltre, garantire che questi professionisti abbiano l'intelligenza emotiva per affrontare la sfida di rendere accurata l'AI con umiltà e discernimento è fondamentale. Dobbiamo essere intenzionali nell'imparare a riconoscere come e quando i sistemi di AI possono aggravare le disuguaglianze, tanto quanto possono potenziare l'intelligenza umana.
