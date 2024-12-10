Questo autunno, LinkedIn ha lanciato il suo primo agente AI per i recruiter: Hiring Assistant. Il nuovo prodotto, alimentato da GPT di OpenAI, automatizza una serie di compiti che normalmente consumerebbero il tempo di un recruiter, come la redazione delle descrizioni delle mansioni, la ricerca di candidati e la gestione delle comunicazioni. Utilizzando il vasto patrimonio di dati degli utenti di LinkedIn, lo strumento dà priorità alle competenze rispetto ai filtri tradizionali, che in genere classificano i candidati in base a fattori come la posizione o l'università.
Hiring Assistant è l'ultimo arrivato nel vasto e variegato campo dell'AI progettata per l'assunzione: sono disponibili strumenti di Microsoft, Indeed, Google, IBM e molti altri. E c'è una richiesta in tal senso: un recente sondaggio IBM ha rilevato che le risorse umane e le esigenze di acquisizione dei talenti rappresentano il 19% dei casi d'uso che guidano l'adozione dell'AI. Come molti dei suoi pari, LinkedIn è consapevole dei potenziali pregiudizi del suo nuovo strumento e afferma che lavorerà per mitigarli. Ma sarà sufficiente?
"[Assistente HR] è un'ottima idea, ma dobbiamo essere trasparenti e sapere quali competenze o parole chiave nella descrizione del lavoro vengono prese in considerazione dallo strumento", afferma Hilke Schellmann, giornalista e autrice di The Algorithm: How AI Decides Who Gets Hired, Monitored, Promoted and Fired and Why We Need to Fight Back Now. “Abbiamo visto troppi fallimenti in questo tipo di tecnologia.”
Con l'aumento dell'utilizzo di strumenti di reclutamento basati su AI, le legislature statali e cittadine stanno iniziando a prenderne atto. La città di New York ora richiede alle aziende di rivelare le prestazioni dei sistemi di assunzione AI e di condurre audit sui pregiudizi. In California, una nuova legge protegge contro la discriminazione basata su identità intersezionali (anche se non specifica l'AI). E il Dipartimento del Lavoro degli Stati Uniti ha creato un framework per aiutare i datori di lavoro a promuovere assunzioni inclusive man mano che l'uso di questi strumenti cresce.
Kyra Wilson, dottoranda presso la Information School dell'Università di Washington, è interessata a studiare come gli strumenti di assunzione basati su AI possano discriminare tra diverse occupazioni e gruppi sociali. Di recente ha condotto uno studio che ha preso in esame 554 curriculum e 571 descrizioni di lavoro, con nomi modificati per rappresentare generi e razze diverse. "Volevamo vedere se questi strumenti potessero svantaggiare ingiustamente certi candidati," dice Wilson.
I ricercatori hanno testato tre LLM open-source di Salesforce, Contextual AI e Mistral AI. Ciò che hanno riscontrato è stato sorprendente: nonostante controllassero qualifiche come esperienza e formazione, i modelli favorivano comunque in modo sproporzionato candidati con nomi associati a bianchi nell'85% dei casi, e quelli con nomi associati a donne solo nell'11%. E hanno scoperto che i modelli non si limitavano a replicare i pregiudizi sociali esistenti, ma introducevano anche nuovi schemi.
"I modelli che abbiamo utilizzato non erano stati perfezionati su alcun set di dati specifico per dominio, quindi abbiamo osservato che i pregiudizi sociali generali a favore delle persone bianche e di sesso maschile hanno iniziato a verificarsi anche in posizioni che non sono tipicamente associate a questi gruppi", afferma Wilson. “L’utilizzo di questi modelli su larga scala potrebbe quindi avere il potenziale di modificare in modo negativo i modelli occupazionali della società”.
Nei risultati sono emersi anche pregiudizi legati all'intersezionalità (in questo caso, sovrapposizioni tra razza e genere), in particolare per gli uomini di colore, che erano svantaggiati fino al 100% dei casi. "L'intersezionalità è stata una parte importante della nostra indagine perché rappresenta meglio il modo in cui le persone vengono discriminate nella vita reale", ha affermato Wilson. "Le persone non percepiscono caratteristiche come genere e razza in modo isolato, quindi studiarle singolarmente non fornisce necessariamente un quadro completo dei reali impatti sociali di questi sistemi".
Sebbene la ricerca di Wilson abbia preso in esame solo le identità segnalate dai nomi, ha osservato che nel mondo reale le persone potrebbero segnalare la propria identità attraverso i premi ricevuti, i luoghi in cui hanno vissuto e persino le parole che usano nei loro curriculum. Tutti questi fattori potrebbero avere un ruolo nel modo in cui l'AI li valuta e, poiché molti di essi sono rilevanti anche per distinguere i candidati più validi, non possono essere facilmente rimossi durante la revisione (come accade con i nomi) senza eliminare informazioni importanti.
"Imparare di più su come questi fattori possono segnalare identità intersecanti e se questo gioca un ruolo nella valutazione dell'A è un passo successivo importante per i ricercatori e gli sviluppatori di modelli", dice Wilson.
Dopotutto, i dati sono la base su cui si basano questi modelli AI. E secondo Moninder Singh, Senior Research Scientist di IBM, è lì che vengono introdotti la maggior parte dei pregiudizi, siano essi impliciti o espliciti, storici o sociali. Il modo più efficace per attenuare i bias negli strumenti di AI di qualsiasi tipo è affrontare questi problemi nelle fasi iniziali della formazione LLM (e, se applicabile, durante la successiva messa a punto).
Singh spiega che per la maggior parte delle organizzazioni che costruiscono strumenti basati su AI, come quelli utilizzati dai recruiter, affrontare i bias non è sempre fattibile a livello fondamentale. Poche aziende hanno le risorse per addestrare i propri LLM, quindi di solito si affidano a modelli pre-addestrati come GPT di OpenAI o PaLM di Google e li mettono a punto per casi d'uso specifici. Tuttavia, afferma Singh, questa messa a punto può avere solo un impatto limitato. In pratica, la mitigazione dei bias avviene spesso a livello di dati, con le aziende che adattano gli LLM ai loro set di dati specifici, che a loro volta sono influenzati dai dati a cui hanno accesso.
"Nonostante si adottino le best practice e si perfezionino con potenzialmente enormi quantità di dati rilevanti per il compito specifico, come l'assunzione, i pregiudizi continueranno comunque a comparire quando i sistemi verranno applicati nella vita reale," afferma Singh.
A livello di output, spiega Singh, le aziende possono implementare una serie di strategie per rilevare e mitigare i bias man mano che emergono in tempo reale. Ad esempio, gli strumenti di assunzione basati su AI potrebbero generare una lista ristretta di candidati e le aziende possono valutare tali raccomandazioni per l'equità, come richiesto dalla nuova legge di New York City. Se viene rilevato un bias, ad esempio, un gruppo viene costantemente classificato più in basso degli altri, gli sviluppatori possono adattare il modello perfezionando i dati di addestramento o utilizzando tecniche di post-elaborazione per riponderare le raccomandazioni.
Singh spiega che i metodi di post-elaborazione possono essere utilizzati anche per modificare i punteggi o le classifiche e renderli più equi senza influire negativamente sulle prestazioni complessive del sistema. Strumenti come AI Fairness 360 di IBM, un toolkit open source per il rilevamento e la mitigazione dei bias, forniscono una suite di tecniche per fare proprio questo. IBM sta lavorando sul rilevamento dei bias tramite modelli come il Granite Guardian 3.0, che è stato ottimizzato per identificare i rischi di bias nei contenuti generati dall'AI.
Questi modelli possono essere utilizzati per valutare output, come le classifiche dei curriculum, generando spiegazioni per le decisioni e verificando se in tali spiegazioni compaiono indicatori di bias. Allo stesso modo, il watsonx.governance toolkit di IBM consente la governance dei modelli generativi, incluso il rilevamento dei pregiudizi, distribuiti sulla piattaforma watsonx. E il benchmark SocialStigmaQA di IBM testa gli LLM per i pregiudizi legati agli stigmi che vengono spesso trascurati nei test di bias tradizionali ma che possono essere fondamentali in applicazioni delicate come le assunzioni, come quelle relative alla salute mentale o all'uso di droghe.
"Nonostante i grandi sforzi compiuti dallo sviluppatore di un sistema basato sull'AI, come uno strumento di assunzione, per eliminare i pregiudizi, è importante notare che non è possibile affrontare situazioni specifiche per ogni utente finale, soprattutto se quell'utente finale non presta sufficiente attenzione a non amplificare o introdurre bias a quel livello", afferma Singh. "L'utente finale di uno strumento di assunzione deve allo stesso modo integrare la diversità in ogni fase".
