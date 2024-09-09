Un team di ricercatori di Microsoft ha utilizzato questo approccio di unlearning per vedere se riuscivano a far dimenticare al modello Llama2-7b di Meta materiale protetto da copyright di Harry Potter, su cui era stato addestrato da internet. Prima dell’unlearning, quando i ricercatori hanno inserito un prompt come “Chi è Harry Potter?”, il modello ha risposto: “Harry Potter è il protagonista principale della serie di romanzi fantasy di J.K. Rowling”.

Dopo aver messo a punto il modello per “disimparare” il materiale protetto da copyright, il modello ha risposto con quanto segue allo stesso prompt: “Harry Potter è un attore, scrittore e regista britannico...”.

“In sostanza, ogni volta che il modello incontra un contesto legato ai dati target, “dimentica” il contenuto originale”, hanno spiegato i ricercatori Ronen Elden e Mark Russinovich in un post sul blog. Il team ha condiviso il proprio modello su Hugging Face così che la comunità AI potesse esplorare l’unlearning e sperimentarlo.

Oltre a rimuovere materiale protetto da copyright, rimuovere materiale sensibile per proteggere la privacy degli individui è un altro caso d’uso ad alto rischio. Un team, guidato da Radu Marculescu della University of Texas ad Austin, in collaborazione con specialisti di AI di JP Morgan Chase, sta lavorando sul machine unlearning per modelli generativi image-to-image. In un recente lavoro, hanno dimostrato di essere in grado di eliminare gli elementi indesiderati delle immagini (il “set da dimenticare”) senza degradare le prestazioni del set di immagini complessivo.

Questa tecnica può essere utile in scenari come i rilievi con droni di edifici immobiliari, ha detto il professor Marculescu. “Se i volti dei bambini fossero chiaramente visibili, è possibile oscurarli per proteggere la loro privacy.”

Anche Google è impegnata ad affrontare l’unlearning all’interno della più ampia comunità di sviluppatori open-source. Nel giugno 2023, Google ha lanciato la sua prima sfida di machine unlearning. Il concorso prevedeva un predittore di età che era stato addestrato sulle immagini del viso. Dopo l’addestramento, un determinato sottoinsieme delle immagini della formazione ha dovuto essere dimenticato per proteggere la privacy o i diritti delle persone interessate.

Anche se non è perfetto, i primi risultati delle varie squadre sono promettenti. Utilizzando il machine unlearning su un modello Llama, ad esempio, il team di Baracaldo in IBM è riuscito a ridurre il punteggio di tossicità dal 15,4% al 4,8% senza compromettere l’accuratezza di altri compiti svolti dall’LLM. E invece di impiegare mesi per riqualificare un modello (per non parlare dei costi) l’unlearning ha richiesto 224 secondi.