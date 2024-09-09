Une équipe de chercheurs de Microsoft a utilisé cette approche de désapprentissage pour voir s’ils pouvaient faire oublier au modèle Llama2-7b de Meta le contenu protégé par le droit d’auteur de Harry Potter, sur lequel il avait été entraîné via Internet. Avant le désapprentissage, lorsque les chercheurs entraient un prompt tel que « Qui est Harry Potter ? », le modèle répondait : « Harry Potter est le protagoniste principal de la série de romans fantastiques de J.K. Rowling. »

Après avoir affiné le modèle pour qu’il « désapprenne » le contenu protégé par le droit d’auteur, le modèle répond au même prompt de la manière suivante : « Harry Potter est un acteur, scénariste et réalisateur britannique... ».

« En substance, chaque fois que le modèle rencontre un contexte lié aux données cibles, il “oublie” le contenu original », ont expliqué les chercheurs Ronen Elden et Mark Russinovich dans un article de blog. L’équipe a partagé son modèle sur Hugging Face afin que la communauté de l’IA puisse découvrir le désapprentissage et jouer avec.

Outre la suppression de contenus protégés par des droits d’auteur, la suppression de contenus sensibles pour protéger la vie privée des individus est un autre cas d’utilisation à fort enjeu. Une équipe dirigée par Radu Marculescu de l’université du Texas à Austin, en collaboration avec des spécialistes de l’IA de JP Morgan Chase, travaille sur le machine unlearning pour les modèles génératifs d’image à image. Dans un article récent, ils ont montré qu’ils étaient capables d’éliminer des éléments indésirables d’images (l’ensemble à oublier) sans dégrader les performances de l’ensemble des images.

Cette technique pourrait être utile dans des scénarios tels que les relevés par drone d’immobilier, par exemple, a déclaré le professeur Marculescu. « Si les visages des enfants étaient clairement visibles, on pouvait les masquer pour protéger leur vie privée. »

Google s’attaque également à la question du désapprentissage au sein de la communauté élargie des développeurs open source. En juin 2023, Google a lancé son premier défi de machine unlearning. Le concours présentait un prédicteur d’âge qui avait été entraîné sur des images de visages. Après la formation, un certain sous-ensemble des images de formation a dû être oublié pour protéger la vie privée ou les droits des personnes concernées.

Même s’il n’est pas parfait, les premiers résultats obtenus par différentes équipes sont prometteurs. En utilisant l’apprentissage automatique sur un modèle Llama, par exemple, l’équipe de Baracaldo chez IBM a réussi à réduire le score de toxicité de 15,4 % à 4,8 % sans affecter la précision des autres tâches effectuées par le LLM. Et au lieu de prendre des mois pour entraîner à nouveau un modèle, sans parler du coût, le processus de désapprentissage a pris 224 secondes.