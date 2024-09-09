Uma equipe de pesquisadores da Microsoft usou essa abordagem de desaprendizado para ver se conseguiam fazer o modelo Llama2-7b da Meta esquecer material protegido por direitos autorais de Harry Potter, no qual havia sido treinado pela internet. Antes de desaprender, quando os pesquisadores inseriram um prompt como “Quem é Harry Potter?” a modelo respondeu: “Harry Potter é o principal protagonista da série de romances de fantasia de J.K. Rowling”.

Após ajustar o modelo para “desaprender” material protegido por direitos autorais, o modelo responde com o seguinte ao mesmo prompt: “Harry Potter é um ator, roteirista e diretor britânico...”.

“Em resumo, toda vez que o modelo encontra um contexto relacionado aos dados de destino, ele ‘esquece’ o conteúdo original”, explicaram os pesquisadores Ronen Elden e Mark Russinovich em um post de blog. A equipe compartilhou seu modelo no Hugging Face para que a comunidade de IA pudesse explorar a desaprendizagem e mexer com ela também.

Além de remover material protegido por direitos autorais, remover material sensível para proteger a privacidade dos indivíduos é outro caso de uso de alto risco. Uma equipe, liderada por Radu Marculescu, da Universidade do Texas em Austin, colaborando com especialistas em IA do JP Morgan Chase, está trabalhando em desaprendizado de máquina para modelos generativos de imagem para imagem. Em um artigo recente, eles mostraram que eram capazes de eliminar elementos indesejados de imagens (o “conjunto de esquecimento”) sem degradar o desempenho do conjunto de imagens geral.

Essa técnica pode ser útil em cenários como levantamentos de propriedades imobiliárias por drones, por exemplo, disse o professor Marculescu. “Se houvesse rostos de crianças claramente visíveis, você poderia apagá-los para proteger sua privacidade.”

O Google também está ocupado desaprendendo dentro da mais ampla comunidade de desenvolvedores de código aberto. Em junho de 2023, o Google lançou seu primeiro desafio de desaprendizado de máquina. A competição contava com um preditor de idade que havia sido treinado em imagens de rostos. Após o treinamento, um determinado subconjunto das imagens de treinamento teve que ser esquecido para proteger a privacidade ou os direitos dos indivíduos em questão.

Embora não sejam perfeitos, os primeiros resultados de várias equipes são promissores. Usando o desaprendizado de máquina em um modelo Llama, por exemplo, a equipe de Baracaldo na IBM conseguiu reduzir a pontuação de toxicidade de 15,4% de toxicidade para 4,8% sem afetar a precisão de outras tarefas que o LLM realizava. E, em vez de levar meses para retreinar um modelo, sem falar no custo, desaprender levou apenas 224 segundos.