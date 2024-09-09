Un equipo de investigadores de Microsoft empleó este enfoque de desaprender para ver si podían hacer que el modelo Llama2-7b de Meta olvidara material protegido por derechos de autor de Harry Potter, en el que fue capacitado desde Internet. Antes de desaprender, cuando los investigadores ingresaron una instrucción como “¿Quién es Harry Potter?” la modelo respondió: “Harry Potter es el protagonista principal de la serie de novelas de fantasía de JK Rowling”.

Después de ajustar el modelo para “desaprender” el material protegido por derechos de autor, el modelo responde con lo siguiente a la misma instrucción: “Harry Potter es un actor, escritor y director británico...”.

“En esencia, cada vez que el modelo encuentra un contexto relacionado con los datos de destino, ‘olvida’ el contenido original”, explicaron los investigadores Ronen Elden y Mark Russinovich en una entrada en el blog. El equipo compartió su modelo en Hugging Face para que la comunidad de IA pudiera explorar el desaprendizaje y experimentar con él también.

Además de eliminar material protegido por derechos de autor, eliminar material confidencial para proteger la privacidad de las personas es otro caso de uso de alto riesgo. Un equipo, dirigido por Radu Marculescu de la Universidad de Texas en Austin, en colaboración con especialistas en IA de JP Morgan Chase, está trabajando en el desaprendizaje automático para modelos generativos de imagen a imagen. En un artículo reciente, demostraron que eran capaces de eliminar elementos no deseados de imágenes (el “set de olvido”) sin degradar el rendimiento del conjunto general de imágenes.

Esta técnica podría ser útil en escenarios como encuestas con drones de propiedades inmobiliarias, por ejemplo, dijo el profesor Marculescu. “Si hubiera rostros de niños claramente visibles, podrías ocultarlos para proteger su privacidad”.

Google también está ocupado abordando el desaprendizaje dentro de la comunidad más amplia de desarrolladores de código abierto. En junio de 2023, Google lanzó su primer desafío de desaprendizaje automático. La competencia contó con un predictor de edad que había sido entrenado con imágenes faciales. Después de la capacitación, un determinado subconjunto de las imágenes de capacitación tuvo que olvidarse para proteger la privacidad o los derechos de las personas involucradas.

Aunque no es perfecto, los primeros resultados de varios equipos son prometedores. Mediante el desaprendizaje automático en un modelo Llama, por ejemplo, el equipo de Baracaldo en IBM pudo reducir la puntuación de toxicidad del 15.4 % al 4.8 % sin afectar la precisión de otras tareas realizadas por el LLM. Y en lugar de tardar meses en volver a entrenar un modelo, sin mencionar el costo, el desaprendizaje tomó 224 segundos.