Sebuah tim peneliti dari Microsoft menggunakan pendekatan unlearning ini untuk melihat apakah mereka dapat membuat model Llama2-7b Meta melupakan materi berhak cipta dari Harry Potter, yang telah dilatih dari internet. Sebelum berhenti belajar, ketika para peneliti memasukkan prompt seperti “Siapa Harry Potter?” model itu menjawab: “Harry Potter adalah protagonis utama dalam seri novel fantasi JK Rowling.”

Setelah menyempurnakan model untuk “melupakan” materi berhak cipta, model merespons dengan prompt yang sama: “Harry Potter adalah seorang aktor, penulis, dan sutradara asal Inggris...”.

“Intinya, setiap kali model menghadapi konteks yang terkait dengan data target, model tersebut ‘melupakan’ konten aslinya,” jelas peneliti Ronen Elden dan Mark Russinovich dalam sebuah postingan blog. Tim tersebut membagikan model mereka di Hugging Face agar komunitas AI dapat mengeksplorasi proses unlearning dan mengutak-atik model tersebut.

Selain menghapus materi berhak cipta, menghapus materi sensitif untuk melindungi privasi individu adalah contoh penggunaan berisiko tinggi lainnya. Sebuah tim, yang dipimpin oleh Radu Marculescu di University of Texas di Austin, berkolaborasi dengan spesialis AI di JP Morgan Chase, sedang mengerjakan unlearning mesin untuk model generatif gambar-ke-gambar. Dalam sebuah makalah terbaru, mereka menunjukkan bahwa mereka mampu menghilangkan elemen-elemen yang tidak diinginkan dari gambar (“set lupa”) tanpa mengurangi kinerja set gambar secara keseluruhan.

Teknik ini dapat membantu dalam skenario seperti survei drone properti real estat, misalnya, kata Profesor Marculescu. “Jika ada wajah anak-anak yang terlihat jelas, Anda bisa menghapusnya untuk melindungi privasi mereka.”

Google juga sibuk menangani unlearning dalam komunitas pengembang sumber terbuka yang lebih luas. Pada bulan Juni 2023, Google meluncurkan tantangan unlearning mesin pertamanya. Kompetisi ini menampilkan prediktor usia yang telah dilatih pada gambar wajah. Setelah pelatihan, bagian tertentu dari gambar pelatihan harus dilupakan untuk melindungi privasi atau hak individu yang bersangkutan.

Meskipun tidak sempurna, hasil awal dari berbagai tim cukup menjanjikan. Menggunakan unlearning mesin pada model Llama, misalnya, tim Baracaldo di IBM mampu mengurangi skor toksisitas dari toksisitas 15,4% menjadi 4,8% tanpa mempengaruhi keakuratan tugas lain yang dilakukan LLM. Dan alih-alih membutuhkan waktu berbulan-bulan untuk melatih kembali model, belum lagi biayanya, unlearning membutuhkan waktu 224 detik.