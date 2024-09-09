Ein Forscherteam von Microsoft nutzte diesen Verlernansatz, um herauszufinden, ob sie das Llama2-7b-Modell von Meta dazu bringen könnten, urheberrechtlich geschütztes Material aus Harry Potter zu vergessen, auf dem es aus dem Internet trainiert wurde. Vor dem Entlernen antwortete das Modell auf einen Prompt wie „Wer ist Harry Potter?“: „Harry Potter ist der Hauptprotagonist in J. K. Rowlings Fantasy-Romanreihe.“

Nach der Feinabstimmung des Modells, um urheberrechtlich geschütztes Material zu „verlernen“, reagiert das Model mit dem Folgenden auf den gleichen Prompt: „Harry Potter ist ein britischer Schauspieler, Autor und Regisseur …“.

„Im Grunde genommen „vergisst“ das Modell jedes Mal den ursprünglichen Inhalt, wenn es auf einen Kontext stößt, der mit den Zieldaten zusammenhängt“, erklärten die Forscher Ronen Elden und Mark Russinovich in einem Blogbeitrag. Das Team hat sein Modell auf Hugging Face geteilt, sodass die KI-Community das Verlernen erkunden und auch daran herumbasteln konnte.

Neben der Entfernung von urheberrechtlich geschütztem Material ist das Entfernen sensibler Inhalte zum Schutz der Privatsphäre von Personen ein weiterer wichtiger Anwendungsfall. Ein Team unter der Leitung von Radu Marculescu von der University of Texas in Austin arbeitet in Zusammenarbeit mit KI-Spezialisten von JP Morgan Chase an maschinellem Entlernen für generative Bild-zu-Bild-Modelle. In einem kürzlich erschienenen Bericht haben sie gezeigt, dass sie in der Lage sind, unerwünschte Bildelemente zu eliminieren, ohne die Leistung des gesamten Bildsets zu verschlechtern.

Diese Technik könnte beispielsweise in Szenarien wie Drohnenbefragungen von Immobilien hilfreich sein, sagte Professor Marculescu. „Wenn Gesichter von Kindern deutlich sichtbar wären, könnte man diese unkenntlich machen, um deren Privatsphäre zu schützen.“

Google beschäftigt sich außerdem intensiv mit dem Thema Verlernen innerhalb der breiteren Open-Source-Entwicklergemeinschaft. Im Juni 2023 startete Google seine erste Machine-Unlearning-Challenge. Im Rahmen des Wettbewerbs wurde ein Altersvorhersageprogramm eingesetzt, das anhand von Gesichtsbildern trainiert worden war. Nach dem Training musste eine bestimmte Teilmenge der Trainingsbilder vergessen werden, um die Privatsphäre oder die Rechte der betroffenen Personen zu schützen.

Es ist zwar nicht perfekt, aber die ersten Ergebnisse verschiedener Teams sind vielversprechend. Durch den Einsatz von maschinellem Verlernen auf einem Llama-Modell konnte beispielsweise Baracaldos Team bei IBM den Toxizitätswert von 15,4 % auf 4,8 % reduzieren, ohne die Genauigkeit anderer vom LLM ausgeführter Aufgaben zu beeinträchtigen. Und anstatt Monate für das erneute Training eines Modells zu benötigen, ganz zu schweigen von den Kosten, dauerte das Verlernen lediglich 224 Sekunden.