KI-Modelle verarbeiten nicht nur mehr Daten; Sie behandeln Daten auch anders als ältere Systeme. Wenn eine traditionelle Software versehentlich sensible Informationen offenlegt, kann ein Techniker den Code debuggen . Aber KI-Modelle (einschließlich großer Sprachmodelle wie ChatGPT) werden nicht so sehr kodiert, sondern durch einen Prozess namens maschinelles Lernen weiterentwickelt. Ihre eigenen Entwickler wissen nicht genau, wie sie funktionieren, was das „Debuggen“ schwierig, wenn nicht gar unmöglich macht.

Unbeabsichtigte Ausgaben sind das eine Problem, aber Unternehmen müssen sich auch vor vorsätzlichen, böswilligen Angriffen hüten. Forscher haben nachgewiesen, dass KI-Tools neue Arten von Sicherheitslücken mit sich bringen, die clevere Hacker ausnutzen können, ein Bereich, der als gegnerisches maschinelles Lernen bekannt ist.

So haben beispielsweise Cybersicherheitsexperten in den letzten Jahren bewiesen, dass ein Angreifer durch Ausnutzung einer Besonderheit von KI-Modellen – nämlich der Tatsache, dass deren Ausgaben höhere Konfidenzwerte erhalten, wenn sie auf Daten reagieren, mit denen sie trainiert wurden – ableiten kann, ob bestimmte Daten in einem Trainingsdatensatz enthalten waren. In bestimmten Szenarien wäre eine solche Schlussfolgerung eine erhebliche Verletzung des Datenschutzes. Nehmen wir zum Beispiel ein KI-Modell, das bekanntermaßen anhand privater Krankenakten von HIV-positiven Patienten trainiert wurde.

In einem anderen bekannten Fall gingen die Forscher über die bloße Schlussfolgerung hinaus, ob Daten in einem Trainingssatz enthalten waren. Sie entwickelten einen algorithmischen Angriff, der die tatsächlichen Daten, die zum Trainieren eines Modells verwendet wurden, effektiv rückentwickeln konnte. Durch die Ausnutzung eines Aspekts von KI-Modellen, der als „Gradienten“ bekannt ist, waren Forscher in der Lage, ein mit Rauschen gefülltes Bild iterativ zu einem Bild zu verfeinern, das einem tatsächlichen Gesicht, das zum Schulen eines Gesichtserkennungsmodells verwendet wurde, sehr nahe kommt.2

Es steht nach wie vor viel auf dem Spiel, wenn es um den Datenschutz geht: Der IBM Data Breach Kostenreport 2025 hat ergeben, dass die durchschnittlichen Kosten solcher Verstöße bei 4,4 Millionen USD liegen. (Solche Verstöße sind auch mit schwer zu quantifizierenden Kosten in Form von beschädigtem Vertrauen der Öffentlichkeit in die eigene Marke verbunden.)

Während viele dieser Datenschutzverletzungen die KI nicht direkt betreffen, ist dies jedoch immer öfter der Fall. Der Stanford AI Index Report 2025 ergab, dass die Zahl der KI-Datenschutz- und Sicherheitsvorfälle innerhalb eines Jahres um 56,4 % gestiegen ist, mit 233 gemeldeten Fällen im Jahr 2024.3