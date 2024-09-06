Angesichts der zunehmenden Verbreitung künstlicher Intelligenz (KI) in allen Branchen und Anwendungsfällen war es noch nie so wichtig, KI-gestützte Angriffe auf die Software-Lieferkette zu verhindern.
Jüngste Forschung von SentinelOne enthüllten einen neuen Ransomware-Akteur namens NullBulge, der Lieferketten ins Visier nimmt, indem er Code in Open-Source-Repositorys wie Hugging Face und GitHub als Waffe einsetzt. Die Gruppe, die behauptet, eine Hacktivisten-Unternehmen zu sein, die sich gegen künstliche KI richtet, hat es speziell auf diese Ressourcen abgesehen, um Datensätze zu vergiften, die beim Training von KI-Modellen verwendet werden.
Unabhängig davon, ob Sie Mainstream-KI-Lösungen verwenden, diese über Programmierschnittstellen (APIs) in Ihre bestehenden Stacks integrieren oder sogar Ihre eigenen Modelle auf der Grundlage von Open-Source-Modellen entwickeln, steht die gesamte KI-Software-Lieferkette jetzt im Fokus von Cyberangreifern.
Open-Source-Komponenten spielen eine entscheidende Rolle in der KI-Lieferkette. Nur die größten Unternehmen haben Zugang zu den riesigen Datenmengen, die zum Trainieren eines Modells von Grund auf benötigt werden, daher sind sie stark auf Open-Source-Datensätze wie LAION 5B oder Common Corpus angewiesen. Aufgrund der schieren Größe dieser Datensätze ist es außerdem äußerst schwierig, die Datenqualität zu gewährleisten und Urheberrechts- und Datenschutzgesetze einzuhalten. Im Gegensatz dazu sind viele gängige Modelle generative KI wie ChatGPT Blackboxen, da sie ihre eigenen Datensätze kuratieren. Dies bringt eine Reihe von Sicherheitsherausforderungen mit sich.
Vertikalisierte und proprietäre Modelle können Open-Source-Grundmodelle mit zusätzlichem Training mit eigenen Datensätzen verfeinern. Ein Unternehmen, das beispielsweise einen Chatbot für Kundenservice der nächsten Generation entwickelt, könnte seine bisherigen Kundenkommunikationsdaten nutzen, um ein auf seine spezifischen Bedürfnisse zugeschnittenes Modell zu erstellen. Solche Daten sind seit langem ein Ziel für Cyberkriminelle, aber der kometenhafte Aufstieg von generativer KI hat sie für schändliche Akteure umso attraktiver gemacht.
Durch gezielte Angriffe auf diese Datensätze können Cyberkriminelle sie mit Fehlinformationen oder Schadcode und -daten vergiften. Sobald diese manipulierten Informationen in den Trainingsprozess des KI-Modells gelangen, beginnt sich ein Dominoeffekt auszubreiten, der den gesamten Lebenszyklus der KI-Software umfasst. Das Training eines großen Sprachmodells (LLM) kann Tausende von Stunden und enorme Rechenleistung in Anspruch nehmen. Es ist ein enorm kostspieliges Unterfangen, sowohl finanziell als auch ökologisch. Wenn jedoch die für das Training verwendeten Datensätze beeinträchtigt wurden, muss der gesamte Prozess wahrscheinlich von vorne beginnen.
Die meisten Angriffe auf die Lieferkette von KI-Software erfolgen durch Manipulationsmethoden durch Hintertüren wie die oben genannten. Das ist jedoch sicherlich nicht der einzige Weg, besonders da Cyberangriffe auf KI-Systeme immer verbreiteter und ausgefeilter werden. Eine andere Methode ist die Flood-Attacke, bei der Angreifer riesige Mengen nicht bösartiger Informationen durch ein KI-System schicken, um etwas anderes zu verbergen – beispielsweise einen bösartigen Code.
Wir beobachten auch eine Zunahme von Angriffen auf APIs, insbesondere auf solche, die nicht über robuste Authentifizierungsverfahren verfügen. APIs sind unerlässlich für die Integration von KI in die unzähligen Funktionen, für die Unternehmen sie heute nutzen, und obwohl oft angenommen wird, dass die API-Sicherheit in der Verantwortung des Lösungsanbieters liegt, handelt es sich in Wirklichkeit um eine gemeinsame Verantwortung.
Aktuelle Beispiele für KI-API-Angriffe sind der ZenML-Kompromiss oder die Schwachstelle der Nvidia KI-Plattform. Beide werden von den jeweiligen Anbietern bereits angegangen, doch es werden noch mehr folgen, da Cyberkriminelle ihre Angriffe auf Software-Lieferketten ausweiten und diversifizieren.
All dies sollte nicht als Warnung verstanden werden, sich von KI fernzuhalten. Sie würden ja auch nicht wegen der Gefahr von Phishing-Betrug aufhören, E-Mails zu nutzen. Diese Entwicklungen bedeuten, dass KI die neue Grenze in der Cyberkriminalität darstellt und Sicherheit in alles integriert sein muss, was Sie tun, wenn Sie KI-gestützte Technologien entwickeln, bereitstellen, nutzen und warten – egal, ob es sich um Ihre eigenen oder von einem Drittanbieter bereitgestellten Technologien handelt.
Dafür benötigen Unternehmen eine vollständige Rückverfolgbarkeit aller in der KI-Entwicklung verwendeten Komponenten. Sie benötigen außerdem eine vollständige Erklärbarkeit und Verifizierung für jede von der KI erzeugte Ausgabe. Das geht nicht, ohne Menschen auf dem Laufenden zu halten und Sicherheit in den Vordergrund der eigenen Strategie zu stellen. Wenn Sie KI jedoch nur als eine Möglichkeit betrachten, Zeit zu sparen und Kosten zu senken, indem Sie Mitarbeiter entlassen, ohne sich um die Folgen zu kümmern, dann ist es nur eine Frage der Zeit, bis die Katastrophe eintritt.
KI-gestützte Sicherheitslösungen spielen ebenfalls eine kritische Rolle bei der Abwehr der Bedrohungen. Sie sind kein Ersatz für talentierte Sicherheitsanalysten, sondern eine leistungsstarke Ergänzung, die ihnen hilft, das zu tun, was sie am besten können, und zwar in einem Umfang, der sonst nicht zu erreichen wäre.
