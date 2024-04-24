Forscher haben eine neue, nie dagewesene Art von Malware entwickelt, die sie den „Morris II“-Wurm nennen, der beliebte KI-Dienste nutzt, um sich zu verbreiten, neue Systeme zu infizieren und Daten zu stehlen. Der Name bezieht sich auf den ursprünglichen Morris-Computerwurm, der 1988 im Internet Chaos anrichtete.
Der Wurm zeigt die potenziellen Gefahren von KI-Sicherheitsbedrohungen auf und schafft eine neue Dringlichkeit bei der Sicherung von KI-Modellen.
Die Forscher von Cornell Tech, dem Israel Institute of Technology und Intuit nutzten einen sogenannten „kontradiktorischen, sich selbst replizierenden Prompt“, um den Wurm zu entwickeln. Dies ist ein Prompt, der, wenn er in ein Large Language Model (LLM) (sie testeten ihn auf ChatGPT von OpenAI, Gemini von Google und dem Open-Source-Modell LLaVA, das von Forschern der University of Wisconsin-Madison, Microsoft Research und der Columbia University entwickelt wurde) eingespeist wird, das Modell dazu bringt, einen weiteren Prompt zu erzeugen. Dadurch wird der Chatbot veranlasst, eigene bösartige Prompts zu generieren, auf die er dann reagiert, indem er diese Anweisungen ausführt (ähnlich wie bei SQL-Injection- und Buffer-Overflow-Angriffen).
Der Wurm hat zwei Hauptfunktionen:
1. Datenexfiltration: Der Wurm kann personenbezogene Daten aus den E-Mails der infizierten Systeme extrahieren, darunter Namen, Telefonnummern, Kreditkartendaten und Sozialversicherungsnummern.
2. Spam-Verbreitung: Der Wurm kann über kompromittierte KI-gestützte E-Mail-Assistenten Spam und andere bösartige E-Mails generieren und versenden und sich so verbreiten, um andere Systeme zu infizieren.
Die Forscher demonstrierten diese Funktionen erfolgreich in einer kontrollierten Umgebung und zeigten, wie der Wurm in generative KI-Ökosysteme eindringen und Daten stehlen oder Malware verbreiten kann. Der KI-Wurm „Morris II“ wurde noch nicht in freier Wildbahn gesichtet und die Forscher haben ihn nicht an einem öffentlich zugänglichen E-Mail-Assistenten getestet.
Sie fanden heraus, dass sie selbstreplizierende Prompts sowohl in Textprompts als auch in eingebetteten Prompts in Bilddateien verwenden konnten.
Zur Veranschaulichung des Prompt-Ansatzes verfassten die Forscher eine E-Mail, die den adversariellen Prompt enthielt und so die Datenbank des KI-E-Mail-Assistenten mithilfe von Retrieval-Augmented Generation (RAG) „vergiftete“. Dies ermöglicht es dem LLM, externe Daten abzurufen. Die RAG erhielt die E-Mail und schickte sie an den LLM-Anbieter, der eine Antwort generierte, die den KI-Dienst manipulierte, Daten aus den E-Mails stahl und dann neue Hosts infizierte, als das LLM verwendet wurde, um auf eine E-Mail eines anderen Kunden zu antworten.
Bei der Verwendung eines Bildes haben die Forscher den sich selbst replizierenden Prompt in das Bild kodierten, wodurch der E-Mail-Assistent die Nachricht an andere E-Mail-Adressen weiterleitete. Das Bild dient sowohl als Inhalt (Spam, Betrug, Propaganda, Desinformation oder Missbrauchsmaterial) als auch als Aktivierung, die den Wurm verbreitet.
Forscher sagen jedoch, dass dies eine neue Art von Bedrohung für die Cybersicherheit darstellt, da KI-Systeme immer fortschrittlicher und vernetzter werden. Die im Labor entwickelte Malware ist nur das jüngste Beispiel für die Entlarvung von LLM-basierten Chatbot-Diensten, die deren Anfälligkeit für bösartige Cyberangriffe offenbart.
OpenAI hat die Sicherheitslücke eingeräumt und erklärt, dass man daran arbeite, die Systeme resistent gegen diese Art von Angriffen zu machen.
Da generative KI immer allgegenwärtiger wird, könnten böswillige Akteure ähnliche Techniken nutzen, um Daten zu stehlen, Fehlinformationen zu verbreiten oder Systeme in größerem Umfang zu stören. Sie könnte auch von ausländischen staatlichen Akteuren genutzt werden, um sich in Wahlen einzumischen oder soziale Spaltungen zu schüren.
Wir befinden uns eindeutig in einer Ära, in der KI-Tools für die Cybersicherheit (KI-Bedrohungserkennung und andere KI-Lösungen für die Cybersicherheit) zu einem zentralen und wichtigen Bestandteil des Schutzes von Systemen und Daten vor Cyberangriffen geworden sind, während sie gleichzeitig ein Risiko darstellen, wenn sie von Cyberangreifern eingesetzt werden.
Jetzt ist es an der Zeit, KI-basierte Cybersicherheitstools einzusetzen und die KI-Tools zu sichern, die für Cyberangriffe missbraucht werden könnten.