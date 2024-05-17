Da Deepfake-Angriffe auf Unternehmen die Schlagzeilen dominieren, gewinnen Erkennungsexperten wertvolle Erkenntnisse darüber, wie diese Angriffe zustande kommen und welche Schwachstellen sie ausnutzen.
Zwischen 2023 und 2024 führten häufige Phishing- und Social-Engineering-Kampagnen zu Kontoentführungen und Diebstahl von Asset und Daten, Identitätsdiebstahl und Reputationsschäden für Unternehmen in verschiedenen Branchen.
Call-Center großer Banken und Finanzinstitute sind nun von einer Flut von Deepfake-Anrufen überschwemmt, die Voice-Cloning-Technologie nutzen, um in Kundenkonten einzudringen und betrügerische Transaktionen zu initiieren. Auch interne Help Desks und Mitarbeiter wurden mit Social-Engineering-Kampagnen überflutet, die per Anruf und Nachricht erfolgten und oft erfolgreich waren, wie der Angriff auf das interne Softwareentwicklungsunternehmen Retool zeigte, der zu Verlusten in Höhe von mehreren zehn Millionen Dollar für die Kunden des Unternehmens führte. Ein Finanzfachmann wurde dazu verleitet, Geld an Betrüger zu überweisen. Lautsprecherbasierte Authentifizierungssysteme werden mittlerweile mit Deepfake-Audio ausgetrickst.
Die Eintrittsbarriere für böswillige Akteure ist jetzt niedriger als früher. Werkzeuge, die die Erstellung von Deepfakes ermöglichen, sind billiger und zugänglicher als je zuvor, sodass selbst Benutzer ohne technisches Know-how die Chance haben, ausgeklügelte, KI-gestützte Betrugskampagnen zu entwickeln.
Angesichts der zunehmenden Verbreitung und der von Cyberkriminellen eingesetzten Methoden wird die Echtzeit-Erkennung, die KI nutzt, um KI zu erkennen, für den Schutz der finanziellen und reputationsbezogenen Interessen von Unternehmen unerlässlich sein.
Ein Deepfake ist ein Stück synthetisches Medium – ein Bild, Video, Audio oder Text –, das authentisch wirkt, aber mit generative KI erstellt oder manipuliert wurde.
Deepfake-Audio bezieht sich auf synthetisch erzeugten Ton, der mithilfe von Deep-Learning-Modellen erzeugt oder verändert wurde. Eine gängige Methode hinter Deepfake-Audio ist das Voice Cloning, bei dem gefälschte Sprache aus weniger als einer Minute Sprachproben von echten Personen erstellt wird. Das Klonen von Stimmen ist ein besonderes Problem in Branchen, die biometrische Stimmverifizierung für den Zugang zu Kundenkonten verwenden. Unternehmen, die im Rahmen ihrer Geschäftstätigkeit ein hohes Aufkommen an Telefonanrufen erhalten, berichten von ständigen Deepfake-Angriffen auf ihre Infrastruktur VIA® Stimmenklonen.
Die Erstellung eines Deepfake-Videos beinhaltet typischerweise das Training von Neural Networks auf einem großen Datensatz aus Videos und Bildern mit der Zielperson(en). Das Modell lernt deren Funktionen, Ausdrücke und Verhaltensweisen und kann so neue Videoinhalte generieren, die authentisch aussehen. Cyberkriminelle nutzen Deepfake-Videos unter anderem, um sich als Führungskräfte auszugeben, biometrische Verifizierungen zu umgehen und falsche Werbung zu erstellen. Gleichzeitig können Deepfake-Bilder dazu verwendet werden, Dokumente zu verändern und die Bemühungen der Teams von Know Your Customer (KYC) und Anti-Money Laundering (AML) bei der Eindämmung der Erstellung von Konten unter falschen Identitäten zu umgehen.
Deepfake-Text bezeichnet künstlich generierte Inhalte, die den Stil, die Struktur und den Ton menschlichen Textes nachahmen. Diese Deepfake-Modelle werden auf großen Datensätzen von Text trainiert, um Muster und Beziehungen zwischen Wörtern zu erlernen. So lernen sie, Sätze zu generieren, die kohärent und kontextuell relevant erscheinen. Diese Deepfakes unterstützen Cyberkriminelle bei groß angelegten Social Engineering - und Phishing-Angriffen , indem sie riesige Mengen überzeugender Texte produzieren und sind ebenso nützlich bei Dokumentenfälschungen.
Audio-Deepfakes stellen einen der größten Risikofaktoren für moderne Unternehmen dar, insbesondere für Finanzinstitute. Die Call-Center der Banken werden zunehmend mit Deepfake-Voice-Clone-Anrufen überschwemmt, mit denen versucht wird, auf Kundenkonten zuzugreifen. KI-gestützter Betrug ist für die meisten Banken zum größten Sicherheitsproblem geworden, da Betrüger durch KI veränderte Dokumente absenden, um gefälschte Konten zu eröffnen. Finanzangestellte werden manipuliert, damit sie Dutzende von Millionen an Geldmitteln bewegen mit Deepfake-Meetings, bei denen die Stimme und das Aussehen des CEOs geklont werden. Im Anschluss an den Retool-Phishing-Angriff verlor ein einziger Kryptowährungskunde des Unternehmens Vermögenswerte in Höhe von 15 Millionen US-Dollar.
Aber der durch Deepfake-Cyberkriminalität verursachte Schaden geht weit über Stimmenklone hinaus und kann jede Branche betreffen. Versicherungsunternehmen erleiden erhebliche Verluste, da Betrüger Deepfake-Beweise für illegitime Ansprüche absenden. Konkurrenten können gefälschte Kundenmeinungen oder gefälschte Videos und Bilder eines angeblich fehlerhaften Produkts erstellen, um eine Marke zu schädigen. Während die durchschnittlichen Kosten für die Erstellung eines Deepfakes bei 1,33 USD liegen, werden die weltweiten Kosten für Deepfake-Betrug im Jahr 2024 voraussichtlich 1 Billion USD betragen. Deepfakes sind eine Bedrohung für Märkte und die Gesamtwirtschaft: Das Deepfake einer Pentagon-Explosion verursachte Panik am Aktienmarkt, bevor die Behörden sie widerlegen konnten. Ein raffinierterer Angriff könnte leicht zu massiven Wertverlusten des Unternehmens führen und die Weltwirtschaft schädigen.
Für Medienunternehmen kann der durch Deepfakes verursachte Reputationsschaden schnell zu einem Verlust von Zuschauern und Werbeeinnahmen führen. In einer Zeit, in der die Zielgruppe bereits skeptisch gegenüber allen Inhalten ist, denen sie begegnet, erhöhen Deepfakes die Einsätze für genaue Berichterstattung und Faktenprüfung. Wenn sich herausstellt, dass es sich bei einem audiovisuellen Medium, das als Grundlage oder Beweis für einen Nachrichtenbericht dient, um ein Deepfake handelt, das nicht verifiziert und nicht gekennzeichnet ist, könnte der Schaden für die Nachrichtenredaktion und die Beziehung des Unternehmens zu seiner Zielgruppe irreparabel sein.
Social-Media-Plattformen sind genauso verwundbar, vor allem, weil sie für die Mehrheit der Amerikaner zur führenden Nachrichtenquelle geworden sind. Böswillige Akteure geben lediglich 7 Cent aus, um 100.000 Social-Media-Nutzer zu erreichen. mit einem als Waffe eingesetzten Deepfake. Die unkontrollierte Verbreitung von KI-manipulierten Nachrichten kann zu erheblichen Verlusten bei Zielgruppe und Werbekunden sowie zu Unruhen unter den Aktionären führen, ganz zu schweigen von den schädlichen Auswirkungen auf die Gesellschaft insgesamt.
Deepfake-Desinformationskampagnen können die Integrität von Wahlen beeinträchtigen und Unruhen und Chaos in der Regierung verursachen. Solche Unruhen können die Märkte erschüttern, die Wirtschaft schwächen und das Vertrauen zwischen Wählern und dem Wahlsystem untergraben. Über 40.000 Wähler wurden von dem Deepfake-Biden-Robocall in New Hampshire betroffen. Diese Kampagnen beschränken sich jedoch nicht auf Wahlen. Staatlich gesponserte Akteure können synthetische Videos von Staatsoberhäuptern erstellen, die falsche Behauptungen aufstellen, um diplomatische und Handelsbeziehungen zu schädigen, Konflikte zu schüren und Aktien zu manipulieren. Der Global Risks Report 2024 des Weltwirtschaftsforums bewertet KI-getriebene Desinformation als die größte Bedrohung, der die Welt in den nächsten zwei Jahren gegenübersteht.
Wie können Unternehmen dieser dringenden Bedrohung begegnen? Es kommt auf die Erkennung an.
Die Fähigkeit, KI-generierte Stimmen, Videos, Bilder und Text – genau, schnell und in großem Maßstab – zu erkennen, hilft Unternehmen, den Bedrohungsakteuren einen Schritt voraus zu sein, die versuchen, Deepfakes für ihre Betrugs- oder Desinformationskampagnen durchzuführen.
Wer sich mit der Absicherung von Call-Centern, kundenorientierten Teams und internen Help Desks beschäftigt, sollte nach einer Lösung suchen, die KI-generierte Stimmen in Echtzeit erkennen kann. Da diese Kontaktpunkte sehr anfällig und betrugsanfällig sind, sollte sich die Echtzeit-Spracherkennung für Deepfakes nahtlos in bestehende Sprachauthentifizierungs- oder biometrische Plattform-Workflows einfügen und Unternehmen eine nahtlose Integration ermöglichen, ohne dass sie ihre Mitarbeiter auf einen völlig neuen Technologie-Stack schulen müssen.
Eine von sechs Banken haben Schwierigkeiten, ihre Kunden in irgendeiner Phase der Customer Journey zu identifizieren, und Finanzkräfte nannten das Customer Onboarding als den Workflow-Prozess, der am anfälligsten für Betrug ist. Text- und Bilddetektoren sind eine wirksame Abschreckung gegen gefälschte Dokumente, Identitätsdiebstahl und Phishing-Versuche. Ein umfassendes Toolset zur Erkennung von Deepfakes sollte den Onboarding- und erneuten Authentifizierungsfluss von KYC- und Betrugsbekämpfungsteams stärken, um sich gegen Präsentations- und Injection-Angriffe zu schützen.
Journalisten sollten sich in der Lage fühlen, über Nachrichten zu berichten und darauf vertrauen können, dass ihre Quellen authentisch sind. Bild-, Video- und Texterkennungsmodelle helfen dabei, sicherzustellen, dass Reporter in legitimen Berichten keine gefälschten Beweise berücksichtigen. 53 % der Amerikaner beziehen ihre Nachrichten aus sozialen Medien. Eine gut ausgestattete Erkennungslösung sollte Content-Moderations-Teams, von denen nicht erwartet werden kann, dass sie die Flut an Inhalten in großem Umfang überprüfen, dabei helfen, Social-Media-Plattformen davor zu schützen, unwissentlich zu Kanälen für gefälschte Inhalte zu werden.
Hochentwickelte Tools zur Erkennung von Audio-Fälschungen wurden entwickelt, um das neueste populäre Mittel der politischen Manipulation zu erkennen: irreführende Robocalls, bei denen Stimmenklone von politischen Kandidaten verwendet werden. Staatlich geförderte Angreifer können sich jetzt leicht als Staatsoberhäupter und andere politische Persönlichkeiten ausgeben. Heutige Erkennungslösungen können in kritischen Momenten synthetisierte Imitationen erkennen und so sicherstellen, dass die Öffentlichkeit gewarnt werden kann. Die Texterkennung hilft der Regierung, schädliche KI-generierte Dokumente und Mitteilungen zu erkennen, um Identität und Betrug zu verhindern, bevor sie sich auf das Leben und den Lebensunterhalt der Bürger auswirken können.
Reality Defender ist eine solche Lösung zum Erkennen und zum Schutz vor fortgeschrittenen Deepfakes aller Medien. Die plattformunabhängige API ermöglicht es Unternehmen, eine Flut von Inhalten hochzuladen und die Erkennungsfunktionen bedarfsgerecht zu skalieren. Dabei wird ein Multi-Modell-Ansatz verwendet, um jede hochgeladene Datei aus verschiedenen Blickwinkeln zu betrachten und die neuesten Deepfake-Erstellungsmodelle zu berücksichtigen. So entsteht ein vollständigeres und robusteres Ergebnis, das die Wahrscheinlichkeit einer KI-Manipulation widerspiegelt. Mit mehreren Modellen für verschiedene Modalitäten können Unternehmen fundierte und datengestützte Maßnahmen ergreifen, um ihre Kunden, Vermögenswerte und ihren Ruf vor komplexen Deepfake-Angriffen von heute und morgen zu schützen.