La prevalenza degli incidenti di AI jailbreaking può essere attribuita a diversi fattori: rapidi progressi nella tecnologia AI, accessibilità degli strumenti AI e crescente domanda di output non filtrati.

Via via che i principali fornitori di tecnologia integrano modelli AI nei propri strumenti, come GPT-4 in Microsoft Copilot, la superficie per gli attacchi informatici si espande. I criminali informatici stanno anche sfruttando una serie crescente di set di dati di addestramento dell'AI per colpire i sistemi di AI attraverso l'AI jailbreaking, utilizzando tecniche come il data poisoning.

Tuttavia, non è solo la frequenza degli incidenti di AI jailbreaking ad aumentare. Anche le percentuali di successo del jailbreaking sono in aumento, poiché che gli attacchi sono sempre più sofisticati. In un recente studio, i ricercatori hanno scoperto che i tentativi di gen AI jailbreaking hanno avuto successo il 20% delle volte.

In media, i criminali hanno impiegato solo 42 secondi e 5 interazioni per farcela, e alcuni attacchi si sono verificati in meno di 4 secondi. Degli attacchi riusciti ai modelli di AI generativa, il 90% ha causato perdite di dati.2