Le organizzazioni hanno un'intera nuova pipeline di progetti in fase di realizzazione che utilizza l'AI generativa. Durante la fase di raccolta e gestione dei dati, è necessario raccogliere enormi volumi di dati per alimentare il modello e fornire l'accesso a diverse persone, tra cui data scientist, ingegneri, sviluppatori e altri. Ciò presenta intrinsecamente un rischio, poiché centralizza tutti i dati in un unico luogo e consente a molte persone di accedervi. Questo significa che l'AI generativa è un nuovo tipo di storage dei dati che può creare nuovi dati basandosi su dati organizzativi esistenti. Che tu abbia addestrato il modello, lo abbia affinato o lo abbia collegato a un RAG (Vector DB), quei dati probabilmente contengono informazioni personali (PII), preoccupazioni sulla privacy e altre informazioni sensibili. Questa montagna di dati sensibili è un bersaglio rosso lampeggiante a cui gli aggressori cercheranno di accedere.

Nell'ambito dello sviluppo dei modelli, vengono create nuove applicazioni in un modo completamente nuovo con nuove vulnerabilità che diventano nuovi punti di ingresso che gli aggressori cercheranno di utilizzare. Lo sviluppo spesso inizia con i team di data science che scaricano e riutilizzano modelli di machine learning open-source pre-addestrati da archivi di modelli online come HuggingFace o TensorFlow Hub. Gli archivi open-source di condivisione di modelli open source sono nati dalla complessità intrinseca della data science, dalla carenza di professionisti e dal valore che offrono alle organizzazioni riducendo drasticamente il tempo e gli sforzi necessari per l'adozione dell'AI generativa. Tuttavia, tali archivi Tuttavia, tali repository possono non disporre di controlli di sicurezza completi, il che in ultima analisi trasferisce il rischio all'azienda, cosa su cui gli aggressori contano. Essi possono iniettare una backdoor o un malware in uno di questi modelli e caricare nuovamente il modello infetto negli archivi di condivisione dei modelli, colpendo chiunque lo scarichi. La generale carenza di sicurezza in relazione ai modelli di apprendimento automatico (ML), unita ai dati sempre più sensibili a cui i modelli di ML sono esposti, significa che gli attacchi rivolti a questi modelli hanno un elevato potenziale di danno.

E durante l'inferenza e l'uso in tempo reale, gli aggressori possono manipolare i prompt per eseguire il jailbreak delle protezioni e indurre i modelli a comportarsi in modo errato generando risposte non consentite a prompt dannosi, incluse informazioni distorte, false e altre informazioni tossiche, causando danni alla reputazione. In alternativa, gli aggressori possono manipolare il modello e analizzare le coppie di input-output per addestrare un modello surrogato che imiti il comportamento del modello bersaglio, "rubandone" di fatto le funzionalità e facendo perdere all'impresa il suo vantaggio competitivo.