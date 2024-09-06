Con l'adozione dell'intelligenza artificiale (AI) in forte aumento in tutti i settori e casi d'uso, prevenire gli attacchi alla supply chain del software basato sull'AI non è mai stato così importante.
Ricerche recenti di SentinelOne hanno esposto un nuovo attore ransomware, denominato NullBulge, che prende di mira la supply chain del software che prende di mira le catene di fornitura di software utilizzando come arma il codice presente in repository open source come Hugging Face e GitHub. Il gruppo, che afferma di essere un'organizzazione hacktivista motivata da una causa anti-AI, si rivolge specificamente a queste risorse per avvelenare i set di dati utilizzati nell'addestramento dei modelli AI.
Che si tratti di utilizzare soluzioni AI mainstream, integrarle negli stack tecnologici esistenti tramite application programming interface (API) o addirittura sviluppare i modelli a partire dai foundation model open source, l'intera supply chain del software AI è ora pienamente nel mirino degli autori di attacchi informatici.
I componenti open source svolgono un ruolo critico nella supply chain dell'AI. Solo le imprese più grandi hanno accesso alle enormi quantità di dati necessarie per addestrare un modello da zero, quindi devono fare molto affidamento su set di dati open source come LAION 5B o Common Corpus. La mole di questi set di dati significa anche che è estremamente difficile mantenere la qualità dei dati e la conformità alle leggi sul copyright e sulla privacy. Al contrario, molti modelli di AI generativa mainstream come ChatGPT sono black box in quanto utilizzano i propri set di dati resi accurati. Ciò comporta una serie di sfide per la sicurezza.
I modelli verticalizzati e proprietari possono perfezionare i foundation model open source con una formazione supplementare utilizzando i propri set di dati. Ad esempio, un'azienda che sviluppa un customer service chatbot di nuova generazione potrebbe utilizzare i precedenti registri di comunicazione con i clienti per creare un modello su misura per le proprie esigenze specifiche. Tali dati sono da tempo un bersaglio per i criminali informatici, ma la rapida ascesa dell'AI generativa li ha resi ancora più attraenti per attori nefasti.
Prendendo di mira questi set di dati, i criminali informatici possono avvelenarli con misinformazione o codice e dati dannosi. Poi, una volta che queste informazioni compromesse entrano nel processo di addestramento dei modelli AI, iniziamo a vedere un effetto a catena che attraversa l'intero ciclo di vita del software AI. Possono volerci migliaia di ore e una grande quantità di potenza di calcolo per addestrare un modello linguistico di grandi dimensioni (LLM). È un'impresa estremamente costosa, sia dal punto di vista economico che ambientale. Tuttavia, se i set di dati utilizzati nell'addestramento sono stati compromessi, è probabile che si debba ricominciare l'intero processo da zero.
La maggior parte degli attacchi alla supply chain con AI avviene tramite metodi di manomissione backdoor come quelli sopra menzionati. Tuttavia, questo non è certamente l'unico modo, soprattutto perché gli attacchi informatici contro i sistemi AI diventano sempre più diffusi e sofisticati. Un altro metodo è l'attacco flood, in cui gli aggressori inviano enormi quantità di informazioni non dannose attraverso un sistema AI, nel tentativo di nascondere qualcos'altro, come un pezzo di codice dannoso.
Stiamo assistendo anche a un aumento degli attacchi contro le API, in particolare quelle prive di solide procedure di autenticazione. Le API sono essenziali per integrare l'AI nelle molteplici funzioni per cui le aziende la utilizzano ora e, sebbene spesso si presuma che l'API security sia affidata al fornitore della soluzione, in realtà è una responsabilità molto condivisa.
Esempi recenti di attacchi alle API di AI includono la compromissione di ZenML o la vulnerabilità della piattaforma AI Nvidia. Sebbene entrambi i problemi siano stati affrontati dai rispettivi fornitori, ne seguiranno altri man mano che i criminali informatici espanderanno e diversificheranno gli attacchi contro le supply chain del software.
Niente di tutto questo deve essere preso come un avvertimento a stare lontano dall'AI. Dopotutto, non smetteresti di usare l'e-mail a causa del rischio di truffe di phishing . Questi sviluppi significano che l'AI è ora la nuova frontiera del crimine informatico, e la sicurezza deve essere radicata in tutto ciò che si fa nello sviluppo, nell'implementazione, nell'uso e nella manutenzione di tecnologie basate su AI, che siano di proprietà o prodotte da un fornitore terzo.
Per farlo, le aziende hanno bisogno di una completa tracciabilità per tutti i componenti utilizzati nello sviluppo dell'AI. Hanno anche bisogno di spiegazioni e verifiche complete per ogni output generato dall'AI. Non è possibile farlo senza tenere gli esseri umani informati e senza mettere la sicurezza in cima alle priorità strategiche. Se invece si considera l'AI solo come un modo per risparmiare tempo e tagliare i costi licenziando i lavoratori, senza badare alle conseguenze, allora è solo una questione di tempo prima che si verifichi un disastro.
Anche le soluzioni di sicurezza basate su AI svolgono un ruolo critico nel contrastare le minacce. Non sostituiscono gli analisti di sicurezza di talento, ma sono un potente rafforzamento che li aiuta a fare ciò che sanno fare meglio su una scala che altrimenti sarebbe impossibile da raggiungere.
