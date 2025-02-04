La corsa agli armamenti dell'AI non è più solo per i giganti da miliardi di dollari.
Aziende come OpenAI, Google e Microsoft hanno dominato le prime pagine dei giornali quando si parla di intelligenza artificiale. Tuttavia, una nuova ondata di innovazione open source, esemplificata dal recente modello DeepSeek, sta livellando il campo di gioco. Il successo del modello sottolinea una tendenza crescente: le aziende più piccole possono sfidare sempre più i principali attori dell'AI.
"Questo non fa che rafforzare ciò che già sapevamo", afferma David D. Cox, Vice President of AI Models presso IBM Research. "Non pensiamo che servano miliardi e miliardi di dollari per costruire grandi modelli. DeepSeek è la prova che gli approcci open source stanno prendendo piede, e questa è una buona cosa."
I ricercatori di AI sono impegnati in una corsa costante per rendere i modelli più potenti, senza aumentare i costi di elaborazione. Con le crescenti preoccupazioni riguardo ai limiti dell'hardware e al consumo energetico, le innovazioni che migliorano l'efficienza stanno diventando importanti quanto i semplici incrementi di prestazioni.
"Per troppo tempo, la corsa all'AI è stata un gioco di scala in cui modelli più grandi significavano risultati migliori", ha scritto il CEO di IBM Arvind Krishna su LinkedIn. "Ma non esiste alcuna legge della fisica che imponga che i modelli AI debbano rimanere grandi e costosi. Il costo dell'addestramento e dell'inferenza è solo un'altra sfida di tecnologia da risolvere."
La svolta di DeepSeek nell'efficienza dell'AI deriva da una nuova tecnica chiamata Multi-Head Latent Attention (MLA). Questo metodo cambia il modo in cui i modelli AI gestiscono e memorizzano le informazioni. Il miglioramento chiave è che l'MLA riduce la dimensione di qualcosa chiamato cache KV, essenziale per il funzionamento efficiente dei sistemi AI. Secondo Cox, questo fa sì che i sistemi AI utilizzino meno memoria e permette loro di crescere più facilmente.
"Hanno fatto un lavoro davvero ottimo qui", osserva Cox. "La riduzione delle dimensioni della cache KV è fondamentale perché consente ai modelli di funzionare più velocemente e di utilizzare meno risorse."
Dietro le quinte di DeepSeek, le scoperte si sono moltiplicate. Prasanna Sattigeri, Principal Research Scientist presso IBM Research, ha sottolineato che le innovazioni dell'azienda riguardavano l'efficienza e i miglioramenti architettonici.
"Hanno ottimizzato la comunicazione tra le GPU, che spesso è un collo di bottiglia nell'addestramento AI su larga scala", afferma Sattigeri. "Questo ha permesso loro di addestrare in modo efficace utilizzando un hardware più vecchio, un'impresa ingegneristica notevole."
Ma come ogni ambizioso progetto ingegneristico, questo balzo in avanti ha comportato dei costi. DeepSeek utilizzava anche tecniche di apprendimento per rinforzo (RL), simili a quelle impiegate nell'approccio di scalabilità dell'inferenza di o1 di OpenAI. Questo metodo affina le prestazioni del modello rafforzando output di successo su più iterazioni. Tuttavia, Cox sottolinea che l'implementazione di DeepSeek ha portato a compromessi, come funzionalità di chiamata di funzioni più deboli e preoccupazioni di allineamento della sicurezza.
"È un grande passo avanti, ma ci sono ancora delle imperfezioni", afferma. "Il modello è fantastico nei compiti di ragionamento, ma altri ambiti hanno subito un duro colpo."
Anche se i progressi rendono più facile costruire grandi modelli AI, rimane una sfida ancora più grande: l'enorme potenza di calcolo necessaria per rimanere competitivi. Xia "Ben" Hu, professore associato di informatica presso la Rice University, riconosce che DeepSeek è un passo avanti più efficiente nello sviluppo dell'AI. Tuttavia, osserva che ciò non cambia radicalmente le dinamiche di potere complessive nell'infrastruttura dell'AI, dove l'accesso a vaste risorse determina ancora chi guida la corsa.
"DeepSeek è sostenuto da un grande fondo di venture capital in Cina e ha accesso a decine di migliaia di GPU", afferma Hu. "Questo rappresenta ancora un ostacolo importante per molte piccole startup."
Tuttavia, Hu prevede che il cambiamento più significativo sarà probabilmente l'adozione dell'AI nelle aziende. "I settori tradizionali (petrolio, gas e manifatturiero) sono stati esitanti nello sviluppare soluzioni di AI proprie", afferma. "Con la riduzione dei costi e il miglioramento dei modelli open source, le aziende che un tempo si affidavano a servizi di AI esterni stanno ora valutando la possibilità di creare modelli interni su misura per le loro esigenze specifiche."
Le implicazioni vanno oltre un solo modello. Con la moltiplicazione dei progetti di AI open source, le startup più piccole possono ora accedere a strumenti che un tempo richiedevano enormi data center e budget enormi. Cox ha detto che OpenAI e i suoi omologhi hanno a lungo trasmesso un "senso di inevitabilità", che solo chi ha grandi risorse economiche può essere leader nell'AI. Ma con l'emergere di DeepSeek e di altri modelli, questa nozione sta iniziando a incrinarsi.
"Stiamo assistendo a un cambiamento che consentirà a un numero molto più ampio di attori di competere in questo settore", afferma Cox. "Non è che chiunque, con 5 milioni di dollari, possa arrivare e costruire un modello di alto livello da un giorno all'altro. Ma startup ben finanziate e aziende di medie dimensioni? Assolutamente."
I ricercatori si stanno anche concentrando sull'efficienza piuttosto che sulla potenza di calcolo grezza. Cox e il suo team di ricerca si sono concentrati sull'approccio Mixture of Experts, che permette all'AI di essere più selettiva nel modo in cui utilizza le risorse.
"Mixture of Experts è solo un pezzo del puzzle. C'è molto altro in arrivo", dice, suggerendo che il futuro dell'AI potrebbe dipendere meno dall'accesso a chip avanzati e più da modi più intelligenti di usare l'hardware esistente.
Sattigeri ha evidenziato una di queste innovazioni: l'ascesa dei dati sintetici, o informazioni generate artificialmente che imitano i dati del mondo reale. "Con modelli come DeepSeek, stiamo assistendo a uno spostamento verso l'utilizzo di dati sintetici generati dall'AI per perfezionare e addestrare i modelli in modo più efficiente", afferma. "Questo potrebbe ridurre significativamente i costi e rendere l'AI di alta qualità accessibile a un maggior numero di persone."
L'aumento dell'accessibilità dello sviluppo dell'AI solleva nuove domande sul futuro della competizione. Infrastrutture e potenza di calcolo determineranno ancora i vincitori, oppure la capacità di innovare diventerà rapidamente l'asset più prezioso? Secondo Cox, è un mix di entrambi.
"Servono ancora infrastrutture serie, servono ancora grandi talenti, ma il vantaggio competitivo di OpenAI e Google non è così grande come vorrebbero far credere", afferma. "In questo campo i segreti non restano segreti. Le idee si diffondono e le persone si spostano. Stiamo assistendo a una rapida convergenza."
Hu ha aggiunto che lo sviluppo dell'AI richiede ancora quattro componenti critici: "Lo chiamo modello ABCD: algoritmi, big data, calcolo e distribuzione", afferma. "Le migliori aziende di AI hanno tutti e quattro. DeepSeek sta facendo breccia nei primi due, ma il calcolo e la distribuzione danno ancora un vantaggio ai principali attori."
Il crescente numero di aziende di AI che sfruttano tecniche più efficienti non è solo una questione di concorrenza: potrebbe innescare una rivoluzione creativa. Se più aziende riusciranno a sviluppare l'AI senza budget da miliardi di dollari, l'innovazione sarà guidata da prospettive diverse piuttosto che da una manciata di agende aziendali, afferma Cox. Ciò significa soluzioni AI più personalizzate e modelli specializzati, oltre a un mercato più dinamico.
"L'innovazione avverrà più velocemente, in modo più sicuro e inclusivo", ha affermato Cox. "Se superiamo una monocultura in cui pochi attori dettano le regole, assisteremo a una fioritura di approcci diversi."
Cox ha detto che per IBM, che si è impegnata nell'AI open source, la crescita di DeepSeek convalida il suo approccio. "In realtà è una cosa positiva per noi", afferma. "Dimostra che i modelli aperti possono funzionare e che c'è domanda per loro. Più persone contribuiscono, più ne beneficiamo tutti."
Hu sottolinea che, mentre le aziende più piccole stanno guadagnando terreno, i grandi attori si stanno adattando. "Amazon, Meta e Microsoft non staranno a guardare mentre l'open source si prende il loro posto", afferma. "Stanno lavorando duramente per capire come integrare modelli open source mantenendo il controllo su infrastrutture e dati."
Cosa succede dopo? Cox e altri esperti affermano che lo sviluppo dell'AI non diventerà un caos totale, ma è chiaro che le aziende più piccole non sono più alla mercé dei giganti tecnologici. Gli strumenti open source stanno accelerando il progresso e sono le aziende che abbracciano questo cambiamento a trarne i maggiori benefici.
"Questo fa parte di una tendenza in corso", afferma Cox. "Non è iniziato con DeepSeek e non finirà con esso. Ma ha sicuramente risvegliato alcune persone."
