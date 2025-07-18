Quando DeepSeek-R1 è stato lanciato il 20 gennaio, il potente ma conveniente modello di ragionamento AI ha elettrizzato sia la Silicon Valley che Wall Street. Perché? Poteva ragionare alla pari con i migliori modelli di OpenAI e Anthropic, ma si dice che richiedesse molto meno calcolo e costasse solo una frazione per l'addestramento e l'utilizzo. Solo il mese scorso, il modello è stato scaricato più di 800.000 volte su Hugging Face.
"È stato un campanello d'allarme", ha ricordato Larry Li, fondatore e Managing Partner della società di investimento AMINO Capital con sede a Palo Alto, in una recente intervista con IBM Think. Le nuove tecnologie sono spesso sottoposte a "reverse engineering", ha affermato. "Ma nessuno si aspettava che potesse essere fatto così bene."
"Stava cambiando la narrativa secondo cui gli Stati Uniti sono l'unico posto al mondo in cui è possibile innovare", ha dichiarato Matthieu Soulé, responsabile del C.Lab di Cathay Innovation, un fondo che investe nell'innovazione dell'AI in tutta l'UE e in Asia, Cina inclusa.
Molti hanno previsto che il successo di DeepSeek avrebbe rivoluzionato il settore e la corsa globale all'AI in senso più ampio. Sei mesi dopo, abbiamo voluto verificare e vedere: è successo davvero?
Abbiamo parlato con alcuni degli stessi esperti che abbiamo intervistato nelle ore successive al rilascio di DeepSeek-R1, oltre a diversi altri esperti per avere un quadro olistico.
Nei giorni successivi al rilascio di DeepSeek-R1, molti hanno sollevato dubbi sul fatto che l'azienda avesse calcolato e riportato accuratamente i costi completi (non solo l'addestramento del modello quasi definitivo) e su quali componenti avesse utilizzato da quali aziende. In altre parole, avevano davvero fatto qualcosa di rivoluzionario o si trattava di un progresso incrementale?
Alcuni come Kaoutar El Maghraoui, Principal Research Scientist di IBM, ritengono che la vera innovazione possa essere stata quella che lei chiama "efficienza architettonica" o la combinazione di tecniche tra cui "la combinazione di esperti, una strategia di apprendimento per rinforzo, la coprogettazione hardware-software e vari altri trucchi di ottimizzazione. Si tratta per lo più di un'implementazione intelligente ed efficace di tecniche già esistenti", ha detto in una recente intervista a IBM Think.
Tuttavia, gli esperti di tutti i settori concordano sul fatto che DeepSeek-R1 abbia cambiato il landscape globale dell'AI in alcuni modi chiave. Inizialmente, molti pensavano che le aziende americane di AI avessero un vantaggio così grande da essere quasi impossibile da recuperare. DeepSeek ha sfatato questa supposizione, riducendo le barriere che impediscono agli sviluppatori e alle aziende più piccole di accedere agli strumenti per sviluppare i propri LLM.
"Gli sviluppatori e gli utenti hanno ora accesso allo stesso tipo di funzionalità di o1 di OpenAI a una frazione del costo", ha dichiarato Abraham Daniels, Senior Technical Product Manager di IBM, in un'intervista.
Il fatto che DeepSeek abbia reso open source i suoi modelli ha giocato un ruolo importante nell'aumentare l'accessibilità. "Abbiamo assistito a un aumento di interesse per l'open source dopo DeepSeek e il suo contribuito all'AI Alliance", ha dichiarato Anthony Annunziata, Director of AI Open Strategy presso IBM e l'AI Alliance. L'AI Alliance è una rete internazionale di aziende e organizzazioni che lavorano per creare un'AI aperta e sicura, fondata da IBM e Meta.
"In tutta Europa, in Vietnam, India e Giappone, ci sono tutte queste aziende regionali di AI che vogliono assicurarsi di mantenere il controllo sovrano della loro intelligenza artificiale, di poterla modellare nel modo che desiderano per adattarla alle loro esigenze culturali, sociali ed economiche, che sono diverse da quelle degli Stati Uniti e di altri luoghi", ha affermato Annunziata.
Proteggere la ricerca interna sull'AI è una priorità. "C'è una vera spinta verso la sovranità digitale in cui i governi cercano di capire come evitare l'influenza straniera dell'AI", ha detto El Maghroui.
La creazione di LLM basati sulle lingue locali motiva molti imprenditori. "L'AI si sta muovendo in quella direzione in cui, in quanto utility, ogni paese o regione vuole avere il proprio modello linguistico per avere almeno voce in capitolo in termini di influenza sul comportamento", ha affermato Li.
Il Giappone, ad esempio, ha recentemente approvato l'AI Promotion Act per sostenere in modo significativo la promozione della tecnologia. A fine giugno, l'AI Alliance ha avviato un nuovo capitolo in Giappone per concentrarsi su due aree di grande interesse per gli imprenditori locali: la sovranità dell'AI e l'AI nella manifattura. Il linguaggio gioca un ruolo importante nel controllo dei propri sistemi AI, quindi alla fine del 2024, ad esempio, un gruppo di oltre 1.500 ricercatori provenienti dal mondo accademico e industriale si è unito per sviluppare modelli linguistici giapponesi forti e aperti.
Molti modelli AI e imprenditori locali danno priorità anche agli interessi economici locali. Nel caso del Giappone, molte delle aziende che si sono unite all'AI Alliance, tra cui Mitsubishi Electric e Panasonic, stanno sviluppando modelli AI rivolti alle applicazioni manifatturiere e industriali, un segmento particolarmente ampio dell'economia giapponese.
Newsletter di settore
Ricevi insight selezionati sulle notizie più importanti e interessanti sull'AI. Iscriviti alla nostra newsletter settimanale Think. Leggi l'Informativa sulla privacy IBM.
L'abbonamento sarà fornito in lingua inglese. Troverai un link per annullare l'iscrizione in tutte le newsletter. Puoi gestire i tuoi abbonamenti o annullarli qui. Per ulteriori informazioni, consulta l'Informativa sulla privacy IBM.
D'altra parte, c'è anche un crescente interesse per modelli locali, ha detto Daisuke Okanohara, CTO e co-fondatore di Preferred Networks, una società giapponese di hardware e software che sviluppa software avanzati utilizzando deep learning e AI. A maggio, Preferred Networks ha rilasciato la sua seconda versione di PLaMo, un modello compatto che può essere eseguito on-premise ed è addestrato in giapponese e inglese.
"Le sue prestazioni non sono competitive come quelle dei modelli di frontiera nel complesso, ma eccelle in alcuni compiti specifici", ha affermato Okanohara durante un'intervista con IBM Think. "Nei casi d'uso di modelli di piccole dimensioni, come i modelli con otto o 30 miliardi di parametri, supera CLANG, GPT-4o mini e modelli simili in diversi compiti in lingua giapponese."
Anche il Vietnam ha registrato un'intensa attività di LLM imprenditoriale, e l'AI Alliance ha lanciato un capitolo in questo paese nel giugno di quest'anno. Oltre a sviluppare un modello linguistico vietnamita, gli imprenditori si concentrano sull'uso di modelli di AI per sviluppare nuovi tipi di chip che alimentino l'AI, ha detto Annunziata.
Un altro motivo per cui DeepSeek ha ispirato così tanti imprenditori locali è stato il fatto che diversi paesi hanno vietato o limitato l'uso di DeepSeek-R1, citando problemi di sicurezza e privacy. Italia, Australia, Corea del Sud e Canada hanno vietato DeepSeek, ed è stato limitato anche in diversi stati degli Stati Uniti, in particolare sui siti governativi. Ciò ha avuto un interessante effetto a catena, motivando gli imprenditori locali a utilizzare strumenti open source per creare modelli più sicuri, utilizzabili nelle loro specifiche aree geografiche.
L'ultima azienda tecnologica dell'imprenditore tecnologico e VC Kai-Fu Lee, 01.AI, vuole esplorare il mercato B2B per l'AI aziendale, un settore notoriamente difficile in Cina, dove metà delle aziende sono statali e le grandi aziende private possono cadere sotto l'influenza del governo man mano che si espandono. Lee ha precedentemente lanciato Rhymes AI, un'azienda che ha rilasciato diversi prodotti lo scorso autunno, tra cui un motore di ricerca e Allegro, un modello open source per la generazione di video.
“Lo consideriamo con un approccio pragmatico: i modelli sono davvero abbastanza buoni. Tuttavia, non è ancora facile da usare per molte aziende e questo è il problema che stiamo cercando di affrontare", ha dichiarato Anita Huang, cofondatrice di 01.AI, in un'intervista a IBM Think. "Riteniamo che il tassello mancante, specialmente per il mercato delle imprese cinesi, sia quello strato middleware che diventa il sistema operativo o il modello linguistico di grandi dimensioni." Attualmente, la loro piattaforma enterprise utilizza modelli come DeepSeek e Qwen di Alibaba.
Nell'immediato periodo successivo a DeepSeek, molti avevano previsto che avrebbe spianato la strada al dominio del ragionamento chain-of-thought. Da allora, tuttavia, il settore è cambiato. Nuove ricerche hanno dimostrato che i modelli di ragionamento sono costosi in termini di risorse e non sono necessari per molti compiti quando si cerca utilità da questi modelli.
Forse l'area più sopravvalutata è stata l'adozione di DeepSeek in ambito aziendale, dati i suoi bassi costi di licenza (era distribuito con la permissiva licenza MIT).
"In realtà, l'adozione aziendale rimane molto limitata, principalmente a causa della mancanza di garanzie sulla privacy dei dati, della mancanza di conformità, governance e sicurezza", ha detto El Maghraoui.
La maggior parte delle aziende, almeno negli Stati Uniti, si è affidata a fornitori che offrivano soluzioni gestite o verificabili.
Quindi, sebbene sia positivo che "le persone vedano che le innovazioni provengono da luoghi sorprendenti", ha affermato Annunziata, il settore dell'AI e il mercato più ampio non hanno subito i cambiamenti previsti da alcuni. Invece, "le aziende open source hanno raddoppiato l'open source e i grandi attori proprietari sono concentrati sull'acquisizione di talenti, ancora più concentrati sull'acquisizione di concorrenti o sulla riduzione dei concorrenti, e stanno investendo sempre più dollari nei loro modelli".
In definitiva, l'eredità più importante di DeepSeek potrebbe essere quella di aver dimostrato il valore di modelli di piccole dimensioni e adatti a uno scopo specifico, ha affermato Daniels.
"DeepSeek ha aperto la corsa dell'AI e ha reso i piccoli modelli linguistici il nuovo campo di battaglia", ha detto. "I modelli linguistici piccoli e altamente capaci potrebbero essere addestrati in modo più efficiente rispetto ai modelli più grandi e potrebbero rispondere meglio ai casi d'uso."
Gli agenti AI, sistemi autonomi di AI in grado di ragionare, pianificare ed eseguire compiti, sono esplosi tra le aziende nel 2025 e rappresentano uno di questi casi d'uso. I modelli più piccoli sono spesso più adatti ai sistemi di agentic AI perché sono più efficienti, richiedono meno risorse e possono essere adattati a compiti specifici.
Come ha detto Chris Hay, Distinguished Engineer di IBM, in un recente episodio di Mixture of Experts: "Quando vuoi gestire agenti, vuoi che i tuoi modelli siano piccoli, veloci e snelli".
Scopri IBM® Granite, la nostra famiglia di modelli AI aperti, performanti e affidabili, personalizzati per le aziende e ottimizzati per scalare le applicazioni AI. Esplora le opzioni relative a lingua, codice, serie temporali e guardrail.
Scopri come scegliere il foundation model di AI più adatto al tuo caso d'uso.
Consulta gli articoli, i blog e i tutorial di IBM Developer per approfondire la tua conoscenza degli LLM.
Scopri come incoraggiare i team a migliorare sempre di più le prestazioni dei modelli e a superare la concorrenza utilizzando le tecniche e le infrastrutture AI più recenti.
Esplora il valore dei foundation model di livello aziendale che forniscono fiducia, prestazioni e benefici convenienti per tutti i settori.
Scopri come incorporare l'AI generativa, il machine learning e i foundation model nelle operazioni di business per migliorare le prestazioni.
Esplora la libreria IBM di foundation model nel portfolio di watsonx per scalare in sicurezza l'AI generativa per la tua azienda.
Metti l'AI al servizio della tua azienda grazie all'esperienza leader di settore e alla gamma di soluzioni di IBM nel campo dell'AI.
Reinventa i workflow e le operazioni critiche aggiungendo l'AI per massimizzare le esperienze, il processo decisionale in tempo reale e il valore di business.
Esplora la libreria IBM dei foundation model nel portafoglio di IBM watsonx per scalare in sicurezza l'AI generativa per la tua azienda.