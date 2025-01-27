DeepSeek-R1, il modello AI della startup cinese DeepSeek, è salito in vetta alle classifiche dei modelli più scaricati e attivi sulla piattaforma open source AI Hugging Face poche ore dopo il suo lancio la scorsa settimana. Ha inoltre scosso i mercati finanziari, mentre ha indotto gli investitori a riconsiderare le valutazioni dei produttori di chip come NVIDIA e gli ingenti investimenti che i giganti americani dell'AI stanno facendo per scalare le loro attività in questo settore.

Perché tutto questo scalpore? Un cosiddetto "modello di ragionamento", DeepSeek-R1 è un assistente digitale che, secondo l'azienda, funziona bene quanto o1 di OpenAI in alcuni benchmark di AI per compiti di matematica e codifica, è stato addestrato con un numero molto inferiore di chip ed è circa del 96% più economico da utilizzare.

"DeepSeek sta sicuramente rimodellando il landscape dell'AI, sfidando i giganti con ambizioni open-source e innovazioni all'avanguardia", afferma Kaoutar El Maghraoui, Principal Research Scientist e Manager presso IBM AI Hardware.

Nel frattempo, ByteDance, il colosso tecnologico cinese proprietario di TikTok, ha recentemente annunciato il proprio agente di ragionamento, UI-TARS, che sostiene superi GPT-4o di OpenAI, Claude di Anthropic e Gemini di Google su alcuni benchmark. L'agente di ByteDance può leggere le interfacce grafiche, ragionare e agire in modo autonomo passo dopo passo.

Dalle startup ai giganti affermati, le aziende cinesi di AI sembrano colmare il divario con i loro rivali americani, in gran parte grazie alla disponibilità a rendere open source o condividere il codice software sottostante con altre aziende e sviluppatori software. "DeepSeek è riuscito a diffondere modelli piuttosto potenti in tutta la comunità", afferma Abraham Daniels, Senior Technical Product Manager per il modello Granite di IBM. DeepSeek-R1 è offerto su Hugging Face con una licenza MIT che consente un uso commerciale senza restrizioni. "DeepSeek potrebbe davvero accelerare la democratizzazione dell'AI", afferma.

La scorsa estate, l'azienda cinese Kuaishou ha presentato uno strumento di generazione video simile a Sora di OpenAI, ma disponibile al pubblico fin dall'inizio. Sora è stato presentato lo scorso febbraio ma completamente rilasciato solo a dicembre e anche allora solo chi aveva un abbonamento ChatGPT Pro poteva accedere a tutte le sue caratteristiche. Gli sviluppatori di Hugging Face hanno anche acquistato nuovi modelli open source dei giganti tecnologici cinesi Tencent e Alibaba. Mentre Meta ha reso open source i suoi modelli Llama, sia OpenAI che Google hanno adottato un approccio prevalentemente closed source per lo sviluppo dei loro modelli.

Oltre al vantaggio dell'open source, gli ingegneri di DeepSeek hanno utilizzato solo una frazione dei chip NVIDIA altamente specializzati impiegati dai concorrenti americani per addestrare i loro sistemi. Gli ingegneri di DeepSeek, ad esempio, hanno dichiarato di aver bisogno solo di 2.000 GPU (unità di elaborazione grafica), o chip, per addestrare il loro modello DeepSeek-V3, secondo un articolo di ricerca pubblicato con la release del modello.