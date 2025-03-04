Se avessi letto i titoli dei giornali del 20 gennaio 2025, avresti potuto pensare che il cielo stesse crollando. Questo perché la società cinese DeepSeek ha rilasciato quel giorno il suo modello linguistico di grandi dimensioni (LLM) R1, che è rapidamente diventato uno dei modelli più scaricati e attivi poco dopo il suo rilascio.

La causa dell'entusiasmo è stato il fatto che il laboratorio di ricerca sull'AI con sede a Hangzhou, in Cina, che rilascia modelli a suo nome, abbia costruito un modello a un costo molto inferiore, 5,6milioni di dollari, e con molte meno risorse di calcolo e accesso ai chip NVIDIA rispetto ai principali modelli statunitensi.

La gente temeva apertamente che alcune delle aziende statunitensi di AI fortemente finanziate stessero per essere superate. Poiché DeepSeek utilizzava meno chip NVIDIA rispetto alle altre aziende, il prezzo delle azioni dell'azienda è sceso. Tuttavia, si è trattato più di una reazione impulsiva alla notizia che di qualcosa di concretamente preoccupante per le sorti del produttore di chip.

I giornalisti del settore tecnologico e finanziario hanno interpretato questa notizia come uno shock per il sistema. Tuttavia, per altri esperti sull'AI e per me, l'unica sorpresa dell'annuncio di R1 da parte di DeepSeek è stata la sorpresa di tutti gli altri.

Sebbene il modello fosse nuovo, DeepSeek non è affatto un nuovo arrivato nel marketplace. Ha una lunga tradizione di produzione di preziosi modelli open source nel mercato cinese, in particolare il modello V3 rilasciato a dicembre. Infatti, ha pubblicato un documento tecnico di accompagnamento, che offre una formazione per chiunque voglia approfondire come costruire questi laboratori. Il modello V3 è stato più una sorpresa, ma a quanto pare è passato inosservato.

Il modello R1 di DeepSeek, naturalmente, è un altro esempio di strumento di AI generativa che può diventare la base per il futuro dell'agentic AI, dove gli strumenti AI non solo rispondono alle richieste degli utenti, ma lavorano in modo indipendente per fornire servizi a quegli utenti.

Sebbene IBM® collabori e utilizzi tutti questi modelli, siamo anche grandi sostenitori e ingegneri del movimento open source. Vedere un modello open source come R1 ricevere i meritati elogi è un'ottima cosa per il settore.

È comprensibile che per i grandi operatori sia stato un po' sconcertante vedere DeepSeek produrre un modello alla pari o migliore dei loro modelli, ma costruito a una frazione del costo dei modelli più noti. Tuttavia, questo è lo scopo per cui è stata concepita la comunità open source.

L'annuncio di DeepSeek R1 mostra una storia di due mondi: i mercati finanziari prevedevano turbolenze mentre gli esperti dell'AI erano entusiasti della svolta tecnologica e di come essa potesse informare modelli più efficienti e potenti di nuova generazione.