I modelli linguistici di grandi dimensioni (LLM) sono diventati la base dello sviluppo dell'intelligenza artificiale moderna. Hanno dato il via e ora definiscono l'era dell'AI generativa, dalle semplici applicazioni chatbot all'ingegneria agentica e ad altri workflow complessi e automatizzati guidati dagli agenti AI. Il loro avvento ha segnato una svolta fondamentale nella storia del machine learning.
Man mano che la tecnologia matura, i nuovi LLM continuano a proliferare. I principali sviluppatori di AI, le nuove start-up e le potenze aziendali affermate rilasciano e perfezionano continuamente nuovi modelli. Nel frattempo, la comunità open source perfeziona costantemente gli LLM open source, unificando e modificando i modelli esistenti su set di dati personalizzati per creare infinite varianti. Pertanto, nessun elenco di LLM potrebbe ragionevolmente sperare di essere esaustivo, e anche l'elenco più "esauriente" non rimarrebbe tale per molto tempo.
Quello che segue è un elenco di alcuni degli LLM più importanti e performanti disponibili oggi. Ecco alcune cose da notare:
Per scopi pratici, gli LLM possono generalmente essere suddivisi in 2 categorie: LLM a codice chiuso , disponibili esclusivamente come offerte commerciali tramite lo sviluppatore del modello, e modelli aperti, disponibili gratuitamente.
Un modello closed source, o modello proprietario, può essere accessibile direttamente solo sulla piattaforma dello sviluppatore del modello, su altre piattaforme a cui ha concesso in licenza il proprio modello o tramite l'API proprietaria del fornitore del modello.
Poiché gli sviluppatori di modelli chiusi generalmente trattano i dettagli tecnici come segreti commerciali strettamente custoditi, è tipicamente impossibile conoscere con certezza le dimensioni di un modello chiuso, l'architettura delle reti neurali o il processo di addestramento. Alcuni dettagli possono essere dedotti, ad esempio confrontando la velocità di inferenza, l'uso della memoria GPU e le prestazioni di benchmark di un modello chiuso con quelle dei modelli aperti i cui dettagli sono resi pubblici ma raramente, se non mai, confermati.
Almeno dal 2022 circa, la maggior parte dei modelli di frontiera all'avanguardia in un dato momento sono stati modelli chiusi, ma questo è in gran parte un riflesso delle circostanze storiche del settore nel mondo reale, piuttosto che qualsiasi superiorità intrinseca dei modelli chiusi rispetto ai modelli aperti. Di seguito sono elencate alcune delle serie di modelli chiusi più importanti, ordinate alfabeticamente.
I modelli linguistici Claude di Anthropic sono tra i più performanti al mondo. Fondato originariamente nel 2021 come laboratorio di ricerca sulla sicurezza dell'AI da ex dipendenti di OpenAI, l'approccio di Anthropic allo sviluppo dei modelli si basa sul concetto unico di AI costituzionale. La "Costituzione" di Claude è un documento che serve non solo a guidare la condotta dei dipendenti di Anthropic, ma anche la condotta (e la creazione di dati di addestramento sintetici ) degli stessi modelli di Claude.
A partire dal modello Claude 3, le successive generazioni di Claude hanno proposto modelli multimodali in 3 diverse dimensioni:
Claude Haiku, Sonnet e Opus possono tutti elaborare input di testo, audio e immagini e produrre output di testo o audio (come Text to Speech). Storicamente, a differenza della maggior parte dei concorrenti con modello chiusi (e la piattaforma Claude che supportano) non erano in grado di generare immagini, ma dal 12 marzo 2026, Claude può farlo. Accedendo ai modelli tramite l'API Claude, gli utenti possono impostare il "livello di sforzo" del processo di ragionamento di Sonnet o Opus su "max", "high", "medium", "low" o "adaptive".
Gemini è la serie di modelli linguistici chiusi di Google, sviluppata dalla sua controllata Google DeepMind e lanciata per la prima volta a dicembre 2023. Vale la pena notare che Google Brain (che è stato fuso con DeepMind per formare Google DeepMind nel 2023) è responsabile della creazione dell'architettura del modello trasformatore che ha consentito i primi LLM, dopo aver pubblicato il famoso documento di ricerca "Attention is All You Need" nel 2017.
Dall'inizio del 2025, Google ha rilasciato ogni generazione di modelli Gemini con 3 diverse dimensioni, tutti modelli di ragionamento. Quando si accede all'API Gemini, gli utenti possono selezionare uno dei molteplici "livelli di pensiero" per personalizzare la quantità di token e di tempo che il modello impiegherà prima di generare un output finale.
I modelli Gemini Pro, Flash e Flash-Lite sono nativamente multimodali: possono elaborare input di testo, audio, immagini o video e generare output di testo. Quando accessibili tramite la piattaforma Gemini, gli output multimodali possono essere generati tramite modelli separati e specializzati di Gemini per la generazione di immagini, video o generazione di musica.
Dal rilascio di Gemini 2.5 Pro nel marzo 2025, che ha raggiunto le migliori prestazioni del settore nella maggior parte dei benchmark accademici, i modelli Gemini hanno concorso con Claude e la serie GPT di OpenAI come i LLM più performanti al mondo. In generale, lo stato di modello "top" cambia di mano ogni volta che viene rilasciato un nuovo modello di frontiera in una di queste tre serie.
Grok è una famiglia di LLM proprietari prodotta da xAI, lanciata per la prima volta in beta preview come chatbot su X (precedentemente Twitter) nel novembre 2023. Ad aprile 2025, xAI ha lanciato l'accesso API per Grok 3, che all'epoca era il suo modello di punta più recente.
La gamma di modelli Grok continua a cambiare nel corso delle successive generazioni di modelli.
A partire da Grok 4, i modelli Grok possono elaborare input di testo, immagini e voce. Sebbene i modelli Grok LLM non possano fornire output multimodali, il modello Aurora di xAI può generare output di immagini e video tramite la sua piattaforma Grok Imagine.
Indipendentemente dalle prestazioni grezze, gran parte della storia di Grok (e in particolare quella del chatbot di Grok) è stata segnata da polemiche, come accuse di diffondere disinformazione elettorale, inserire punti di vista polarizzanti in conversazioni non correlate e perpetuare stereotipi dannosi.
In alcune dichiarazioni pubbliche, il CEO di xAI Elon Musk ha dichiarato che "il nostro approccio generale è di rendere open source l'ultima versione quando la prossima sarà completamente disponibile."1
xAI ha reso open source Grok 1 sotto licenza Apache 2.0 nel marzo 2024. Sebbene Grok 3 sia stato rilasciato nel febbraio 2025, il successivo rilascio open source di un modello Grok è avvenuto solo nell'agosto 2025. In modo confuso, xAI (e Musk) hanno annunciato di aver reso open source "Grok 2.5", 2 anche se nessun modello era stato nominato né annunciato come tale prima di quella dichiarazione. La scheda del modello Hugging Face si riferisce addirittura al modello come "Grok-2".
In quell'annuncio dell'agosto 2025, Musk ha indicato che anche Grok 3 sarà open source tra "circa 6 mesi". A 8 mesi di distanza, la data di rilascio open source deve ancora essere annunciata.
La serie GPT di OpenAI (abbreviazione di Generative Pretrained Transformer) è in gran parte accreditata per aver dato inizio all'attuale era dell'AI generativa, in particolare dopo il lancio di ChatGPT nel 2022 con il modello GPT-3.5.
Le convenzioni di OpenAI per la denominazione dei modelli e delle varianti sono cambiate significativamente dal 2022, spesso in modo confusionario. Ad esempio, GPT-4.1 è stato rilasciato dopo GPT-4.5 e il modello di ragionamento o4 era disponibile contemporaneamente al modello di non ragionamento multimodale GPT-4o, completamente distinto dal modello di ragionamento "o4", le cui prestazioni erano inferiori a quello di "o3". All'inizio del 2025, il CEO di OpenAI Sam Altman ha riconosciuto che "ci rendiamo conto di quanto siano diventati complicati il nostro modello e le nostre offerte di prodotti".
Dal rilascio di GPT-5 nell'agosto 2025, le offerte consolidate di LLM dell'azienda comprendono:
OpenAI ha anche rilasciato 2 modelli GPT a peso aperto, descritti in dettaglio nella sezione "Modelli aperti" di questo articolo.
Mistral AI, un'azienda francese fondata da ex dipendenti di Meta AI e Google DeepMind, era in origine dedicata interamente ai modelli open source al momento del lancio del suo primo modello (Mistral 7B) nel settembre 2023. Da allora, Mistral è passata a un modello misto in cui molte delle sue offerte hanno versioni open source, ma alcuni modelli di frontiera selezionati rimangono closed source.
A marzo 2026, i LLM proprietari di punta di Mistral AI includono:
I modelli a peso libero offerti da Mistral sono descritti in dettaglio più avanti in questo articolo.
Nel machine learning, open source è spesso usato colloquialmente per riferirsi a strumenti di AI il cui codice sorgente è reso disponibile gratuitamente, ma il termine è in realtà una designazione formale gestita dall'Open Source Initiative (OSI). L'OSI certifica una determinata licenza software come "approvata dall'iniziativa Open Source" solo se ritiene che tale licenza soddisfi i dieci requisiti elencati nella Open Source Definition (OSD) ufficiale.
La maggior parte dei modelli "open source" non soddisfa tutti questi requisiti. In questo caso, il termine modello aperto (o modello a peso aperto ) si riferisce più accuratamente a qualsiasi LLM distribuito liberamente. All'interno dello spettro dei modelli aperti c'è una grande variabilità. Un modello di peso aperto (ma non open source) può essere utilizzato per eseguire l'inferenza e può anche essere messo a punto, ma se il suo codice sorgente completo non viene fornito, non può essere modificato oltre le modifiche ai valori dei suoi pesi tramite ottimizzazione. La sua licenza potrebbe vietare l'uso del modello in alcuni scenari (come quelli commerciali) o porre altre specifiche clausole sulla sua applicazione.
Un vero modello open source, rilasciato con il codice di addestramento e una descrizione delle relative procedure, può al contrario essere completamente modificato in qualsiasi modo e utilizzato senza restrizioni. Le licenze open source più comuni e standardizzate sono la licenza Apache 2.0 e la licenza MIT. È opportuno tuttavia notare che, se lo sviluppatore di un modello open source non fornisce i dettagli dei dati di addestramento, il modello stesso non è completamente riproducibile.
Le release open source sono parte integrante dello sviluppo e del miglioramento continui degli LLM, e sono in gran parte responsabili di aver reso possibile la loro invenzione fin dall'inizio. I modelli aperti sono tipicamente accessibili tramite lo sviluppatore o tramite piattaforme open source popolari come GitHub o Hugging Face. Segue un elenco delle serie di modelli aperti più rilevanti, organizzate in ordine alfabetico.
Cohere, un'azienda con sede in Canada i cui fondatori includono uno degli autori di "Attention is All You Need", è stata lanciata nel 2019. Sebbene l'azienda rilasci report tecnici dettagliati per ogni LLM e apparentemente li rilasci come modelli a peso aperto, Cohere concede in licenza le versioni aperte in base a una versione modificata della licenza Creative Commons 4.0 che ne vieta l'uso commerciale.
Command è la serie di foundation model di punta di Cohere, progettata per casi d'uso aziendali.
In un commento su Reddit di marzo 2026, il CEO di Cohere Aidan Gomez ha indicato che l'azienda stava attivamente sviluppando la prossima generazione di Command, e che sarebbero stati la prima combinazione di modelli di esperti (MoE) dell'organizzazione.
Aya è la serie di modelli multilingue di Cohere, lanciata per la prima volta a febbraio 2024 con Aya 101 che, come suggerisce il nome, era "in grado di seguire istruzioni in 101 lingue."
DeepSeek è un attore fondamentale nell'ecosistema open source e contribuisce con numerose innovazioni alle architetture LLM e ai processi di formazione. In alcuni casi, le prestazioni dei suoi modelli hanno rivaleggiato con quelle dei migliori modelli a circuito chiuso. I loro modelli lineari di apprendimento (LLM), sia i pesi che il codice, sono open source e distribuiti con una licenza MIT standard. DeepSeek pubblica inoltre frequentemente documenti tecnici che descrivono in dettaglio le proprie scoperte e tecniche.
Nonostante le voci periodiche su un imminente DeepSeek-V4 (o "DeepSeek-R2"), il loro rilascio non si è ancora concretizzato.
La serie di LLM Falcon è sviluppata dal Technology Innovation Institute (TTI) degli Emirati Arabi Uniti. Sebbene la prima generazione di modelli TII nel 2023 sia stata forse la più importante per il Falcon-180B, all'epoca era uno dei più grandi modelli open source disponibili, da allora il TII si è concentrato su modelli più piccoli. Falcon2 aveva 11 miliardi di parametri, mentre Falcon3, il primo modello multimodale di TII (rilasciato nel dicembre 2024), ne aveva da 1 a 10.000.
Le generazioni più recenti di modelli Falcon si sono concentrate su modelli ibridi Mamba-Transformer.
I modelli Falcon sono rilasciati con una licenza proprietaria Falcon che si ispira, ma aggiunge notevoli clausole e vincoli al framework Apache 2.0.
Gemma è la famiglia di modelli aperti di Google. Secondo Google, i modelli Gemma sono "costruiti con la stessa tecnologia che supporta i modelli Gemini".7
I modelli Gemma sono rilasciati sotto licenza Gemma, i cui termini di utilizzo sono simili a quelli della licenza Apache 2.0 ma sono regolati dalla Gemma Prohibited Use Policy.
GLM è una famiglia di LLM di Z.ai con sede a Pechino (chiamata anche Zhipu AI) che mira a raggiungere prestazioni all'avanguardia. L'azienda ha raggiunto una svolta con il GLM-4.5, che al momento del suo lancio iniziale a fine luglio 2025 apparentemente competeva con i migliori modelli open al mondo, inclusi i modelli di punta di DeepSeek e Qwen, nei benchmark accademici.
IBM Granite è una serie di LLM open source ottimizzati per casi d'uso aziendali, focalizzati principalmente su modelli piccoli, pratici ed efficienti. Lanciato per la prima volta a settembre 2023, Granite è diventato importante con il rilascio di Granite 3.0 nell'ottobre 2024, che ha portato la serie Granite a raggiungere prestazioni pari a quelle dei principali modelli open di dimensioni comparabili.
Granite 4, lanciato nell'ottobre 2025, ha introdotto una nuova architettura ibrida Mamba2-Transformer per una velocità e un'efficienza di memoria superiori, soprattutto sotto workload elevati, rispetto ai modelli tradizionali con architettura trasformativa.
Tutti i modelli Granite sono open source con licenza standard Apache 2.0 e sono addestrati su dati sicuri per le aziende. Nell'ottobre 2025, la serie Granite è diventata la prima grande famiglia di modelli open space a ricevere la certificazione ISO-42001.
I GPT-OSS sono i modelli di linguaggio open weight di OpenAI, rilasciati nell'agosto 2025 sotto una licenza standard Apache 2.0. Sono i primi LLM aperti dell'azienda dal rilascio di GPT-2 nel 2019.
Entrambi i modelli GPT-OSS sono stati addestrati con quantizzazione a 4 bit dei relativi pesi modello, aumentando in modo significativo la loro velocità e riducendo i requisiti di memoria rispetto a quelli dei modelli convenzionali di dimensioni simili.
Kimi è una serie di modelli aperti sviluppati da Moonshot AI, con sede a Pechino.
I modelli Kimi sono rilasciati con una licenza MIT modificata, che richiede agli utenti di "visualizzare in modo visibile 'Kimi K2' sull'interfaccia utente" di qualsiasi prodotto con oltre 100 milioni di utenti attivi mensili o più di 20 milioni di USD di fatturato mensile.
I modelli Llama di Meta (originariamente stilizzati come LLaMA, abbreviazione di "Large Language model Meta AI), sono stati parte integrante della storia dei modelli LLM open source. I primi rilasci di Llama aiutano a democratizzare le metodologie LLM, informando e influenzando fortemente molte convenzioni standard dello sviluppo LLM, dalla formazione all'architettura e dalle variazioni di dimensionamento.
Sebbene Meta usi spesso il termine "open source", i modelli Llama sono rilasciati con una licenza Llama personalizzata che impone vincoli su utilizzo, attribuzione e accesso. L'Open Source Initiative ha quindi criticato l'uso del termine da parte di Meta.
Il gruppo MiniMax, con sede a Shanghai, ha lanciato a gennaio 2025 il suo primo modello LLM omonimo, MiniMax-Text-01, e un modello VLM complementare, MiniMax-VL-01. Da allora si sono affermati come uno dei principali sviluppatori di LLM in Cina, privilegiando modelli su larga scala e finestre contestuali di lungo periodo.
I modelli MiniMax sono offerti sotto una licenza MIT modificata.
Oltre alle offerte closed-source, Mistral AI offre una varietà di modelli aperti molto apprezzati. La maggior parte dei modelli open di Mistral (ma non tutti) è rilasciata sotto licenza standard Apache 2.0.
La serie open LLM del principale produttore di hardware NVIDIA è molto apprezzata per le prestazioni, la letteratura di ricerca e le innovazioni architettoniche.
Gli Olmo, sviluppati dall'Allen Institute for AI ("Ai2"), sono tra i modelli open source più "aperti": Ai2 rilascia in genere tutto il codice, i pesi, i checkpoint di addestramento e i set di dati associati insieme a una versione standard di Apache 2.0.
Phi è la linea di modelli aperti di Microsoft, storicamente focalizzata su modelli piccoli. Sono rilasciati sotto la licenza MIT standard.
La serie Qwen di LLM, sviluppata da Alibaba, è diventata tra i modelli open più popolari del settore. La famiglia di modelli offre una vasta gamma di dimensioni, architettura e funzionalità pensate per soddisfare diverse esigenze degli sviluppatori.
Accelera la distribuzione del software con Bob, il tuo partner AI per uno sviluppo sicuro e consapevole degli intenti.
Progetta facilmente assistenti e agenti AI scalabili, automatizza le attività ripetitive e semplifica i processi complessi con IBM watsonx Orchestrate.
Metti l'AI al servizio della tua azienda con l'esperienza leader di settore e il portfolio di soluzioni di IBM nel campo dell'AI.
1. “Elon Musk reins in Grok AI bot to stop election misinformation,” The Register, 28 agosto 2024
2. “Musk’s xAI chatbot Grok keeps randomly responding about ‘white genocide’ in South Africa,” CNBC, 14 maggio 2025
3. “Elon Musk’s AI chatbot, Grok, started calling itself ‘MechaHitler’,” NPR, 9 luglio 2025
4. @MarioNawfal tweet, X (in precedenza Twitter), 18 febbraio 2025
5. “GPT-5.4 pro”, OpenAI, API docs accessed 12 marzo 2026
6. “Announcing Codestral 25.08 and the Complete Mistral Coding Stack for Enterprise,” Mistral AI, 30 luglio 2025
7. Gemma, Google DeepMind, consultato il 12 marzo 2026
8. “Alibaba-backed Moonshot releases new Kimi AI model that beats ChatGPT, Claude in coding — and it costs less,” CNBC, 14 luglio 2025
9. “5 Thoughts on Kimi K2 Thinking,” Interconnects, 6 novembre 2025
10. Meta Llama: models page (sorted by “Most Downloads”), Hugging Face, consultato l'11 marzo 2026
11. “MiniMax M2.7: Early Echoes of Self-Evolution,” MiniMax, 18 marzo 2026
12. “Introducing Mistral 3,” Mistral AI, 2 dicembre 2025
13. Mistral AI: models page (sorted by “Most Downloads”), Hugging Face, consultato l'11 marzo 2026