Rettangoli tridimensionali astratti

Un elenco di modelli linguistici di grandi dimensioni (LLM)

Un elenco degli LLM

I modelli linguistici di grandi dimensioni (LLM) sono diventati la base dello sviluppo dell'intelligenza artificiale moderna. Hanno dato il via e ora definiscono l'era dell'AI generativa, dalle semplici applicazioni chatbot all'ingegneria agentica e ad altri workflow complessi e automatizzati guidati dagli agenti AI. Il loro avvento ha segnato una svolta fondamentale nella storia del machine learning.

Man mano che la tecnologia matura, i nuovi LLM continuano a proliferare. I principali sviluppatori di AI, le nuove start-up e le potenze aziendali affermate rilasciano e perfezionano continuamente nuovi modelli. Nel frattempo, la comunità open source perfeziona costantemente gli LLM open source, unificando e modificando i modelli esistenti su set di dati personalizzati per creare infinite varianti. Pertanto, nessun elenco di LLM potrebbe ragionevolmente sperare di essere esaustivo, e anche l'elenco più "esauriente" non rimarrebbe tale per molto tempo.

Quello che segue è un elenco di alcuni degli LLM più importanti e performanti disponibili oggi. Ecco alcune cose da notare:

  • La lista dà priorità ai modelli attivamente supportati e aggiornati dagli sviluppatori, mantenendo prestazioni almeno nominalmente competitive. Questo esclude diversi foundation model storicamente influenti, come T5 di Google, GPT-3 di OpenAI o Llama 2 di Meta, alcuni dei quali continuano a essere utilizzati a scopo di ricerca.

Per scopi pratici, gli LLM possono generalmente essere suddivisi in 2 categorie: LLM a codice chiuso , disponibili esclusivamente come offerte commerciali tramite lo sviluppatore del modello, e modelli aperti, disponibili gratuitamente.

Design 3D di palline che rotolano su una pista

Le ultime notizie e insight sull'AI


Scopri notizie e insight selezionati da esperti in materia di AI, cloud e molto altro nella newsletter settimanale Think. 

LLM closed source

Un modello closed source, o modello proprietario, può essere accessibile direttamente solo sulla piattaforma dello sviluppatore del modello, su altre piattaforme a cui ha concesso in licenza il proprio modello o tramite l'API proprietaria del fornitore del modello.

Poiché gli sviluppatori di modelli chiusi generalmente trattano i dettagli tecnici come segreti commerciali strettamente custoditi, è tipicamente impossibile conoscere con certezza le dimensioni di un modello chiuso, l'architettura delle reti neurali o il processo di addestramento. Alcuni dettagli possono essere dedotti, ad esempio confrontando la velocità di inferenza, l'uso della memoria GPU e le prestazioni di benchmark di un modello chiuso con quelle dei modelli aperti i cui dettagli sono resi pubblici ma raramente, se non mai, confermati.

Almeno dal 2022 circa, la maggior parte dei modelli di frontiera all'avanguardia in un dato momento sono stati modelli chiusi, ma questo è in gran parte un riflesso delle circostanze storiche del settore nel mondo reale, piuttosto che qualsiasi superiorità intrinseca dei modelli chiusi rispetto ai modelli aperti. Di seguito sono elencate alcune delle serie di modelli chiusi più importanti, ordinate alfabeticamente.

Claude (Anthropic)

I modelli linguistici Claude di Anthropic sono tra i più performanti al mondo. Fondato originariamente nel 2021 come laboratorio di ricerca sulla sicurezza dell'AI da ex dipendenti di OpenAI, l'approccio di Anthropic allo sviluppo dei modelli si basa sul concetto unico di AI costituzionale. La "Costituzione" di Claude è un documento che serve non solo a guidare la condotta dei dipendenti di Anthropic, ma anche la condotta (e la creazione di dati di addestramento sintetici ) degli stessi modelli di Claude.

A partire dal modello Claude 3, le successive generazioni di Claude hanno proposto modelli multimodali in 3 diverse dimensioni:

  • I Claude Haiku sono i modelli più piccoli di Anthropic, ottimizzati per velocità ed efficienza economica. A differenza dei modelli Sonnet e Opus, i modelli Haiku non sono modelli di ragionamento: a meno che non vengano esplicitamente richiesti, i modelli Haiku non producono tracce di ragionamento a catena (CoT).
  • I Claude Sonnet sono i modelli di medie dimensioni di Anthropic, mirati a quello che Anthropic considera il compromesso ottimale tra prestazioni ed efficienza per la maggior parte dei casi d'uso. Sia Sonnet che Opus sono modelli di ragionamento ibridi, ovvero che possono essere configurati per eseguire sia inferenza standard sia ragionamento adattivo CoT per risolvere problemi complessi e a più passaggi.
  • I Claude Opus sono i modelli più grandi e potenti di Anthropic, volti a prestazioni di frontiera in attività impegnative.

Claude Haiku, Sonnet e Opus possono tutti elaborare input di testo, audio e immagini e produrre output di testo o audio (come Text to Speech). Storicamente, a differenza della maggior parte dei concorrenti con modello chiusi (e la piattaforma Claude che supportano) non erano in grado di generare immagini, ma dal 12 marzo 2026, Claude può farlo. Accedendo ai modelli tramite l'API Claude, gli utenti possono impostare il "livello di sforzo" del processo di ragionamento di Sonnet o Opus su "max", "high", "medium", "low" o "adaptive".

Gemini (Google)

Gemini è la serie di modelli linguistici chiusi di Google, sviluppata dalla sua controllata Google DeepMind e lanciata per la prima volta a dicembre 2023. Vale la pena notare che Google Brain (che è stato fuso con DeepMind per formare Google DeepMind nel 2023) è responsabile della creazione dell'architettura del modello trasformatore che ha consentito i primi LLM, dopo aver pubblicato il famoso documento di ricerca "Attention is All You Need" nel 2017.

Dall'inizio del 2025, Google ha rilasciato ogni generazione di modelli Gemini con 3 diverse dimensioni, tutti modelli di ragionamento. Quando si accede all'API Gemini, gli utenti possono selezionare uno dei molteplici "livelli di pensiero" per personalizzare la quantità di token e di tempo che il modello impiegherà prima di generare un output finale.

  • I modelli Gemini Pro sono gli LLM più grandi e all'avanguardia di Google.

  • I modelli Gemini Flash sono, rispetto a Gemini Pro, ottimizzati per la velocità.

  • I modelli Gemini Flash-Lite sono veloci ed economici, ottimizzati per compiti ad alto volume come la traduzione e l'uso di strumenti agentici.

I modelli Gemini Pro, Flash e Flash-Lite sono nativamente multimodali: possono elaborare input di testo, audio, immagini o video e generare output di testo. Quando accessibili tramite la piattaforma Gemini, gli output multimodali possono essere generati tramite modelli separati e specializzati di Gemini per la generazione di immagini, video o generazione di musica.

Dal rilascio di Gemini 2.5 Pro nel marzo 2025, che ha raggiunto le migliori prestazioni del settore nella maggior parte dei benchmark accademici, i modelli Gemini hanno concorso con Claude e la serie GPT di OpenAI come i LLM più performanti al mondo. In generale, lo stato di modello "top" cambia di mano ogni volta che viene rilasciato un nuovo modello di frontiera in una di queste tre serie.

Grok (xAI)

Grok è una famiglia di LLM proprietari prodotta da xAI, lanciata per la prima volta in beta preview come chatbot su X (precedentemente Twitter) nel novembre 2023. Ad aprile 2025, xAI ha lanciato l'accesso API per Grok 3, che all'epoca era il suo modello di punta più recente.

La gamma di modelli Grok continua a cambiare nel corso delle successive generazioni di modelli.

  • Grok 2 è stato affiancato da Grok 2 Mini, la prima variante di dimensioni ridotte della famiglia di modelli. Questa stessa convenzione è stata ripetuta per Grok 3 nel febbraio 2025.

  • La quarta generazione dei modelli Grok è stata lanciata con Grok 4 e Grok 4 Heavy nel luglio 2025. Nell'autunno del 2025, a questi modelli sono seguiti Grok 4 Fast e quindi Grok 4.1 (disponibile nelle configurazioni Thinking e Non-thinking).

  • Ad agosto 2025, xAI ha rilasciato Grok Code Fast 1, un modello focalizzato sull'efficienza ottimizzato per la codifica agentica.

A partire da Grok 4, i modelli Grok possono elaborare input di testo, immagini e voce. Sebbene i modelli Grok LLM non possano fornire output multimodali, il modello Aurora di xAI può generare output di immagini e video tramite la sua piattaforma Grok Imagine.

Indipendentemente dalle prestazioni grezze, gran parte della storia di Grok (e in particolare quella del chatbot di Grok) è stata segnata da polemiche, come accuse di diffondere disinformazione elettorale, inserire punti di vista polarizzanti in conversazioni non correlate e perpetuare stereotipi dannosi.

Versioni open source

In alcune dichiarazioni pubbliche, il CEO di xAI Elon Musk ha dichiarato che "il nostro approccio generale è di rendere open source l'ultima versione quando la prossima sarà completamente disponibile."1

xAI ha reso open source Grok 1 sotto licenza Apache 2.0 nel marzo 2024. Sebbene Grok 3 sia stato rilasciato nel febbraio 2025, il successivo rilascio open source di un modello Grok è avvenuto solo nell'agosto 2025. In modo confuso, xAI (e Musk) hanno annunciato di aver reso open source "Grok 2.5", 2 anche se nessun modello era stato nominato né annunciato come tale prima di quella dichiarazione. La scheda del modello Hugging Face si riferisce addirittura al modello come "Grok-2".

In quell'annuncio dell'agosto 2025, Musk ha indicato che anche Grok 3 sarà open source tra "circa 6 mesi". A 8 mesi di distanza, la data di rilascio open source deve ancora essere annunciata.

GPT (OpenAI)

La serie GPT di OpenAI (abbreviazione di Generative Pretrained Transformer) è in gran parte accreditata per aver dato inizio all'attuale era dell'AI generativa, in particolare dopo il lancio di ChatGPT nel 2022 con il modello GPT-3.5.

Le convenzioni di OpenAI per la denominazione dei modelli e delle varianti sono cambiate significativamente dal 2022, spesso in modo confusionario. Ad esempio, GPT-4.1 è stato rilasciato dopo GPT-4.5 e il modello di ragionamento o4 era disponibile contemporaneamente al modello di non ragionamento multimodale GPT-4o, completamente distinto dal modello di ragionamento "o4", le cui prestazioni erano inferiori a quello di "o3". All'inizio del 2025, il CEO di OpenAI Sam Altman ha riconosciuto che "ci rendiamo conto di quanto siano diventati complicati il nostro modello e le nostre offerte di prodotti".

Dal rilascio di GPT-5 nell'agosto 2025, le offerte consolidate di LLM dell'azienda comprendono:

  • GPT-5.x è l'offerta di punta di OpenAI per uso generale. A marzo 2026, l'ultima versione del modello è GPT-5.4. Sebbene tutti i modelli GPT-5 siano modelli di ragionamento, GPT-5.4 è disponibile anche nella variante GPT-5.4 Pro , che "utilizza una maggiore potenza di calcolo per pensare in modo più approfondito e fornire risposte costantemente migliori".3 OpenAI offre anche GPT-5 Codex, una versione di GPT-5 ottimizzata per la generazione ottimale di codice agentico (che viene aggiornata periodicamente dopo le versioni aggiornate del modello core).
  • GPT-5 mini offre "un'intelligenza quasi di frontiera per workload sensibili ai costi, a bassa latenza e ad alto volume", secondo le panoramiche dei modelli di OpenAI.
  • GPT-5 nano è la "versione più veloce ed economica di GPT-5".

OpenAI ha anche rilasciato 2 modelli GPT a peso aperto, descritti in dettaglio nella sezione "Modelli aperti" di questo articolo.

Mistral AI

Mistral AI, un'azienda francese fondata da ex dipendenti di Meta AI e Google DeepMind, era in origine dedicata interamente ai modelli open source al momento del lancio del suo primo modello (Mistral 7B) nel settembre 2023. Da allora, Mistral è passata a un modello misto in cui molte delle sue offerte hanno versioni open source, ma alcuni modelli di frontiera selezionati rimangono closed source.

A marzo 2026, i LLM proprietari di punta di Mistral AI includono:

  • Mistral Medium 3.1, un modello multimodale generico rilasciato nell'agosto 2025.

  • Codestral, un modello incentrato sulla codifica "costruito specificamente per il completamento ad alta precisione del fill-in-the-middle (FIM)".4

  • Magistral Medium 1.2, un modello di ragionamento complementare a Mistral Medium.

I modelli a peso libero offerti da Mistral sono descritti in dettaglio più avanti in questo articolo.

AI Academy

Ecco perché i foundation model rappresentano un cambio di paradigma per l'AI

Scopri una nuova classe di modelli AI flessibili e riutilizzabili che possono sbloccare nuove entrate, ridurre i costi e aumentare la produttività, consulta quindi la nostra guida per approfondire.

LLM open source

Nel machine learning, open source è spesso usato colloquialmente per riferirsi a strumenti di AI il cui codice sorgente è reso disponibile gratuitamente, ma il termine è in realtà una designazione formale gestita dall'Open Source Initiative (OSI). L'OSI certifica una determinata licenza software come "approvata dall'iniziativa Open Source" solo se ritiene che tale licenza soddisfi i dieci requisiti elencati nella Open Source Definition (OSD) ufficiale.

La maggior parte dei modelli "open source" non soddisfa tutti questi requisiti. In questo caso, il termine modello aperto (o modello a peso aperto ) si riferisce più accuratamente a qualsiasi LLM distribuito liberamente. All'interno dello spettro dei modelli aperti c'è una grande variabilità. Un modello di peso aperto (ma non open source) può essere utilizzato per eseguire l'inferenza e può anche essere messo a punto, ma se il suo codice sorgente completo non viene fornito, non può essere modificato oltre le modifiche ai valori dei suoi pesi tramite ottimizzazione. La sua licenza potrebbe vietare l'uso del modello in alcuni scenari (come quelli commerciali) o porre altre specifiche clausole sulla sua applicazione.

Un vero modello open source, rilasciato con il codice di addestramento e una descrizione delle relative procedure, può al contrario essere completamente modificato in qualsiasi modo e utilizzato senza restrizioni. Le licenze open source più comuni e standardizzate sono la licenza Apache 2.0 e la licenza MIT. È opportuno tuttavia notare che, se lo sviluppatore di un modello open source non fornisce i dettagli dei dati di addestramento, il modello stesso non è completamente riproducibile.

Le release open source sono parte integrante dello sviluppo e del miglioramento continui degli LLM, e sono in gran parte responsabili di aver reso possibile la loro invenzione fin dall'inizio. I modelli aperti sono tipicamente accessibili tramite lo sviluppatore o tramite piattaforme open source popolari come GitHub o Hugging Face. Segue un elenco delle serie di modelli aperti più rilevanti, organizzate in ordine alfabetico.

Cohere

Cohere, un'azienda con sede in Canada i cui fondatori includono uno degli autori di "Attention is All You Need", è stata lanciata nel 2019. Sebbene l'azienda rilasci report tecnici dettagliati per ogni LLM e apparentemente li rilasci come modelli a peso aperto, Cohere concede in licenza le versioni aperte in base a una versione modificata della licenza Creative Commons 4.0 che ne vieta l'uso commerciale.

Command

 Command è la serie di foundation model di punta di Cohere, progettata per casi d'uso aziendali.

  • Command R è stata la prima generazione dei modelli enterprise di Cohere, lanciata nel marzo 2024 con un modello da 35 miliardi di parametri con particolare attenzione all'uso di RAG e strumenti. Il suo rilascio è stato presto seguito da Command R+, una variante 104B, il mese successivo. Furono raggiunti dal più piccolo Command R7B di dicembre di quell'anno.

  • Command A, la seconda generazione di modelli aziendali di Cohere, è stato rilasciato nel marzo 2025 con particolare attenzione alle attività aziendali, STEM e di codifica. Il modello 111B originale è stato infine rilasciato in varianti tra cui Command A Reasoning, Command A Translate (messa a punto per ottimizzare le prestazioni di traduzione in 23 lingue) e Command A Vision, un modello linguistico visivo (VLM) che abbinava l'LLM a un encoder visivo.

In un commento su Reddit di marzo 2026, il CEO di Cohere Aidan Gomez ha indicato che l'azienda stava attivamente sviluppando la prossima generazione di Command, e che sarebbero stati la prima combinazione di modelli di esperti (MoE) dell'organizzazione.

Aya

Aya è la serie di modelli multilingue di Cohere, lanciata per la prima volta a febbraio 2024 con Aya 101 che, come suggerisce il nome, era "in grado di seguire istruzioni in 101 lingue."

  • Aya Vision è un VLM multimodale e multilingue, offerto nelle varianti 8B e 32B, con funzionalità in 23 lingue diverse.

  • Tiny Aya, rilasciato nel febbraio 2026 è una serie di modelli multilingue leggeri con 3,35 miliardi di parametri. Tiny Aya-Base è un modello pre-addestrato che supporta oltre 70 lingue. TinyAya-Global è la sua controparte ottimizzata per le istruzioni, che supporta 67 lingue.

  • La versione di Tiny Aya conteneva anche varianti regionali specializzate. TinyAya-Earth è ottimizzato per le lingue africane e dell'Asia occidentale; TinyAya-Fire è ottimizzato per le lingue sudasiatiche; TinyAya-Water è ottimizzato per le lingue Asia-Pacifico ed europee.

DeepSeek

DeepSeek è un attore fondamentale nell'ecosistema open source e contribuisce con numerose innovazioni alle architetture LLM e ai processi di formazione. In alcuni casi, le prestazioni dei suoi modelli hanno rivaleggiato con quelle dei migliori modelli a circuito chiuso. I loro modelli lineari di apprendimento (LLM), sia i pesi che il codice, sono open source e distribuiti con una licenza MIT standard. DeepSeek pubblica inoltre frequentemente documenti tecnici che descrivono in dettaglio le proprie scoperte e tecniche.

  • DeepSeek-V3 è un modello MoE di grande portata, con 671 miliardi di parametri totali (e 37 miliardi di parametri attivi durante l'inferenza), rilasciato per la prima volta alla fine del 2024. A questo modello viene spesso attribuito il merito di aver riportato in auge la combinazione di competenze e architettura.

  • DeepSeek-R1 è un modello di ragionamento, costruito perfezionando DeepSeek-V3 e utilizzando le nuove tecniche di apprendimento per rinforzo. DeepSeek-R1 ha rappresentato una pietra miliare nella storia dei LLM open source. Non solo ha eguagliato le prestazioni del modello o1 di OpenAI, fino ad allora ineguagliato, ma ha anche fornito un documento tecnico con tutti i dettagli della metodologia di addestramento di DeepSeek. Il suo rilascio ha ispirato direttamente la prima generazione di modelli di ragionamento aperti.

  • DeepSeek-V3.1, rilasciato nell'agosto 2025, è un modello di ragionamento ibrido, configurato per eseguire sia l'inferenza standard che il ragionamento CoT. In sostanza, ha combinato DeepSeek-V3 e DeepSeek-R1 in un modello unico. È stato aggiornato più recentemente come DeepSeek-V3.2 nell'ottobre 2025. Sia DeepSeek-V3.1 che DeepSeek-V3.2 mantengono l'architettura MoE 671B-37B del modello originale.

  • DeepSeek ha inoltre rilasciato diversi modelli "DeepSeek-R1-Distill", creati perfezionando modelli Qwen e Llama più piccoli per emulare DeepSeek-R1 attraverso la distillazione della conoscenza.

Nonostante le voci periodiche su un imminente DeepSeek-V4 (o "DeepSeek-R2"), il loro rilascio non si è ancora concretizzato.

Falco (TII)

La serie di LLM Falcon è sviluppata dal Technology Innovation Institute (TTI) degli Emirati Arabi Uniti. Sebbene la prima generazione di modelli TII nel 2023 sia stata forse la più importante per il Falcon-180B, all'epoca era uno dei più grandi modelli open source disponibili, da allora il TII si è concentrato su modelli più piccoli. Falcon2 aveva 11 miliardi di parametri, mentre Falcon3, il primo modello multimodale di TII (rilasciato nel dicembre 2024), ne aveva da 1 a 10.000.

Le generazioni più recenti di modelli Falcon si sono concentrate su modelli ibridi Mamba-Transformer.

  • Falcon-H1, rilasciato nel maggio 2025, comprende modelli ibridi pre-addestrati e ottimizzati per le istruzioni nelle varianti 0,5B, 1,5B, 3B, 7B e 34B. Falcon-H1R, rilasciato nel gennaio 2026, è una variante di ragionamento di Falcon-H1-7B.

  • I Falcon-H1-Tiny sono, come suggerisce il nome, varianti estremamente piccole di Falcon-H1, con dimensioni di 90 M, 100 M e 0,6 miliardi di parametri. Ciascuna dimensione è offerta sia come modello base che come varianti specializzate, ottimizzate per casi d'uso specifici.

  • I modelli Falcon-Edge costituiscono una famiglia di LLM sperimentali a 1 bit ("BitNet") nelle dimensioni di 1B e 3B.

I modelli Falcon sono rilasciati con una licenza proprietaria Falcon che si ispira, ma aggiunge notevoli clausole e vincoli al framework Apache 2.0.

Gemma (Google)

Gemma è la famiglia di modelli aperti di Google. Secondo Google, i modelli Gemma sono "costruiti con la stessa tecnologia che supporta i modelli Gemini".7

  • Gemma 3, uscito a marzo 2025, è l'ultima generazione del core LLM di Gemma. La versione iniziale di Gemma conteneva varianti pre-addestrate e ottimizzate per le istruzioni, nelle dimensioni di 1B, 4B, 12B e 27B. Nell'agosto del 2025, Google ha aggiunto una variante più piccola con 270 milioni di parametri. I modelli Gemma 3 possono elaborare input di testo o immagini e offrono supporto multilingue per oltre 140 lingue.
  • Gemma 3n, rilasciato a luglio 2025, presenta un'architettura MatFormer sperimentale che consente essenzialmente di "annidare" un numero qualsiasi di modelli più piccoli e di dimensioni personalizzate all'interno di un singolo modello più grande. L'architettura prende il nome dalle bambole russe, chiamate anche "Matryoshka", da cui MatFormer. Gemma 3n è offerta in dimensioni nominali di parametri 2B e 4B e supporta ingressi di testo, immagini, video o audio (ma solo output testuali).

  • FunctionGemma è una variante di Gemma 3 270M ottimizzata per l'uso di strumenti (o "chiamata di funzione", da cui il nome).

I modelli Gemma sono rilasciati sotto licenza Gemma, i cui termini di utilizzo sono simili a quelli della licenza Apache 2.0 ma sono regolati dalla Gemma Prohibited Use Policy.

GLM (Z.ai)

GLM è una famiglia di LLM di Z.ai con sede a Pechino (chiamata anche Zhipu AI) che mira a raggiungere prestazioni all'avanguardia. L'azienda ha raggiunto una svolta con il GLM-4.5, che al momento del suo lancio iniziale a fine luglio 2025 apparentemente competeva con i migliori modelli open al mondo, inclusi i modelli di punta di DeepSeek e Qwen, nei benchmark accademici.

  • Il modello GLM-4.5 era disponibile in due dimensioni: il modello di punta LLM, un modello MoE di grandi dimensioni con 355 miliardi di parametri totali (32 miliardi attivi), e il modello più piccolo GLM-4.5-Air (con un totale di 106 miliardi di parametri, di cui 12 miliardi attivi). GLM-4.5V è un VLM, costruito sul foundation model GLM-4.5-Air, che aggiunge funzionalità di computer vision e comprensione video.

  • GLM-4.6, una versione aggiornata di GLM-4.5 rilasciata il 30 settembre 2025, non includeva una variante di solo testo più piccola. Tuttavia, all'inizio di dicembre l'azienda ha rilasciato GLM-4.6V (un aggiornamento di GLM-4.5V) e GLM-4.6V-Flash, un modello con densità 9B.

  • GLM-4.7, un aggiornamento del modello di punta solo testo rilasciato a fine dicembre 2025, ha aggiunto GLM-4.7-Flash, un LLM significativamente più piccolo con soli 30 miliardi di parametri totali (e 3 miliardi di parametri attivi).

  • GLM-5, rilasciato nel febbraio 2026, è significativamente più grande dei suoi predecessori, con 744 miliardi di parametri totali (40 miliardi) attivi.

Granite (IBM)

IBM Granite è una serie di LLM open source ottimizzati per casi d'uso aziendali, focalizzati principalmente su modelli piccoli, pratici ed efficienti. Lanciato per la prima volta a settembre 2023, Granite è diventato importante con il rilascio di Granite 3.0 nell'ottobre 2024, che ha portato la serie Granite a raggiungere prestazioni pari a quelle dei principali modelli open di dimensioni comparabili.

Granite 4, lanciato nell'ottobre 2025, ha introdotto una nuova architettura ibrida Mamba2-Transformer per una velocità e un'efficienza di memoria superiori, soprattutto sotto workload elevati, rispetto ai modelli tradizionali con architettura trasformativa.

  • Granite 4-H Small è un modello ibrido MoE con un totale di 32 miliardi di parametri (9 miliardi attivi). Granite 4 include inoltre un altro modello ibrido MoE, Granite 4-H Tiny, con 7 miliardi di parametri totali (1 miliardo attivo), e un modello ibrido denso, Granite 4-H Micro, con 3 miliardi di parametri attivi.

  • Granite 4 Micro è un modello denso 3B costruito su un'architettura di modello trasformatore convenzionale, a differenza dei modelli 4-H.

  • Granite 4 Nano è una serie di modelli ibridi di trasformatori Mamba e trasformatori convenzionali, con dimensioni che vanno dai parametri 350M ai parametri 1B.

  • Granite 4 1B-Speech è un modello speech-to-text progettato per il riconoscimento vocale automatico (ASR) e la traduzione automatica del parlato bidirezionale (AST).

Tutti i modelli Granite sono open source con licenza standard Apache 2.0 e sono addestrati su dati sicuri per le aziende. Nell'ottobre 2025, la serie Granite è diventata la prima grande famiglia di modelli open space a ricevere la certificazione ISO-42001.

GPT-OSS (OpenAI)

I GPT-OSS sono i modelli di linguaggio open weight di OpenAI, rilasciati nell'agosto 2025 sotto una licenza standard Apache 2.0. Sono i primi LLM aperti dell'azienda dal rilascio di GPT-2 nel 2019.

  • GPT-OSS-120B è un modello MoE con 117B parametri totali (5,1B attivi), progettato per un uso generico e per compiti che beneficiano di un ragionamento di alto livello e traggono beneficio da esso.

  • GPT-OSS-20B è un modello MoE con 21 miliardi di parametri (3,6 miliardi attivi) pensato per un uso a minore latenza e distribuzione locale.

Entrambi i modelli GPT-OSS sono stati addestrati con quantizzazione a 4 bit dei relativi pesi modello, aumentando in modo significativo la loro velocità e riducendo i requisiti di memoria rispetto a quelli dei modelli convenzionali di dimensioni simili.

Kimi (Moonshot AI)

Kimi è una serie di modelli aperti sviluppati da Moonshot AI, con sede a Pechino.

  • Kimi-K2 è un modello MoE massiccio solo testo con un totale di 1 trilione di parametri (32 miliardi attivi). Ha raggiunto una notevole notorietà al momento del suo rilascio nel luglio 2025 per aver rivaleggiato e (a volte battuto) i modelli GPT-4.1 e Claude Opus 4 sui principali benchmark di codifica.

  • Kimi-K2 Thinking, la variante del modello di ragionamento di Kimi-K2, ha suscitato scalpore anche per essere riuscita a competere ancora una volta con i migliori modelli chiusi in benchmark di agentic AI impegnativi.

  • Kimi-K2.5 è un aggiornamento di Kimi-K2 che aggiunge funzionalità di visione multimodale. Può essere utilizzato in diverse "modalità", ognuna delle quali ottimizzata per casi d'uso specifici.

I modelli Kimi sono rilasciati con una licenza MIT modificata, che richiede agli utenti di "visualizzare in modo visibile 'Kimi K2' sull'interfaccia utente" di qualsiasi prodotto con oltre 100 milioni di utenti attivi mensili o più di 20 milioni di USD di fatturato mensile.

Llama (Meta)

I modelli Llama di Meta (originariamente stilizzati come LLaMA, abbreviazione di "Large Language model Meta AI), sono stati parte integrante della storia dei modelli LLM open source. I primi rilasci di Llama aiutano a democratizzare le metodologie LLM, informando e influenzando fortemente molte convenzioni standard dello sviluppo LLM, dalla formazione all'architettura e dalle variazioni di dimensionamento.

  • Llama 2, rilasciato a luglio 2023, è stato commercializzato nei formati 7B, 13B e 70B.

  • Llama 3, rilasciato nell'aprile 2024 nelle dimensioni 8B e 70B, ha gareggiato con molti modelli chiusi leader nei benchmark accademici. Llama 3.1 ha ampliato in modo significativo la lunghezza del contesto dei modelli e ha aggiunto una variante 405B di dimensioni mai viste prima nel mese di luglio. Llama 3.2 ha introdotto varianti più piccole e funzionalità di visione migliorate, mentre Llama 3.3 presentava un unico modello 70B le cui prestazioni erano paragonabili a quelle del Llama 3.1 405B.

  • Llama 4, rilasciato in 2 grandi modelli multimodali MoE: Llama 4 Maverick, con 400 miliardi di parametri totali (17 miliardi attivi) e Llama 4 Scout, con 109 miliardi di parametri totali (19 miliardi attivi). Sebbene le loro prestazioni abbiano superato in modo significativo quelle delle generazioni precedenti di Llama nella maggior parte dei benchmark, i modelli Llama 3 rimangono gli LLM più popolari di Meta (come dimostrano i download su Hugging Face).10

Sebbene Meta usi spesso il termine "open source", i modelli Llama sono rilasciati con una licenza Llama personalizzata che impone vincoli su utilizzo, attribuzione e accesso. L'Open Source Initiative ha quindi criticato l'uso del termine da parte di Meta.

Minimax

Il gruppo MiniMax, con sede a Shanghai, ha lanciato a gennaio 2025 il suo primo modello LLM omonimo, MiniMax-Text-01, e un modello VLM complementare, MiniMax-VL-01. Da allora si sono affermati come uno dei principali sviluppatori di LLM in Cina, privilegiando modelli su larga scala e finestre contestuali di lungo periodo.

  • MiniMax-M1, rilasciato nel giugno 2025, è un modello di ragionamento di solo testo creato dalla messa a punto di MiniMax-Text-01. Come il suo predecessore, è un modello MoE di grandi dimensioni con 456 B di parametri totali e 45,9 B di parametri attivati per token.
  • MiniMax-M2 offre prestazioni ed efficienza superiori rispetto a M1. Ha un totale di 230 miliardi di parametri e un'architettura MoE più dettagliata che attiva solo 10 miliardi di parametri per token. Rilasciato nell'ottobre 2025, è stato aggiornato come MiniMax-M2.1 due mesi dopo. MiniMax offre anche MiniMax-M2-her, una versione affinata per il gioco di ruolo basato sui personaggi.

  • MiniMax-M2.5 e MiniMax-M2.5-Lightning, rilasciato a febbraio 2026, raggiunge ulteriori ottimizzazioni delle prestazioni, rivaleggiando con Claude Opus 4.5 in alcuni benchmark di codifica. Sono identici sotto tutti gli aspetti tranne che per la velocità e la produttività: la variante "Lightning" genera output due volte più velocemente.

  • MiniMax-M2.7, rilasciato a marzo 2026, è un aggiornamento di MiniMax-M2.5 che l'azienda sostiene abbia contribuito a d addestrare.11

I modelli MiniMax sono offerti sotto una licenza MIT modificata.

Mistral AI

Oltre alle offerte closed-source, Mistral AI offre una varietà di modelli aperti molto apprezzati. La maggior parte dei modelli open di Mistral (ma non tutti) è rilasciata sotto licenza standard Apache 2.0.

  • Mistral Large 3 utilizza un'architettura MoE ispirata a DeepSeek-V3, con un totale di 675 miliardi di parametri (41 miliardi attivi). Le sue prestazioni di benchmark sono approssimativamente equivalenti a quelle di DeepSeek-V3.1 e Kimi-K2.1.12 Rilasciato nel dicembre 2025, è multilingua e multimodale, in grado di elaborare input sia di testo che di immagini.

  • Ministral 3 è la serie di modelli compatti di Mistral, offerta nei formati 3B, 8B e 14B e nelle varianti base, con istruzioni ottimizzate e con ragionamento.

  • Mistral Small 3.2 è un LLM 24B rilasciato a giugno 2025. Le sue prestazioni sono paragonabili a quelle del più recente Ministral 3 14B.

  • Devstral è la serie di modelli di Mistral focalizzata sull'ingegneria agentica. Devstral 2, rilasciato nel dicembre 2025, comprende due modelli. Devstral 2 123B è rilasciato con una licenza MIT modificata, che richiede alle organizzazioni con ricavi mensili superiori a 20 milioni di dollari di richiedere una licenza commerciale a Mistral. Devstral Small 2 24B è rilasciato con licenza standard Apache 2.0.

  • Mixtral, rilasciato a dicembre 2023, è un LLM che inizialmente ha reso popolare la combinazione di esperti nell'architettura per i modelli linguistici. All'inizio del 2026, la sua variante 8x7B rimane estremamente popolare su Hugging Face, con oltre 700.000 download mensili.13

Nemotron (NVIDIA)

La serie open LLM del principale produttore di hardware NVIDIA è molto apprezzata per le prestazioni, la letteratura di ricerca e le innovazioni architettoniche.

  • NVIDIA-Nemotron-Nano v2 è una famiglia di modelli ibridi Mamba-2-LLM nelle dimensioni 9B e 12B, capaci sia di ragionamento che di inferenza standard. Sono stati rilasciati nell'agosto 2025 in base a un NVIDIA Open Model License Agreement con condizioni rilevanti riguardanti responsabilità legali, utilizzo e il diritto di NVIDIA di apportare future modifiche all'accordo.

  • Nemotron 3 Nano, rilasciato a dicembre 2025, comprende 2 modelli: Nemotron-3-Nano-4B e Nemotron-3-Nano-30B-A3B, un MoE con 30 miliardi di parametri totali (3 miliardi attivi). Sono stati rilasciati sotto la NVIDIA Nemotron Open Model License, che esclude il diritto di NVIDIA di apportare unilateralmente futuri aggiornamenti ai termini.

  • Nemotron 3 Super è un MoE più grande con 120 miliardi di parametri totali (12 miliardi attivi), rilasciato nel marzo 2026.

Olmo (AllenAI)

Gli Olmo, sviluppati dall'Allen Institute for AI ("Ai2"), sono tra i modelli open source più "aperti": Ai2 rilascia in genere tutto il codice, i pesi, i checkpoint di addestramento e i set di dati associati insieme a una versione standard di Apache 2.0.

  • Olmo 3, rilasciato nel novembre 2025, comprende modelli di trasformatori densi nelle dimensioni di 7B e 32B. I modelli sono rilasciati nelle varianti base, instruct e "think". Nel dicembre 2025, il 32B ha ricevuto un aggiornamento come Olmo 3.1.
  • Olmo Hybrid, rilasciato nel marzo 2026, è un modello 7B con un'architettura ibrida sperimentale che combina reti neurali ricorrenti (RNN) sia di tipo transformer che lineari (basato sull'architettura Gated DeltaNet resa popolare da Qwen).

Phi (Microsoft)

Phi è la linea di modelli aperti di Microsoft, storicamente focalizzata su modelli piccoli. Sono rilasciati sotto la licenza MIT standard.

  • Phi 4 è un LLM di solo testo 14B, rilasciato originariamente nel dicembre 2024.

  • Phi 4-mini, rilasciato nel febbraio 2025, è un modello più piccolo, da 3,8B.

  • Phi 4-multimodale, rilasciato insieme a Phi 4-mini, supporta gli input di testo, immagine e voce.

  • Phi 4-Reasoning-Vision, pubblicato a marzo 2026 è un modello 15B che aggiunge un ragionamento olistico e multimodale a immagini, testo e documenti.

Qwen (Alibaba)

La serie Qwen di LLM, sviluppata da Alibaba, è diventata tra i modelli open più popolari del settore. La famiglia di modelli offre una vasta gamma di dimensioni, architettura e funzionalità pensate per soddisfare diverse esigenze degli sviluppatori.

  • Qwen3 comprende modelli di trasformatori densi di solo testo nelle dimensioni di 0,6B, 1,7B, 4B, 8B, 14B e 32B, nonché MoE nelle dimensioni di 30B-A3B e il modello di punta Qwen3-235B-A22B. Tutti i modelli Qwen3 sono offerti nelle varianti base, thinking e instruct.

  • Qwen3-Next è un MoE sperimentale solo testo con 80 miliardi di parametri (di cui 3 miliardi attivi) che sostituisce l'attenzione standard con reti Gated Delta Networks (ispirate a Mamba-2) e Gated Attention.

  • Qwen3-Omni è un modello nativamente multimodale costruito su Qwen3-30B-A3B, che supporta input di testo, immagine, audio o video e output di testo o vocali.

  • Qwen3-Coder-Next è una versione di Qwen3-Next ottimizzata per la generazione di codice.

  • Qwen3.5, rilasciato nel febbraio 2026, è una famiglia di modelli multimodali che utilizza l'architettura introdotta per la prima volta in Qwen3-Next. Comprende sia modelli base che ibridi nelle dimensioni 0.8B, 2B, 4B, 9B e 27B, oltre a modelli MoE nelle dimensioni 35B-A3B, 122B-A10B e il modello di punta 397B-A17B. Qwen3.5-397B-A17B mira a competere con i modelli leader Gemini, GPT e Claude per le prestazioni di frontiera.

Autore

Dave Bergmann

Senior Staff Writer, AI Models

IBM Think

Soluzioni correlate
IBM Bob

Accelera la distribuzione del software con Bob, il tuo partner AI per uno sviluppo sicuro e consapevole degli intenti.

Esplora IBM Bob
IBM® watsonx Orchestrate

Progetta facilmente assistenti e agenti AI scalabili, automatizza le attività ripetitive e semplifica i processi complessi con IBM watsonx Orchestrate.

Scopri watsonx Orchestrate
Soluzioni di intelligenza artificiale

Metti l'AI al servizio della tua azienda con l'esperienza leader di settore e il portfolio di soluzioni di IBM nel campo dell'AI.

Esplora le soluzioni AI
Prossimi passi

Dovunque ti trovi nel ciclo di vita dello sviluppo, Bob ti copre: fornisce recensioni consapevoli dell'intento, allineate alla sicurezza e che accelerano la consegna di software di alta qualità.

  1. Scopri IBM Bob
  2. Scopri watsonx Orchestrate
Note a piè di pagina