Granite

Modelli AI aperti, performanti e affidabili creati per il business.

Illustrazione di forme geometriche stratificate in un gradiente di colori
IBM Granite 4.0: la nuova generazione di modelli Granite
Riduci i costi e velocizza i workload con modelli efficienti progettati per l'adozione di un'AI scalabile e pensata per le aziende.
Maggiori informazioni

Scopri Granite

Costruisci e scala l'AI più velocemente con modelli personalizzabili e open source, ottimizzati per workload, efficienza dei costi e distribuzione flessibile.

Aperto
Open source in Apache 2.0, Granite garantisce la trasparenza, consentendo al contempo la completa personalizzazione e flessibilità di implementazione su qualsiasi infrastruttura.
Performanti
I modelli di piccole dimensioni e ad alte prestazioni sono progettati per massimizzare l'efficienza e la scalabilità per le attività aziendali essenziali
Affidabile
Elimina il rischio di AI "black box" con trasparenza nei dati e nei processi di addestramento, funzionalità di rilevamento e misure di sicurezza integrati.

Presentazione di Granite 4.0

Scopri i modelli

Granite 4.0 Nano
Attività AI leggere, locali ed edge in cui il calcolo e la connettività sono limitati
Granite 4.0 Micro & Tiny
Attività ad alto volume e bassa complessità, in cui la velocità, il costo e l'efficienza sono la priorità principale
Granite 4.0 Small
Workflow Enterprise che richiedono prestazioni più elevate senza il costo dei modelli di frontiera

In cifre

Oltre il 70%
riduzione dei requisiti di memoria
2X
velocità di inferenza più elevate
Granite-Docling: un modello ultracompatto per la document conversion
IBM Granite-Docling è un modello open-source e altamente efficiente che converte documenti in formati leggibili dalla macchina preservando completamente il layout.
Maggiori informazioni

Granite Family of Small Model

Modelli linguistici di piccole dimensioni (SLM)

Modelli di linguaggio core con ragionamento, ottimizzati per RAG e workflow agente.

Incorporamento

Modelli che generano embedding di alta qualità per ricerca semantica, RAG e recupero contestuale di informazioni multi-turn.

Conversione dei documenti

Modello linguistico visivo ultra-compatto che converte documenti in formati strutturati e leggibili da macchina preservando layout, tabelle ed equazioni.

Visione

Modelli efficienti di linguaggio di visione per la comprensione di documenti e immagini, che consentono l'OCR, l'analisi dei grafici e l'estrazione di contenuti aziendali.

Discorso

Modelli di linguaggio e parlato leggeri per la trascrizione e la traduzione in 7 lingue, che garantiscono elevata accuratezza ed efficienza.

Serie temporali

Modelli pre-addestrati leggeri per previsioni rapide e accurate delle serie temporali, ottimizzati per una distribuzione efficiente su ambienti hardware.

Guardrail

Guardrail rileva allucinazioni, distorsioni, contenuti dannosi e jailbreak, garantendo una distribuzione sicura dell'AI aziendale su tutti i workflow.

Geospaziale

Modelli NASA-IBM per l'osservazione della Terra, che prevedono la biomassa, il clima, la temperatura del terreno e le inondazioni dai dati satellite su larga scala.

Prestazioni ed efficienza

Granite 4.0 è progettato per garantire l'efficienza, utilizzando meno memoria e garantendo velocità più elevate e alte prestazioni. Questo equilibrio consente alle aziende di ridurre i costi e scalare le soluzioni più rapidamente su workload critici.

Grafico circolare dei requisiti RAM di Granite 4.0

I modelli Granite 4.0 sono progettati per fare di più con meno. Utilizzano una quantità di memoria notevolmente inferiore - oltre il 70% in meno rispetto a modelli simili - così le organizzazioni possono eseguire potenti AI su hardware più convenienti. Significa costi infrastrutturali più bassi, prestazioni più veloci e la possibilità di scalare l'AI più facilmente in tutta l'azienda.

Grafico delle linee di throughput di Granite 4.0

Granite 4.0 garantisce un throughput costantemente elevato man mano che i workload aumentano, gestendo facilmente batch di dimensioni maggiori, mentre altri modelli rallentano. In questo modo le aziende riescono a mantenere prestazioni affidabili per le applicazioni che devono servire molti utenti o svolgere attività complesse contemporaneamente.

Grafico a dispersione delle prestazioni generali di Granite 4.0

Granite 4.0 garantisce una maggiore precisione con requisiti di memoria notevolmente inferiori rispetto ai modelli concorrenti, anche in dimensioni più piccole. Questa efficienza si traduce in risparmi sui costi, maggiore accessibilità e la possibilità di implementare l'AI aziendale in modo più ampio e flessibile.

Punteggio RAG di Granite 4.0
Granite 4.0 supera i modelli aperti di dimensioni simili e più grandi nelle attività RAG. Offrendo una maggiore precisione senza richiedere infrastrutture aggiuntive, Granite aiuta le aziende a creare applicazioni più affidabili e basate sulla conoscenza, mantenendo le implementazioni efficienti ed economiche.
Grafico a barre della classifica IFEval di Granite 4.0

Granite 4.0 dimostra prestazioni leader di settore nel seguire le istruzioni tra modelli aperti, una funzionalità essenziale per workflow agentici. Bilanciando una forte precisione con dimensioni ridotte, Granite fornisce alle aziende output di alta qualità per attività complesse a costi di infrastruttura inferiori rispetto ai modelli aperti più grandi.

Grafico circolare dei requisiti RAM di Granite 4.0

I modelli Granite 4.0 sono progettati per fare di più con meno. Utilizzano una quantità di memoria notevolmente inferiore - oltre il 70% in meno rispetto a modelli simili - così le organizzazioni possono eseguire potenti AI su hardware più convenienti. Significa costi infrastrutturali più bassi, prestazioni più veloci e la possibilità di scalare l'AI più facilmente in tutta l'azienda.

Grafico delle linee di throughput di Granite 4.0

Granite 4.0 garantisce un throughput costantemente elevato man mano che i workload aumentano, gestendo facilmente batch di dimensioni maggiori, mentre altri modelli rallentano. In questo modo le aziende riescono a mantenere prestazioni affidabili per le applicazioni che devono servire molti utenti o svolgere attività complesse contemporaneamente.

Grafico a dispersione delle prestazioni generali di Granite 4.0

Granite 4.0 garantisce una maggiore precisione con requisiti di memoria notevolmente inferiori rispetto ai modelli concorrenti, anche in dimensioni più piccole. Questa efficienza si traduce in risparmi sui costi, maggiore accessibilità e la possibilità di implementare l'AI aziendale in modo più ampio e flessibile.

Punteggio RAG di Granite 4.0
Granite 4.0 supera i modelli aperti di dimensioni simili e più grandi nelle attività RAG. Offrendo una maggiore precisione senza richiedere infrastrutture aggiuntive, Granite aiuta le aziende a creare applicazioni più affidabili e basate sulla conoscenza, mantenendo le implementazioni efficienti ed economiche.
Grafico a barre della classifica IFEval di Granite 4.0

Granite 4.0 dimostra prestazioni leader di settore nel seguire le istruzioni tra modelli aperti, una funzionalità essenziale per workflow agentici. Bilanciando una forte precisione con dimensioni ridotte, Granite fornisce alle aziende output di alta qualità per attività complesse a costi di infrastruttura inferiori rispetto ai modelli aperti più grandi.

Granite per sviluppatori

Ricetta: sintesi di documenti

Crea uno strumento per il riepilogo di documenti con IBM Granite per elaborare documenti oltre i limiti della finestra di contesto.

RAG con Langchain

Crea una pipeline RAG con Granite per rispondere alle query utilizzando una knowledge base esterna.

Ricetta: RAG multimodale

Crea una pipeline RAG multimodale con Granite e Docling per interrogare testo, tabelle e immagini.

Guida: modelli open source

Scopri come gli LLM open source consentono autonomia, riducono i costi e aiutano gli sviluppatori con la valutazione, la regolazione e la distribuzione.

Tutorial: forecasting delle serie temporali

Utilizza i modelli di serie temporali Granite per eseguire il forecasting zero-shot e fine-tuned.

Tutorial: traduzione vocale

Utilizza il riconoscimento vocale automatico (ASR) per generare la trascrizione di un podcast utilizzando Granite e watsonx.ai.

Tutorial: co-pilot di AI locale

Costruisci un co-pilot di AI locale utilizzando IBM Granite Code, Ollama e Continue.

Visualizza il cookbook completo di granite

Visualizza il cookbook completo di granite

Costruisci con Granite

I modelli Granite guidano l'AI alla base di molti prodotti e servizi IBM. Scopri soluzioni pronte all'uso per la generazione di codice, lo sviluppo di applicazioni e il test dei modelli. Il tutto supportato da IBM Granite.

Resta aggiornato sulle notizie di AI

Blog | Granite 3.2: nuove capacità di ragionamento e multimodalità

I modelli Granite più recenti offrono nuove funzionalità di ragionamento, un modello supportato dalla visione e una maggiore efficienza, fornendo risultati competitivi a un costo inferiore

Podcast | DeepSeek facts vs hype, model distillation, and open source competition

Nell'episodio 40 di Mixture of Experts, il panel affronta i falsi miti su DeepSeek R1, spiega la distillazione dei modelli e analizza il landscape di concorrenti open source.

Newsletter AI Think | Ricevi notizie sull'AI

Ricevi una selezione accurata di argomenti, tendenze e ricerche sull'AI direttamente nella tua casella di posta.

Articolo | L'AI di DeepSeek mostra la potenza dei modelli più piccoli

DeepSeek-R1 è un assistente digitale che, secondo l'azienda, funziona bene quanto o1 di OpenAI in alcuni benchmark di AI per compiti di codifica e programmazione, è stato addestrato con un numero molto inferiore di chip e ha un costo inferiore di circa il 96%.

IBM si impegna a creare, distribuire e utilizzare modelli AI che stimolano l'innovazione in tutta l'azienda in modo responsabile. La piattaforma dati e AI IBM watsonx dispone di un processo end-to-end per la creazione e il test dell'AI generativa e dei foundation model. Per i modelli sviluppati da IBM, cerchiamo ed eliminiamo duplicati e utilizziamo liste di blocco degli URL, filtri per contenuti discutibili e qualità dei documenti, tecniche di suddivisione delle frasi e di tokenizzazione, il tutto prima di un modello di formazione.

Durante il processo di addestramento dei dati, lavoriamo per evitare disallineamenti nei risultati dei modelli e utilizziamo la messa a punto supervisionata per migliorare il seguito delle istruzioni in modo che il modello possa essere utilizzato per completare le attività aziendali attraverso l'ingegneria dei prompt. Continuiamo a sviluppare modelli Granite in diverse direzioni, tra cui altre modalità, contenuti specifici di settore e più annotazioni di dati per la formazione, implementando al contempo misure di protezione dei dati periodica e in corso per i modelli sviluppati da IBM. 

Data la rapida evoluzione della tecnologia AI generativa, dobbiamo continuare a sviluppare e migliorare i nostri processi end-to-end. A testimonianza del rigore con cui sviluppa e testa i suoi foundation model, IBM offre da contratto un indennizzo standard per la proprietà intellettuale per tutti i modelli da essa sviluppati, così come per i suoi prodotti hardware e software.

Inoltre, in linea con l'approccio IBM e contrariamente ad altri fornitori di modelli linguistici di grandi dimensioni, IBM non richiede ai suoi clienti un indennizzo per l'utilizzo dei modelli sviluppati da IBM da un cliente. Inoltre, in linea con l'approccio IBM al proprio obbligo di indennizzo, IBM non limita la propria responsabilità di indennizzo per i modelli sviluppati da IBM.

I modelli watsonx che beneficiano di questo indennizzo includono al momento:

(1) Famiglia Slate di modelli solo encoder.

(2) Famiglia Granite di un modello solo decoder.

Scopri di più sulle licenze per i modelli Granite

* Come modelli di intelligenza artificiale più piccoli e personalizzati per il settore possono offrire maggiori benefici 
https://www.ft.com/partnercontent/ibm/how-smaller-industry-tailored-ai-models-can-offer-greater-benefits.html

1Prestazioni dei modelli Granite condotti da IBM Research rispetto ai principali modelli aperti nei benchmark accademici e aziendali - https://ibm.com/new/ibm-granite-3-0-open-state-of-the-art-enterprise-models