Foundation model in watsonx.ai

Esplora la libreria IBM di modelli AI disponibili nello studio watsonx.ai
Schermata di prodotto dei foundation models di watsonx.ai

Scegli il modello di cui hai bisogno

Seleziona il modello IBM Granite, open source o di terze parti più adatto alla tua attività e implementalo in sede o nel cloud.

Il punto di vista di IBM sui modelli AI Scegli il foundation model giusto

Novità

Granite 3.3 è ora disponibile nella libreria di foundation model watsonx.
Mistral Medium 3 è ora disponibile in watsonx.ai
Nuova funzione del modello
Meta Llama 4 Maverick e Llama 4 Scout sono ora disponibili in watsonx.ai
Nuova funzione del modello
I nuovi modelli Granite 3.3 hanno funzionalità di Speech to Text e prestazioni del modello linguistico migliorate
Nuova funzione del modello

Libreria di Foundation model

Scegli il modello che meglio si adatta al tuo caso d'uso specifico, alle considerazioni sul budget, agli interessi geografici e al profilo di rischio.

Esplora la libreria di modelli di embedding
Logo di IBM
Modelli IBM

Su misura per le aziende, la famiglia di modelli aperti, performanti e affidabili di IBM Granite offre prestazioni eccezionali a un prezzo competitivo, senza compromettere la sicurezza.

Visualizza la libreria di modelli IBM Scopri di più su Granite
Logo Meta
Modelli Meta Llama

I modelli Llama sono modelli di linguaggio ampio aperti ed efficienti progettati per versatilità e prestazioni elevate in un'ampia gamma di attività in linguaggio naturale.

Visualizza la libreria dei modelli Meta Scopri di più sulla nostra partnership
Logo Mistral
Modelli Mistral AI

I modelli Mistral sono veloci, performanti, modelli di linguaggio open-weight progettati per la modularità e ottimizzati per la generazione di testo, il ragionamento e le applicazioni multilingue.

Visualizza la libreria di modelli Mistral
Illustrazione di una lente d'ingrandimento
Altri fornitori di modelli di terze parti

Su watsonx.ai sono disponibili diversi foundation model di altri fornitori.

Visualizza la libreria di modelli
Logo dell'azienda Gartner

IBM è stata nominata leader in data science e machine learning

IBM è stata riconosciuta come leader nel Gartner Magic Quadrant™ 2025 per le piattaforme di data science e machine learning.

Ottieni il report

Storie dei clienti

Cosa succede quando addestri un potente modello AI con i tuoi dati unici? Esperienze del cliente migliori e valore più rapido con l'AI. Esplora queste storie e scopri come.

Logo Wimbledon
Wimbledon

Wimbledon ha utilizzato i foundation model watsonx.ai per addestrare la sua AI per creare commenti sul tennis.

Leggi il case study
Logo della Recording Academy
La Recording Academy

La Recording Academy ha utilizzato AI Stories con IBM watsonx per generare e scalare i contenuti editoriali riguardanti i candidati ai GRAMMY.

Leggi l'annuncio
Logo di Masters
The Masters

Il Masters utilizza watsonx.ai per portare sulle piattaforme digitali insight basati su AI, combinate con opinioni di esperti.

Leggi l'annuncio
Logo AddAI.Life
AddAI.Life

AddAI.Life utilizza watsonx.ai per accedere a modelli linguistici di grandi dimensioni open source selezionati e creare assistenti virtuali di qualità superiore.

Leggi il case study
Nome del modello Fornitore Casi d’uso Lunghezza del contesto Prezzo USD/1 milione di token*

gpt-oss-120b

OpenAI

Implementazione privata on-premise o edge, workflow di ragionamento, utilizzo di strumenti (ad esempio ricerca, esecuzione del codice), chain-of-thought personalizzabile, output strutturati, attività di ragionamento regolabile

128K

input di 0,15 token 
output di 0,60 token

granite-3-3-8b-instruct

Nuovo
Modello in evidenza

IBM

Supporta il ragionamento e la pianificazione, le attività di Q&A, il supporto per il fill-in-the-middle, il riepilogo, la classificazione, la generazione, l'estrazione, la RAG e le attività di codifica.

128k

0,20

granite-3-2-8b-instruct

IBM

Supporta il ragionamento e la pianificazione, le attività di Q&A, il riepilogo, la classificazione, la generazione, l'estrazione, il RAG e le attività di codifica.

128k

0,20

granite-vision-3-2-2b

IBM

Supporta casi d'uso da immagine a testo per l'analisi di diagrammi, grafici e infografiche e domande e risposte sul contesto.

16.384

0.10

granite-3-2b-instruct (v3.1)

IBM

Supporta le attività di domanda e risposta, riepilogo, classificazione, generazione, estrazione, RAG e codifica. 

128k

0.10

granite-3-8b-instruct (v3.1)

Modello in evidenza

IBM

Supporta le attività di domanda e risposta, riepilogo, classificazione, generazione, estrazione, RAG e codifica. 

128k

0,20

granite-guardian-3-8b (v3.1)

IBM

Supporta il rilevamento di HAP/ o PII, jailbreaking, bias, violenza e altri contenuti dannosi.

128k

0,20

granite-guardian-3-2b (v3.1)

Obsoleto

IBM

Supporta il rilevamento di HAP o PII, jailbreaking, bias, violenza e altri contenuti dannosi.

128k

0.10

granite-13b-instruct

Obsoleto

IBM 

Supporta le attività di domanda e risposta, riepilogo, classificazione, generazione, estrazione e RAG.

8192

0.60

granite-8b-code-instruct

IBM

Modello specifico per la programmazione che genera, spiega e traduce il codice a partire da un prompt in linguaggio naturale.

 

128k

0.60

granite-8b-japanese

Obsoleto

IBM

Supporta le attività di domanda e risposta, riepilogo, classificazione, generazione, estrazione, traduzione e RAG in giapponese. 

4096

0.60

*I prezzi riportati sono indicativi, possono variare a seconda del paese, non includono eventuali tasse applicabili e sono soggetti alla disponibilità dell'offerta del prodotto in un determinato paese. 

Nome del modello Fornitore Casi d’uso Lunghezza del contesto Prezzo USD/1 milione di token*

llama-4-scout-17b-16e-instruct

Nuovo

Meta

Ragionamento multimodale, elaborazione del contesto lungo (10 milioni di token), generazione e analisi di codice, operazioni multilingue (200 lingue supportate), STEM e ragionamento logico.

128k

Anteprima gratuita

llama-4-maverick-17b-128e-instruct-fp8

Nuovo

Meta

Ragionamento multimodale, elaborazione del contesto lungo (10 milioni di token), generazione e analisi di codice, operazioni multilingue (200 lingue supportate), STEM e ragionamento logico.

128k

Input: 0,35 / Output: 1,40

llama-3-3-70b-instruct

Meta

Supporta le attività di Q&A, riepilogo, generazione, codifica, classificazione, estrazione, traduzione e RAG nelle lingue inglese, tedesco, francese, italiano, portoghese, hindi, spagnolo e thailandese.

128k

0.71

llama-3-2-90b-vision-instruct

Meta

Supporta la didascalia delle immagini, la trascrizione da immagine a testo (OCR) inclusa la scrittura a mano, l'estrazione e l'elaborazione dei dati, il contesto Q&A e l'identificazione degli oggetti.

128k

2.00

llama-3-2-11b-vision-instruct

Meta

Supporta la didascalia delle immagini, la trascrizione da immagine a testo (OCR) inclusa la scrittura a mano, l'estrazione e l'elaborazione dei dati, il contesto Q&A e l'identificazione degli oggetti.

128k

0.35

llama-guard-3-11b-vision

Meta

Supporta il filtro delle immagini, il rilevamento HAP o PII e il filtro dei contenuti dannosi.

128k

0.35

llama-3-2-1b-instruct

Meta

Supporta le attività di Q&A, riepilogo, generazione, codifica, classificazione, estrazione, traduzione e RAG nelle lingue inglese, tedesco, francese, italiano, portoghese, hindi, spagnolo e thailandese.

128k

0.10

llama-3-2-3b-instruct

Meta

Supporta le attività di Q&A, riepilogo, generazione, codifica, classificazione, estrazione, traduzione e RAG nelle lingue inglese, tedesco, francese, italiano, portoghese, hindi, spagnolo e thailandese.

128k

0.15

llama-3-405b-instruct

Meta

Supporta le attività di Q&A, riepilogo, generazione, codifica, classificazione, estrazione, traduzione e RAG nelle lingue inglese, tedesco, francese, italiano, portoghese, hindi, spagnolo e thailandese.

128k

Input: 5.00 / Output: 16.00

*I prezzi riportati sono indicativi, possono variare a seconda del paese, non includono eventuali tasse applicabili e sono soggetti alla disponibilità dell'offerta del prodotto in un determinato paese. 

Modelli Mistral

Nome del modello Fornitore Casi d’uso Lunghezza del contesto Prezzo USD/1 milione di token*

mistral-medium-2505

Nuovo

Mistral AI

Supporta la codifica, la didascalia delle immagini, la trascrizione da immagine a testo, la chiamata di funzioni, l'estrazione e l'elaborazione dei dati, il contesto Q&A, il ragionamento matematico

128k

Input: 3.00 / Output: 10.00

mistral-small-3-1-24b-instruct-2503

Nuovo

Mistral AI

Supporta la didascalia delle immagini, la trascrizione da immagine a testo, il richiamo di funzioni, l'estrazione e l'elaborazione dei dati, il contesto Q&A e l'identificazione degli oggetti

128k

Input: 0,10 / Output: 0,30

pixtral-12b

Obsoleto

Mistral AI

Supporta la didascalia delle immagini, la trascrizione da immagine a testo (OCR) inclusa la scrittura a mano, l'estrazione e l'elaborazione dei dati, il contesto Q&A e l'identificazione degli oggetti.

128k

0.35

mistral-large-2

Obsoleto

Mistral AI

Supporta le attività di Q&A, riepilogo, generazione, codifica, classificazione, estrazione, traduzione e RAG in francese, tedesco, italiano, spagnolo e inglese.

128k*

Input: 3.00 / Output: 10.00

*I prezzi riportati sono indicativi, possono variare a seconda del paese, non includono eventuali tasse applicabili e sono soggetti alla disponibilità dell'offerta del prodotto in un determinato paese. 

Foundation model di terze parti

Nome del modello Fornitore Casi d’uso Lunghezza del contesto Prezzo USD/1 milione di token*

allam-1-13b-instruct

SDAIA

Supporta le attività di Q&A, riepilogo, classificazione, generazione, estrazione, RAG e traduzione in arabo.

4096

1.80

jais-13b-chat (Arabic)

core42

Supporta le attività di Q&A, riepilogo, classificazione, generazione, estrazione e traduzione in arabo.

2048

1.80

flan-t5-xl-3b

Obsoleto

Google

Supporta le attività di domanda e risposta, riepilogo, classificazione, generazione, estrazione e RAG. Disponibile per la messa a punto dei prompt.

4096

0.60

flan-t5-xxl-11b

Obsoleto

Google

Supporta le attività di domanda e risposta, riepilogo, classificazione, generazione, estrazione e RAG.

4096

1.80

flan-ul2-20b

Obsoleto

Google

Supporta le attività di domanda e risposta, riepilogo, classificazione, generazione, estrazione e RAG.

4096

5.00

elyza-japanese-llama-2-7b-instruct

Obsoleto

ELYZA

Supporta le attività di domanda e risposta, riepilogo, RAG, classificazione, generazione, estrazione e traduzione. 

4096

1.80

*I prezzi riportati sono indicativi, possono variare a seconda del paese, non includono eventuali tasse applicabili e sono soggetti alla disponibilità dell'offerta del prodotto in un determinato paese. 

Libreria di modelli di incorporamento

Utilizza modelli di incorporamento sviluppati e open source di IBM, implementati in IBM watsonx.ai, per attività di retrieval-augmented generation, ricerca semantica e confronto di documenti. Oppure scegli un fornitore di modelli di embedding di terze parti.

Modelli di incorporamento IBM

Nome del modello Fornitore Casi d’uso Lunghezza del contesto Prezzo USD/1 milione di token*

granite-embedding-107m-multilingual

Nuovo

IBM

Attività di retrieval-augmented generation, ricerca semantica e confronto di documenti.

512

0.10

granite-embedding-278m-multilingual

IBM

Attività di retrieval-augmented generation, ricerca semantica e confronto di documenti.

512

0.10

slate-125m-english-rtrvr-v2

IBM

Attività di retrieval-augmented generation, ricerca semantica e confronto di documenti.

512

0.10

slate-125m-english-rtrvr

IBM

Attività di retrieval-augmented generation, ricerca semantica e confronto di documenti.

512

0.10

slate-30m-english-rtrvr-v2

IBM

Attività di retrieval-augmented generation, ricerca semantica e confronto di documenti.

512

0.10

slate-30m-english-rtrvr

IBM

Attività di retrieval-augmented generation, ricerca semantica e confronto di documenti.

512

0.10

*I prezzi riportati sono indicativi, possono variare a seconda del paese, non includono eventuali tasse applicabili e sono soggetti alla disponibilità dell'offerta del prodotto in un determinato paese. 

Modelli di incorporamento di terze parti

Nome del modello Fornitore Casi d’uso Lunghezza del contesto Prezzo USD/1 milione di token*

all-mini-l6-v2

Nuovo

Microsoft

Attività di retrieval-augmented generation, ricerca semantica e confronto di documenti.

256

0.10

all-minilm-l12-v2

OS-NLP-CV

Attività di retrieval-augmented generation, ricerca semantica e confronto di documenti.

256

0.10

multilingual-e5-large

Intel

Attività di retrieval-augmented generation, ricerca semantica e confronto di documenti.

512

0.10

*I prezzi riportati sono indicativi, possono variare a seconda del paese, non includono eventuali tasse applicabili e sono soggetti alla disponibilità dell'offerta del prodotto in un determinato paese. 

Proprietà intellettuale

IBM si impegna a creare, distribuire e utilizzare modelli AI che stimolano, in modo responsabile, l'innovazione in tutta l'azienda. La gamma di soluzioni AI IBM watsonx include un processo end-to-end per la creazione e il test di foundation model e AI generativa. Per i modelli sviluppati da IBM, cerchiamo ed eliminiamo duplicati e utilizziamo liste di blocco degli URL, filtri per contenuti discutibili e qualità dei documenti, tecniche di suddivisione delle frasi e di tokenizzazione, il tutto prima di addestrare il modello.

Durante il processo di addestramento dei dati, ci adoperiamo per evitare incongruenze nelle uscite del modello e utilizziamo la messa a punto supervisionata per consentire un migliore rispetto delle istruzioni in modo che il modello possa essere impiegato per completare i compiti aziendali tramite l'ingegneria dei prompt. Continuiamo a sviluppare modelli Granite in diverse direzioni, tra cui altre modalità, contenuti specifici di settore e più annotazioni di dati per l'addestramento, implementando al contempo misure di protezione dei dati regolari e continuative per i modelli sviluppati da IBM.  

Data la rapida evoluzione della tecnologia AI generativa, dobbiamo continuare a sviluppare e migliorare i nostri processi end-to-end. A testimonianza del rigore con cui sviluppa e testa i suoi foundation model, IBM offre da contratto un indennizzo standard per la proprietà intellettuale per tutti i modelli da essa sviluppati, così come per i suoi prodotti hardware e software.

Inoltre, in linea con l'approccio IBM e contrariamente ad altri fornitori di modelli linguistici di grandi dimensioni, IBM non richiede ai suoi clienti un indennizzo per l'utilizzo dei modelli sviluppati da IBM da un cliente. Inoltre, in linea con l'approccio IBM al proprio obbligo di indennizzo, IBM non limita la propria responsabilità di indennizzo per i modelli sviluppati da IBM.

I modelli watsonx che beneficiano di questo indennizzo includono al momento:

(1) i modelli della famiglia Slate con architettura solo encoder

(2) Famiglia Granite di un modello solo decoder

Maggiori informazioni sulle licenze per i modelli Granite (PDF)

Fai il passo successivo

Inizia a rendere operativi e scalare AI generativa e machine learning per le aziende esplorando la nostra prova gratuita o prenotando una demo live.

Inizia la prova gratuita Prenota una demo live
Approfondisci Entra in contatto con la community IBM Leggi la documentazione SaaS Leggi la documentazione software Ottieni assistenza
Note a piè di pagina

* Lunghezza del contesto supportata dal fornitore del modello, tuttavia la lunghezza effettiva del contesto sulla piattaforma è limitata. Per ulteriori informazioni, consultare la documentazione.

L'inferenza viene fatturata in unità di risorse. 1 unità di risorsa è pari a 1.000 token. Input e token di completamento sono addebitati alla stessa tariffa. 1.000 token corrispondono generalmente a circa 750 parole.

Non tutti i modelli sono disponibili in tutte le regioni. Per maggiori dettagli, consulta la nostra documentazione.

La lunghezza del contesto è espressa in token.

Le dichiarazioni IBM relative a piani, indicazioni e intenzioni sono soggette a modifiche o a ritiro senza preavviso, a esclusiva discrezione di IBM. Per maggiori dettagli, consulta la sezione Prezzi. Se non diversamente specificato nella sezione Prezzi del software, tutte le funzioni, le funzionalità e i potenziali aggiornamenti si riferiscono esclusivamente a SaaS. IBM non garantisce che funzioni e funzionalità SaaS e del software siano le stesse.