Foundation model - IBM watsonx.ai

Scegli il modello di cui hai bisogno

Seleziona il modello IBM Granite, open source o di terze parti più adatto alla tua attività e implementalo in sede o nel cloud.

Il punto di vista di IBM sui modelli AI

Scegli il foundation model giusto

Novità

Granite 3.3 è ora disponibile nella libreria di foundation model watsonx.

Mistral Medium 3 è ora disponibile in watsonx.ai

Nuova funzione del modello

Meta Llama 4 Maverick e Llama 4 Scout sono ora disponibili in watsonx.ai

Nuova funzione del modello

I nuovi modelli Granite 3.3 hanno funzionalità di Speech to Text e prestazioni del modello linguistico migliorate

Nuova funzione del modello

Libreria di Foundation model

Scegli il modello che meglio si adatta al tuo caso d'uso specifico, alle considerazioni sul budget, agli interessi geografici e al profilo di rischio.

Esplora la libreria di modelli di embedding

Modelli IBM

Su misura per le aziende, la famiglia di modelli aperti, performanti e affidabili di IBM Granite offre prestazioni eccezionali a un prezzo competitivo, senza compromettere la sicurezza.

Visualizza la libreria di modelli IBM

Scopri di più su Granite

Modelli Meta Llama

I modelli Llama sono modelli di linguaggio ampio aperti ed efficienti progettati per versatilità e prestazioni elevate in un'ampia gamma di attività in linguaggio naturale.

Visualizza la libreria dei modelli Meta

Scopri di più sulla nostra partnership

Modelli Mistral AI

I modelli Mistral sono veloci, performanti, modelli di linguaggio open-weight progettati per la modularità e ottimizzati per la generazione di testo, il ragionamento e le applicazioni multilingue.

Visualizza la libreria di modelli Mistral

Altri fornitori di modelli di terze parti

Su watsonx.ai sono disponibili diversi foundation model di altri fornitori.

Visualizza la libreria di modelli

Storie dei clienti

Cosa succede quando addestri un potente modello AI con i tuoi dati unici? Esperienze del cliente migliori e valore più rapido con l'AI. Esplora queste storie e scopri come.

Wimbledon

Wimbledon ha utilizzato i foundation model watsonx.ai per addestrare la sua AI per creare commenti sul tennis.

Leggi il case study

La Recording Academy

La Recording Academy ha utilizzato AI Stories con IBM watsonx per generare e scalare i contenuti editoriali riguardanti i candidati ai GRAMMY.

Leggi l'annuncio

The Masters

Il Masters utilizza watsonx.ai per portare sulle piattaforme digitali insight basati su AI, combinate con opinioni di esperti.

Leggi l'annuncio

AddAI.Life

AddAI.Life utilizza watsonx.ai per accedere a modelli linguistici di grandi dimensioni open source selezionati e creare assistenti virtuali di qualità superiore.

Leggi il case study

Foundation Model IBM

Scopri come sono stati addestrati i modelli Granite (PDF)

Scopri di più su Granite

Nome del modello

Fornitore

Casi d’uso

Lunghezza del contesto

Prezzo

USD/1 milione di token*

gpt-oss-120b

OpenAI

Implementazione privata on-premise o edge, workflow di ragionamento, utilizzo di strumenti (ad esempio ricerca, esecuzione del codice), chain-of-thought personalizzabile, output strutturati, attività di ragionamento regolabile

128K

input di 0,15 token
output di 0,60 token

granite-3-3-8b-instruct

Nuovo

Modello in evidenza

IBM

Supporta il ragionamento e la pianificazione, le attività di Q&A, il supporto per il fill-in-the-middle, il riepilogo, la classificazione, la generazione, l'estrazione, la RAG e le attività di codifica.

128k

0,20

granite-3-2-8b-instruct

IBM

Supporta il ragionamento e la pianificazione, le attività di Q&A, il riepilogo, la classificazione, la generazione, l'estrazione, il RAG e le attività di codifica.

128k

0,20

granite-vision-3-2-2b

IBM

Supporta casi d'uso da immagine a testo per l'analisi di diagrammi, grafici e infografiche e domande e risposte sul contesto.

16.384

0.10

granite-3-2b-instruct (v3.1)

IBM

Supporta le attività di domanda e risposta, riepilogo, classificazione, generazione, estrazione, RAG e codifica.

128k

0.10

granite-3-8b-instruct (v3.1)

Modello in evidenza

IBM

Supporta le attività di domanda e risposta, riepilogo, classificazione, generazione, estrazione, RAG e codifica.

128k

0,20

granite-guardian-3-8b (v3.1)

IBM

Supporta il rilevamento di HAP/ o PII, jailbreaking, bias, violenza e altri contenuti dannosi.

128k

0,20

granite-guardian-3-2b (v3.1)

Obsoleto

IBM

Supporta il rilevamento di HAP o PII, jailbreaking, bias, violenza e altri contenuti dannosi.

128k

0.10

granite-13b-instruct

Obsoleto

IBM

Supporta le attività di domanda e risposta, riepilogo, classificazione, generazione, estrazione e RAG.

8192

0.60

granite-8b-code-instruct

IBM

Modello specifico per la programmazione che genera, spiega e traduce il codice a partire da un prompt in linguaggio naturale.

128k

0.60

granite-8b-japanese

Obsoleto

IBM

Supporta le attività di domanda e risposta, riepilogo, classificazione, generazione, estrazione, traduzione e RAG in giapponese.

4096

0.60

*I prezzi riportati sono indicativi, possono variare a seconda del paese, non includono eventuali tasse applicabili e sono soggetti alla disponibilità dell'offerta del prodotto in un determinato paese.

Modelli Meta

Scopri di più sulla nostra partnership

Nome del modello

Fornitore

Casi d’uso

Lunghezza del contesto

Prezzo

USD/1 milione di token*

llama-4-scout-17b-16e-instruct

Nuovo

Meta

Ragionamento multimodale, elaborazione del contesto lungo (10 milioni di token), generazione e analisi di codice, operazioni multilingue (200 lingue supportate), STEM e ragionamento logico.

128k

Anteprima gratuita

llama-4-maverick-17b-128e-instruct-fp8

Nuovo

Meta

Ragionamento multimodale, elaborazione del contesto lungo (10 milioni di token), generazione e analisi di codice, operazioni multilingue (200 lingue supportate), STEM e ragionamento logico.

128k

Input: 0,35 / Output: 1,40

llama-3-3-70b-instruct

Meta

Supporta le attività di Q&A, riepilogo, generazione, codifica, classificazione, estrazione, traduzione e RAG nelle lingue inglese, tedesco, francese, italiano, portoghese, hindi, spagnolo e thailandese.

128k

0.71

llama-3-2-90b-vision-instruct

Meta

Supporta la didascalia delle immagini, la trascrizione da immagine a testo (OCR) inclusa la scrittura a mano, l'estrazione e l'elaborazione dei dati, il contesto Q&A e l'identificazione degli oggetti.

128k

2.00

llama-3-2-11b-vision-instruct

Meta

128k

0.35

llama-guard-3-11b-vision

Meta

Supporta il filtro delle immagini, il rilevamento HAP o PII e il filtro dei contenuti dannosi.

128k

0.35

llama-3-2-1b-instruct

Meta

128k

0.10

llama-3-2-3b-instruct

Meta

128k

0.15

llama-3-405b-instruct

Meta

128k

Input: 5.00 / Output: 16.00

Modelli Mistral

Nome del modello

Fornitore

Casi d’uso

Lunghezza del contesto

Prezzo

USD/1 milione di token*

mistral-medium-2505

Nuovo

Mistral AI

Supporta la codifica, la didascalia delle immagini, la trascrizione da immagine a testo, la chiamata di funzioni, l'estrazione e l'elaborazione dei dati, il contesto Q&A, il ragionamento matematico

128k

Input: 3.00 / Output: 10.00

mistral-small-3-1-24b-instruct-2503

Nuovo

Mistral AI

Supporta la didascalia delle immagini, la trascrizione da immagine a testo, il richiamo di funzioni, l'estrazione e l'elaborazione dei dati, il contesto Q&A e l'identificazione degli oggetti

128k

Input: 0,10 / Output: 0,30

pixtral-12b

Obsoleto

Mistral AI

128k

0.35

mistral-large-2

Obsoleto

Mistral AI

Supporta le attività di Q&A, riepilogo, generazione, codifica, classificazione, estrazione, traduzione e RAG in francese, tedesco, italiano, spagnolo e inglese.

128k*

Input: 3.00 / Output: 10.00

Foundation model di terze parti

Nome del modello

Fornitore

Casi d’uso

Lunghezza del contesto

Prezzo

USD/1 milione di token*

allam-1-13b-instruct

SDAIA

Supporta le attività di Q&A, riepilogo, classificazione, generazione, estrazione, RAG e traduzione in arabo.

4096

1.80

jais-13b-chat (Arabic)

core42

Supporta le attività di Q&A, riepilogo, classificazione, generazione, estrazione e traduzione in arabo.

2048

1.80

flan-t5-xl-3b

Obsoleto

Google

Supporta le attività di domanda e risposta, riepilogo, classificazione, generazione, estrazione e RAG. Disponibile per la messa a punto dei prompt.

4096

0.60

flan-t5-xxl-11b

Obsoleto

Google

Supporta le attività di domanda e risposta, riepilogo, classificazione, generazione, estrazione e RAG.

4096

1.80

flan-ul2-20b

Obsoleto

Google

Supporta le attività di domanda e risposta, riepilogo, classificazione, generazione, estrazione e RAG.

4096

5.00

elyza-japanese-llama-2-7b-instruct

Obsoleto

ELYZA

Supporta le attività di domanda e risposta, riepilogo, RAG, classificazione, generazione, estrazione e traduzione.

4096

1.80

Libreria di modelli di incorporamento

Utilizza modelli di incorporamento sviluppati e open source di IBM, implementati in IBM watsonx.ai, per attività di retrieval-augmented generation, ricerca semantica e confronto di documenti. Oppure scegli un fornitore di modelli di embedding di terze parti.

Modelli di incorporamento IBM

Nome del modello

Fornitore

Casi d’uso

Lunghezza del contesto

Prezzo

USD/1 milione di token*

granite-embedding-107m-multilingual

Nuovo

IBM

Attività di retrieval-augmented generation, ricerca semantica e confronto di documenti.

512

0.10

granite-embedding-278m-multilingual

IBM

Attività di retrieval-augmented generation, ricerca semantica e confronto di documenti.

512

0.10

slate-125m-english-rtrvr-v2

IBM

Attività di retrieval-augmented generation, ricerca semantica e confronto di documenti.

512

0.10

slate-125m-english-rtrvr

IBM

Attività di retrieval-augmented generation, ricerca semantica e confronto di documenti.

512

0.10

slate-30m-english-rtrvr-v2

IBM

Attività di retrieval-augmented generation, ricerca semantica e confronto di documenti.

512

0.10

slate-30m-english-rtrvr

IBM

Attività di retrieval-augmented generation, ricerca semantica e confronto di documenti.

512

0.10

Modelli di incorporamento di terze parti

Nome del modello

Fornitore

Casi d’uso

Lunghezza del contesto

Prezzo

USD/1 milione di token*

all-mini-l6-v2

Nuovo

Microsoft

Attività di retrieval-augmented generation, ricerca semantica e confronto di documenti.

256

0.10

all-minilm-l12-v2

OS-NLP-CV

Attività di retrieval-augmented generation, ricerca semantica e confronto di documenti.

256

0.10

multilingual-e5-large

Intel

Attività di retrieval-augmented generation, ricerca semantica e confronto di documenti.

512

0.10

Risorse

Come scegliere il giusto foundation model di AI

Visualizza il cookbook completo di Granite

AI generativa e apprendimento automatico (ML) per le imprese

Hugging Face e IBM collaborano nell'ambito dell'open source

Proprietà intellettuale

IBM si impegna a creare, distribuire e utilizzare modelli AI che stimolano, in modo responsabile, l'innovazione in tutta l'azienda. La gamma di soluzioni AI IBM watsonx include un processo end-to-end per la creazione e il test di foundation model e AI generativa. Per i modelli sviluppati da IBM, cerchiamo ed eliminiamo duplicati e utilizziamo liste di blocco degli URL, filtri per contenuti discutibili e qualità dei documenti, tecniche di suddivisione delle frasi e di tokenizzazione, il tutto prima di addestrare il modello.

Durante il processo di addestramento dei dati, ci adoperiamo per evitare incongruenze nelle uscite del modello e utilizziamo la messa a punto supervisionata per consentire un migliore rispetto delle istruzioni in modo che il modello possa essere impiegato per completare i compiti aziendali tramite l'ingegneria dei prompt. Continuiamo a sviluppare modelli Granite in diverse direzioni, tra cui altre modalità, contenuti specifici di settore e più annotazioni di dati per l'addestramento, implementando al contempo misure di protezione dei dati regolari e continuative per i modelli sviluppati da IBM.

Data la rapida evoluzione della tecnologia AI generativa, dobbiamo continuare a sviluppare e migliorare i nostri processi end-to-end. A testimonianza del rigore con cui sviluppa e testa i suoi foundation model, IBM offre da contratto un indennizzo standard per la proprietà intellettuale per tutti i modelli da essa sviluppati, così come per i suoi prodotti hardware e software.

Inoltre, in linea con l'approccio IBM e contrariamente ad altri fornitori di modelli linguistici di grandi dimensioni, IBM non richiede ai suoi clienti un indennizzo per l'utilizzo dei modelli sviluppati da IBM da un cliente. Inoltre, in linea con l'approccio IBM al proprio obbligo di indennizzo, IBM non limita la propria responsabilità di indennizzo per i modelli sviluppati da IBM.

I modelli watsonx che beneficiano di questo indennizzo includono al momento:

(1) i modelli della famiglia Slate con architettura solo encoder

(2) Famiglia Granite di un modello solo decoder

Maggiori informazioni sulle licenze per i modelli Granite (PDF)

Fai il passo successivo

Inizia a rendere operativi e scalare AI generativa e machine learning per le aziende esplorando la nostra prova gratuita o prenotando una demo live.

Inizia la prova gratuita

Prenota una demo live

Approfondisci

Entra in contatto con la community IBM

Leggi la documentazione SaaS

Leggi la documentazione software

Ottieni assistenza

Note a piè di pagina

^* Lunghezza del contesto supportata dal fornitore del modello, tuttavia la lunghezza effettiva del contesto sulla piattaforma è limitata. Per ulteriori informazioni, consultare la documentazione.

L'inferenza viene fatturata in unità di risorse. 1 unità di risorsa è pari a 1.000 token. Input e token di completamento sono addebitati alla stessa tariffa. 1.000 token corrispondono generalmente a circa 750 parole.

Non tutti i modelli sono disponibili in tutte le regioni. Per maggiori dettagli, consulta la nostra documentazione.

La lunghezza del contesto è espressa in token.

Le dichiarazioni IBM relative a piani, indicazioni e intenzioni sono soggette a modifiche o a ritiro senza preavviso, a esclusiva discrezione di IBM. Per maggiori dettagli, consulta la sezione Prezzi. Se non diversamente specificato nella sezione Prezzi del software, tutte le funzioni, le funzionalità e i potenziali aggiornamenti si riferiscono esclusivamente a SaaS. IBM non garantisce che funzioni e funzionalità SaaS e del software siano le stesse.

Foundation model in watsonx.ai

Scegli il modello di cui hai bisogno

Novità

Libreria di Foundation model

Storie dei clienti

Foundation Model IBM

Modelli Meta

Modelli Mistral

Foundation model di terze parti

Libreria di modelli di incorporamento

Modelli di incorporamento IBM

Modelli di incorporamento di terze parti

Risorse

Proprietà intellettuale

Note a piè di pagina