watsonx.ai Preisgestaltung

Ein integriertes KI-Entwicklerstudio aus einer Hand für die End-to-End-Entwicklung von KI-Anwendungen

Die Homepage-Demo von watsonx.ai zeigt die Benutzeroberfläche mit aufgelisteten Sandbox-Projekten und Optionen für Bereitstellungsbereiche.

watsonx.ai Preisgestaltung

Erkunden Sie die Preisstufen für unsere Trial-, Essentials- und Standard-Tarife auf IBM watsonx.ai. Informationen zu den Preisen der Modelle finden Sie in den Abschnitten „IBM Foundation Models“ und „IBM Einbettungsmodelle“ sowie in der Preisgestaltung für Foundation Models und Einbettungsmodelle von Drittanbietern.

Foundation Models von IBM

Enthält Pay-as-you-go-Preise pro Million Token und Stundensätze für das Hosting und die Bereitstellung im On-Demand-Modell.

Mehr erfahren
Einbettungsmodelle

Beinhaltet Modelle von IBM und Drittanbietern, die für 0,10 USD pro Million Token erhältlich sind.

Mehr erfahren
Foundation Models von Drittanbietern

Enthält Drittanbietermodelle von Meta, Google, DeepSeek, Mistral und anderen mit nutzungsabhängiger Preisgestaltung pro Million Token sowie stündlichen Optionen für On-Demand-Hosting und -Bereitstellung.

Mehr erfahren
Spezifische Preisgestaltung nach Anwendungsfall

Enthält eine anwendungsbezogene Preisgestaltung für maschinelles Lernen, Textextraktion und Modellanpassung mit den Paketoptionen Essential und Standard.

Mehr erfahren

Finden Sie das passende Paket für Ihren KI-Anwendungsfall

Starten Sie den watsonx Advisor, der Ihnen hilft, den richtigen Produktmix für Ihren geschäftlichen Anwendungsfall zu erstellen. Dieser schnelle Prozess bietet Ihnen Erkenntnisse in das watsonx-Portfolio und zeigt Ihnen, wie Sie damit die Time-to-Value verkürzen können.

Starten Sie den Purchase Advisor

Preisstufen (SaaS)

Kostenlos Toolbox Playground

Foundation Models: Bis zu 300.000 Token pro Monat

Werkzeuge für maschinelles Lernen: bis zu 20 Compute Usage Hours (CUH) pro Monat

Text-Extraktion: bis zu 100 Dokumente pro Monat

Jetzt kostenlosen Test starten
Essentials (Pay-as-you-go) Bereitstellung in der Produktionsumgebung Standard (nutzungsabhängige Abrechnung) Unternehmensproduktion

Playground-Benutzeroberfläche

Inferencing

Open-Source-Modelle

IBM watsonx-Modelle

Arbeitet mit Foundation Models (PromptLab)

Unterstützt Retrieval-Augmented Generation (RAG)

Arbeiten mit Agenten (AgentLab)

Generator für synthetische Daten

ML-Funktionalität**

Textextraktion**

LoRA/QLoRA – Feinabstimmung*

Kundenspezifische Foundation Models***

Model Hosting***

Bereitstellen von On-Demand-Modellen***

Support

watsonx-Community und Online-Chatbot

Basis-Support inklusive: Rund-um-die-Uhr-Zugang zu technischem Support über Fälle

Basis-Support inklusive: Rund-um-die-Uhr-Zugang zu technischem Support über Fälle

Verfügbare Optionen 

Erweiterter Support mit SLAs ab 200 USD pro Monat verfügbar

Erweiterter Support mit SLAs ab 200 USD pro Monat verfügbar

*Preise sind indikativ, können je nach Land variieren, enthalten keine anfallenden Steuern und Abgaben und unterliegen der Verfügbarkeit des Produktangebots vor Ort. 

IBM Foundation Models 

Modellname Pay As You Go Pro Million Token Modell-Hosting/On-Demand-Bereitstellung Pro Stunde Preise basierend auf der GPU-Konfiguration

granite-vision-3-2-2b1

0,10 USD 

Nicht verfügbar

granite-3-2b-instruct (v3.1)1

 

0,10 USD 

Nicht verfügbar 

granite-guardian-3-2b (v3.1)1 (veraltet)

0,10 USD 

Nicht verfügbar 

granite-guardian-3-8b (v3.1)1

0,20 USD 

Nicht verfügbar

granite-timeseries-ttm-r21

0,38 USD

Nicht verfügbar

granite-13b-instruct1 (veraltet)

0,60 USD 

Nicht verfügbar

Granite-3-8b-Instruct (v3.1)

0,20 USD

Nicht verfügbar 

granite-8b-code-instruct

0,20 USD

granite-3-2-8b-instruct

0,20 USD

granite-3-8b-base 

Nicht verfügbar 

granite-20b-code-base-sql-gen1

Nicht verfügbar

granite-20b-code-base-schema-linking1

 

Nicht verfügbar

granite-3-8b-base1

Nicht verfügbar

granite-7b-lab1

 

Nicht verfügbar

granite-8b-japanese1

Nicht verfügbar 

*Preise sind indikativ, können je nach Land variieren, enthalten keine anfallenden Steuern und Abgaben und unterliegen der Verfügbarkeit des Produktangebots vor Ort. 

Einbettungsmodelle

Alle Einbettungsmodelle kosten 0,10 USD pro Million Token. Dazu gehören Modelle von IBM (d. h. granite-embedding-107m-multilingual, granite-embedding-278m-multilingual, slate-125m-english-rtrvr-v2, slate-125m-english-rttrvr, slate-30m-english-rtrvr-v2, slate-30m-english-rtrvr ) und Modelle von Drittanbietern (d. h. all-mini-l6-v2, all-minilm-l12-v2 und multilingual-e5=large).

Foundation Models von Drittanbietern

Modellname Anbieter Pay As You Go Pro Million Token Modell-Hosting/On-Demand-Bereitstellung^ Preise basierend auf der GPU-Konfiguration

 llama-4-maverick-17b-128e-instruct-fp8

Meta

0,35 USD Token Eingabe

1,40 USD Token Ausgabe

Nicht verfügbar

llama-3-2-1b-instruct

Meta

0,10 USD

Nicht verfügbar

llama-3-2-3b-instruct

Meta

0,15 USD

Nicht verfügbar

llama-3-2-90b-vision-instruct

Meta

2,00 USD

Nicht verfügbar

llama-3-405b-instruct

Meta

5,00 USD Token Eingabe

16,00 USD Token Ausgabe

Nicht verfügbar

llama-guard-3-11b-vision

Meta

0,35 USD

Nicht verfügbar

mistral-medium-2505

Mistral AI

3,00 USD Eingabe

10,00 USD Tokens Ausgabe

Nicht verfügbar

mistral-large-22 (veraltet)

Mistral AI

3,00 USD Tokens Eingabe

10,00 USD Tokens Ausgabe

Nicht verfügbar

mistral-small-3-1-24b-instruct-25032

Mistral AI

0,10 USD Eingabe

0,30 USD Ausgabe

Nicht verfügbar

pixtral-12b2 (veraltet)

Mistral AI

0,35 USD

Nicht verfügbar

llama-3-3-70b-instruct

Meta

0,71 USD

flan-t5-xl-3b

Veraltet

Google

0,60 USD

allam-1-13b-instruct

SDAIA

1,80 USD

gpt-oss-120b

OpenAI

0,15 USD Token Eingabe

0,60 Token Ausgabe

llama-3-2-11b-vision-instruct

Meta

0,35 USD

llama-3-13b-chat (Veraltet)

 

Meta

0,0006 USD/1.000 Token für die Eingabe und Ausgabe

deepseek-r1-distill-llama-70b

DeepSeek

Nicht verfügbar

deepseek-r1-distill-llama-8b

DeepSeek

Nicht verfügbar

eurollm-1-7b-instruct

Utter-Projekt

Nicht verfügbar

eurollm-9b-instruct

Utter-Projekt

Nicht verfügbar

llama-2-70b-chat

Meta

Nicht verfügbar

llama-3-1-70b

Meta

Nicht verfügbar

llama-3-1-8b

Meta

Nicht verfügbar

llama-3-3-70b-instruct-hf

Meta

Nicht verfügbar

mistral-large-instruct-24112

Mistral AI

Nicht verfügbar

mistral-nemo-instruct-24072

Mistral AI

Nicht verfügbar

mixtral-8x7b-base2

Mistral AI

Nicht verfügbar

poro-34b-chat

LumiOpen

Nicht verfügbar 

*Preise sind indikativ, können je nach Land variieren, enthalten keine anfallenden Steuern und Abgaben und unterliegen der Verfügbarkeit des Produktangebots vor Ort. 

Funktionsspezifische Preisgestaltung

Anwendungsfall Essentials-Tarif Standard-Tarif

Modelle für maschinelles Lernen

0,52 USD/Kapazitätseinheitsstunde

0,42 USD/Kapazitätseinheitsstunde

Textextraktion3

0.038 USD/Seite

0,03 USD/Seite

LoRA-Feinabstimmung

Nicht verfügbar

NVIDIA 1 x A100 GPU: 5,88 USD/Stunde

NVIDIA 1 x H100 GPU: 13,86 USD/Stunde

Modell-Hosting/On-Demand-Bereitstellung

Nicht verfügbar

NVIDIA 1 x L40S GPU: 4,43 USD/Stunde

NVIDIA 2 x L40S GPU: 8,86 USD/Stunde

NVIDIA 1 x A100 GPU: 5,8 USD/Stunde

NVIDIA 2 x A100 GPU: 11,6 USD/Stunde

NVIDIA 4 x A100 GPU: 23,2 USD/Stunde

NVIDIA 8 x A100 GPU: 46,4 USD/Stunde

NVIDIA 1 x H100 GPU: 14,5 USD/Stunde

NVIDIA 2 x H100 GPU: 29 USD/Stunde

NVIDIA 4 x H100 GPU: 58 USD/Stunde

NVIDIA 8 x H100 GPU: 116 USD/Stunde

NVIDIA 1 x H200 GPU: 16 USD/Stunde

NVIDIA 2 x H200 GPU: 32 USD/Stunde

NVIDIA 4 x H200 GPU: 64 USD/Stunde

NVIDIA 8 x H200 GPU: 128 USD/Stunde

*Preise sind indikativ, können je nach Land variieren, enthalten keine anfallenden Steuern und Abgaben und unterliegen der Verfügbarkeit des Produktangebots vor Ort. 

Gehen Sie den nächsten Schritt

Testen Sie watsonx.ai kostenlos oder setzen Sie Ihre Entdeckungstour fort.

Jetzt kostenlosen Test starten Buchen Sie eine Live-Demo
Weitere Erkundungsmöglichkeiten Werden Sie IBM Business Partner Kontakt zur IBM Community aufnehmen Support
Fußnoten

Für die Inferenz des Foundation Models basieren die Gebühren auf einer Resource Unit (RU), die 1000 Token entspricht (einschließlich Eingabe- und Ausgabe-Token).

Bei kommerziellen Modellen von Mistral fällt eine GPU-Hostinggebühr und eine Modellzugriffsgebühr an. Weitere Informationen finden Sie in der Dokumentation.

* Preise sind indikativ, können je nach Land variieren, enthalten keine anfallenden Steuern und Abgaben und unterliegen der Verfügbarkeit des Produktangebots vor Ort.

^ Die Preise für Capacity Unit Hours hängen von der Umgebung und den verwendeten Tools innerhalb eines Abrechnungsmonats ab.

3 Sofern unter Preise für Software nicht anders angegeben, beziehen sich alle Merkmale, Funktionalitäten und möglichen Updates ausschließlich auf SaaS. IBM gibt keine Zusicherung, dass SaaS und die Software-Features und Funktionalitäten identisch sind.