Tarification de watsonx.ai

Un studio unique et intégré de développement d’IA pour le développement d’applications d’IA de bout en bout

Démonstration de la page d’accueil de watsonx.ai montrant l’interface utilisateur avec la liste des projets de bac à sable et les options d’espaces de déploiement

Tarification de watsonx.ai

Découvrez les niveaux de tarification de nos forfaits Trial, Essentials et Standard sur IBM watsonx.ai. Pour la tarification des modèles, découvrez la section des modèles de fondation et de vectorisation (embedding) d’IBM, ainsi que la tarification des modèles de fondation et de vectorisation tiers.

Modèles de fondation d’IBM

Comprend une tarification à l’utilisation par million de tokens et des tarifs horaires pour l’hébergement et le déploiement de modèles à la demande.

En savoir plus
Modèles de plongement

Comprend des modèles IBM et tiers pour 0,10 USD par million de tokens.

En savoir plus
Modèles de fondation tiers

Comprend des modèles tiers de Meta, Google, DeepSeek, Mistral et bien d’autres, avec une tarification à l’utilisation par million de tokens et des options de facturation horaire pour l’hébergement et le déploiement à la demande.

En savoir plus
Tarification spécifique aux cas d’utilisation

Comprend une tarification basée sur des cas d’utilisation pour le machine learning, l’extraction de texte et la personnalisation de modèles, avec les options des formules Essential et Standard.

En savoir plus

Trouvez la formule adaptée à votre cas d’utilisation de l’IA

Lancez le conseiller watsonx pour vous aider à choisir la gamme de produits adaptée à votre cas d’utilisation professionnel. Ce processus rapide vous donnera un aperçu du portefeuille watsonx et de la manière dont il peut vous aider à accélérer la création de valeur.

Lancer Purchase Advisor

Niveaux de tarification (SaaS)

Gratuit Boîte à outil (environnement de test)

Modèles de fondation : jusqu’à 300 000 tokens par mois

Outils de machine learning : jusqu’à 20 heures d’utilisation de ressources calcul (CUH) par mois

Extraction de texte : jusqu’à 100 documents par mois

Commencez votre essai gratuit
Essentials (paiement à l’utilisation) Déploiements en production Standard (paiement à l’utilisation) Production d’entreprise

À partir de 1 050 USD par mois*

Détail du prix des modèles***

Détails du prix par fonctionnalité**

Interface utilisateur (environnement de test)

Inférence

Modèles open source

Modèles IBM watsonx

Utilisation de modèles de base (PromptLab)

Prise en charge de la génération augmentée de récupération (RAG)

Utilisation d’agents (AgentLab)

Générateur de données synthétiques

Fonctionnalité de ML**

Extraction de texte**

Optimisation LoRA/QLoRA*

Modèles de fondation personnalisés***

Hébergement de modèles***

Déploiement de modèles à la demande***

Support

Communauté watsonx et chatbot en ligne

Assistance de base incluse : accès 7 jours sur 7 au support technique via des cas

Assistance de base incluse : accès 7 jours sur 7 au support technique via des cas

Options disponibles 

Assistance avancée avec SLA disponible à partir de 200 USD par mois

Assistance avancée avec SLA disponible à partir de 200 USD par mois

* Les prix mentionnés sont donnés à titre indicatif, peuvent varier selon le pays, s’entendent hors taxes et frais de douane applicables et sont soumis à la disponibilité de l’offre de produit dans le pays concerné.

Modèles de fondations IBM 

Nom de modèle Paiement à la carte Par million de tokens Hébergement de modèles/Déploiement à la demande Par heure Prix basés sur la configuration GPU

granite-vision-3-2-2b1

0,10 USD 

Non disponible

granite-3-2b-instruct (v3.1)1

 

0,10 USD 

Non disponible 

granite-guardian-3-2b (v3.1)1 (obsolète)

0,10 USD 

Non disponible 

granite-guardian-3-8b (v3.1)1

0,20 USD 

Non disponible

granite-timeseries-ttm-r21

0,38 USD

Non disponible

granite-13b-instruct1 (obsolète)

0,60 USD 

Non disponible

granite-3-8b-instruct (v3.1)

0,20 USD

Non disponible 

granite-8b-code-instruct

0,20 USD

granite-3-2-8b-instruct

0,20 USD

granite-3-1-8b-base 

Non disponible 

granite-20b-code-base-sql-gen1

Non disponible

granite-20b-code-base-schema-linking1

 

Non disponible

granite-3-8b-base1

Non disponible

granite-7b-lab1

 

Non disponible

granite-8b-japanese1

Non disponible 

* Les prix mentionnés sont donnés à titre indicatif, peuvent varier selon le pays, s’entendent hors taxes et frais de douane applicables et sont soumis à la disponibilité de l’offre de produit dans le pays concerné.

Modèles de plongement

Tous les modèles d’embedding sont à 0,10 USD par million de tokens. Sont compris les modèles IBM ( - granite-embedding-107m-multilingual, granite-embedding-278m-multilingual, slate-125m-english-rtrvr-v2, slate-125m-english-rttrvr, slate-30m-english-rtrvr-v2, slate-30m-english-rtrvr ) et les modèles tiers ( - all-mini-l6-v2, all-minilm-l12-v2, et multilingual-e5=large).

Modèles de fondation tiers

Nom de modèle Fournisseur Paiement à la carte Par million de tokens Hébergement de modèles/Déploiement à la demande^ Prix basés sur la configuration GPU

 llama-4-maverick-17b-128e-instruct-fp8

Meta

Tokens en entrée : 0,35 USD

Tokens en sortie : 1,40 USD

Non disponible

llama-3-2-1b-instruct

Meta

0,10 USD

Non disponible

llama-3-2-3b-instruct

Meta

0,15 USD

Non disponible

llama-3-2-90b-vision-instruct

Meta

2,00 USD

Non disponible

llama-3-405b-instruct

Meta

Tokens en entrée : 5,00 USD

Tokens en sortie : 16,00 USD

Non disponible

llama-guard-3-11b-vision

Meta

0,35 USD

Non disponible

mistral-medium-2505

Mistral AI

Tokens en entrée : 3,00 USD

Tokens en sortie : 10,00 USD

Non disponible

mistral-large-22 (obsolète)

Mistral AI

Tokens en entrée : 3,00 USD

Tokens en sortie : 10,00 USD

Non disponible

mistral-small-3-1-24b-instruct-25032

Mistral AI

Entrée : 0,10 USD

Sortie : 0,30 USD

Non disponible

pixtral-12b2 (obsolète)

Mistral AI

0,35 USD

Non disponible

llama-3-3-70b-instruct

Meta

0,71 USD

flan-t5-xl-3b

Obsolète

Google

0,60 USD

allam-1-13b-instruct

SDAIA

1,80 USD

gpt-oss-120b

OpenAI

Tokens en entrée : 0,15 USD

Tokens en sortie : 0,60 USD

llama-3-2-11b-vision-instruct

Meta

0,35 USD

llama-3-13b-chat (obsolète)

 

Meta

0,0006 USD/1 000 tokens en entrée et en sortie

deepseek-r1-distill-llama-70b

DeepSeek

Non disponible

deepseek-r1-distill-llama-8b

DeepSeek

Non disponible

eurollm-1-7b-instruct

Utter Project

Non disponible

eurollm-9b-instruct

Utter Project

Non disponible

llama-2-70b-chat

Meta

Non disponible

llama-3-1-70b

Meta

Non disponible

llama-3-1-8b

Meta

Non disponible

llama-3-3-70b-instruct-hf

Meta

Non disponible

mistral-large-instruct-24112

Mistral AI

Non disponible

mistral-nemo-instruct-24072

Mistral AI

Non disponible

mixtral-8x7b-base2

Mistral AI

Non disponible

poro-34b-chat

LumiOpen

Non disponible 

* Les prix mentionnés sont donnés à titre indicatif, peuvent varier selon le pays, s’entendent hors taxes et frais de douane applicables et sont soumis à la disponibilité de l’offre de produit dans le pays concerné.

Tarification par fonctionnalité

Cas d’utilisation Forfait Essentials Plan Standard

Modèles de machine learning

0,52 USD/capacité unité-heure

0,42 USD/capacité unité-heure

Extraction de texte3

0,038 USD/page

0,03 USD / Page

Optimisation LoRA

Non disponible

GPU NVIDIA 1 x A100 : 5,88 USD/heure

GPU NVIDIA 1 x H100 : 13,86 USD/heure

Hébergement de modèles/Déploiement à la demande

Non disponible

GPU NVIDIA 1 x L40S : 4,43 USD/heure

GPU NVIDIA 2 x L40S : 8,86 USD/heure

GPU NVIDIA 1 x A100 : 5,8 USD/heure

GPU NVIDIA 2 x A100 : 11,6 USD/heure

GPU NVIDIA 4 x A100 : 23,2 USD/heure

GPU NVIDIA 8 x A100 : 46,4 USD/heure

GPU NVIDIA 1 x H100 : 14,5 USD/heure

GPU NVIDIA 2 x H100 : 29 USD/heure

GPU NVIDIA 4 x H100 : 58 USD/heure

GPU NVIDIA 8 x H100 : 116 USD/heure

GPU NVIDIA 1 x H200 : 16 USD/heure

GPU NVIDIA 2 x H200 : 32 USD/heure

GPU NVIDIA 4 x H200 : 64 USD/heure

GPU NVIDIA 8 x H200 : 128 USD/heure

* Les prix mentionnés sont donnés à titre indicatif, peuvent varier selon le pays, s’entendent hors taxes et frais de douane applicables et sont soumis à la disponibilité de l’offre de produit dans le pays concerné.

Passez à l’étape suivante

Essayez watsonx.ai gratuitement, ou poursuivez votre parcours de découverte.

Commencez votre essai gratuit Réserver une démo live
Autres moyens d’information Devenez partenaire commercial IBM Connectez-vous avec la communauté IBM Support
Notes de bas de page

Pour l’inférence du modèle de fondation, les frais sont établis sur une mesure d’unité de ressources (RU) équivalente à 1 000 tokens (y compris les tokens d’entrée et de sortie). 

Pour les modèles commerciaux Mistral, des frais d’hébergement de processeur graphique et des frais d’accès sont facturés. Pour en savoir plus, consultez la documentation.

* Les prix mentionnés sont donnés à titre indicatif, peuvent varier selon le pays, s’entendent hors taxes et frais de douane applicables et sont soumis à la disponibilité du produit dans le pays concerné.^ La tarification capacité unité-heure dépend de l’environnement et des outils utilisés au cours d’un mois de facturation.

3 Sauf indication contraire spécifiée dans la tarification du logiciel, toutes les fonctionnalités, capacités et mises à jour potentielles se rapportent exclusivement au SaaS. IBM ne garantit pas que les fonctionnalités et les capacités du SaaS et du logiciel seront les mêmes.