Preços do watsonx.ai

Um estúdio de desenvolvimento de IA integrado e completo para o desenvolvimento de aplicações de IA de ponta a ponta

Demonstração da página inicial do watsonx.ai mostrando a IU com as opções de projetos da área de testes e espaços de implementação listados

Preços do watsonx.ai

Explore os níveis de preços dos nossos planos de avaliação, essencial e padrão no IBM watsonx.ai. Para informações sobre preços de modelos, explore a seção de modelos de base e de embedding da IBM, bem como os preços de modelos de base e de embedding de terceiros.

Modelos de base da IBM

Inclui cobrança por uso com preço por milhão de tokens e taxas por hora para hospedagem e implementação sob demanda de modelos.

Saiba mais
Modelos de embedding

Inclui modelos da IBM e de terceiros disponíveis por USD 0,10 por milhão de tokens.

Saiba mais
Modelos de base de terceiros

Inclui modelos de terceiros da Meta, Google, DeepSeek, Mistral e outros, com cobrança por uso por milhão de tokens e opções por hora para hospedagem e implementação sob demanda.

Saiba mais
Preços específicos para casos de uso

Inclui preços baseados no caso de uso para aprendizado de máquina, extração de texto e personalização de modelos, com opções de pacotes Essential e Standard.

Saiba mais
Encontre o pacote certo para o seu caso de uso de IA
Inicie o assistente do watsonx para ajudar você a criar a combinação de produtos certa para seu caso de uso. Esse processo rápido fornece insights sobre o portfólio do watsonx e como ele pode acelerar o time to value.
Iniciar assistente de compra

Níveis de precificação (SaaS)

Gratuitamente. Ambiente de testes da caixa de ferramentas

Modelos de base: até 300.000 tokens por mês

Ferramentas de aprendizado de máquina: até 20 horas de uso de computação (CUH) por mês

Extração de texto: até 100 documentos por mês

Comece sua avaliação sem custo
Essentials (Pré-pago) Implementações da produção Standard (Pré-pago) Enterprise production

IU do ambiente de testes

Inferência

Modelos de software livre

Modelos IBM watsonx

Trabalhar com modelos de base (PromptLab)

Oferece suporte à geração aumentada de recuperação (RAG)

Trabalho com agentes (AgentLab)

Gerador de dados sintéticos

Funcionalidade de ML**

Extração de texto**

Ajuste fino de LoRA/QLoRA*

Modelos de base personalizados***

Hospedagem de modelos***

Modelos de implementação sob demanda***

Suporte

comunidade watsonx e chatbot on-line

Suporte básico incluído: acesso 24 horas por dia, 7 dias por semana ao suporte técnico por meio de casos

Suporte básico incluído: acesso 24 horas por dia, 7 dias por semana ao suporte técnico por meio de casos

Opções disponíveis 

Advanced Support com SLAs disponíveis a partir de USD 200 por mês

Advanced Support com SLAs disponíveis a partir de USD 200 por mês

*Os preços apresentados são indicativos, podem variar de acordo com o país, excluem impostos e taxas aplicáveis e estão sujeitos à disponibilidade de ofertas do produto em uma localidade. 

Modelos de Base da IBM 

Nome do modelo Modelo pré-pago Por milhão de tokens Hospedagem de modelo/Implementação sob demanda Por hora Preços baseados na configuração da GPU

granite-vision-3-2-2b1

USD 0,10 

Não disponível

granite-3-2b-instruct (v3.1)1

 

USD 0,10 

Não disponível 

granite-guardian-3-2b (v3.1)1 (descontinuado)

USD 0,10 

Não disponível 

granite-guardian-3-8b (v3.1)1

USD 0,20 

Não disponível

granite-timeseries-ttm-r21

USD 0,38

Não disponível

granite-13b-instruct1 (descontinuado)

USD 0,60 

Não disponível

granite-3-8b-instruct (v3.1)

USD 0,20

Não disponível 

granite-8b-code-instruct

USD 0,20

granite-3-2-8b-instruct

USD 0,20

granite-3-1-8b-base 

Não disponível 

granite-20b-code-base-sql-gen1

Não disponível

granite-20b-code-base-schema-linking1

 

Não disponível

granite-3-8b-base1

Não disponível

granite-7b-lab1

 

Não disponível

granite-8b-japanese1

Não disponível 

*Os preços apresentados são indicativos, podem variar de acordo com o país, excluem impostos e taxas aplicáveis e estão sujeitos à disponibilidade de ofertas do produto em uma localidade. 

Modelos de embedding

Todos os modelos de embedding custam USD 0,10 por milhão de tokens. Isso inclui modelos IBM ( - granite-embedding-107m-multilingual, granite-embedding-278m-multilingual, slate-125m-english-rtrvr-v2, slate-125m-english-rttrvr, slate-30m-english-rtrvr-v2, slate-30m-english-rtrvr ) e modelos de terceiros ( - all-mini-l6-v2, all-minilm-l12-v2 e multilingual-e5=large).

Modelos de base de terceiros

Nome do modelo Fornecedor Modelo pré-pago Por milhão de tokens Hospedagem de modelo/Implementação sob demanda Preços baseados na configuração da GPU

 llama-4-maverick-17b-128e-instruct-fp8

Meta

Entrada: USD 0,35 por tokens

Saída: USD 1,40 por tokens

Não disponível

llama-3-2-1b-instruct

Meta

USD 0,10

Não disponível

llama-3-2-3b-instruct

Meta

USD 0,15

Não disponível

llama-3-2-90b-vision-instruct

Meta

USD 2,00

Não disponível

llama-3-405b-instruct

Meta

Entrada: USD 5,00 por tokens

Saída: USD 16,00 por tokens

Não disponível

llama-guard-3-11b-vision

Meta

USD 0,35

Não disponível

mistral-medium-2505

IA Mistral

Entrada: USD 3,00 por tokens

Saída: USD 10,00 por tokens

Não disponível

mistral-large-22 (descontinuado)

IA Mistral

Entrada: USD 3,00 por tokens

Saída: USD 10,00 por tokens

Não disponível

mistral-small-3-1-24b-instruct-25032

IA Mistral

Entrada: USD 0,10

Saída: USD 0,30

Não disponível

pixtral-12b2 (descontinuado)

IA Mistral

USD 0,35

Não disponível

llama-3-3-70b-instruct

Meta

USD 0,71

flan-t5-xl-3b

Descontinuado

Google

USD 0,60

allam-1-13b-instruct

SDAIA

USD 1,80

gpt-oss-120b

OpenAI

Entrada: USD 0,15 por tokens

Saída: USD 0,60 por tokens

llama-3-2-11b-vision-instruct

Meta

USD 0,35

llama-3-13b-chat (descontinuado)

 

Meta

USD 0,0006 por 1.000 tokens (para entrada e saída)

deepseek-r1-distill-llama-70b

DeepSeek

Não disponível

deepseek-r1-distill-llama-8b

DeepSeek

Não disponível

eurollm-1-7b-instruct

Utter Project

Não disponível

eurollm-9b-instruct

Utter Project

Não disponível

llama-2-70b-chat

Meta

Não disponível

llama-3-1-70b

Meta

Não disponível

llama-3-1-8b

Meta

Não disponível

llama-3-3-70b-instruct-hf

Meta

Não disponível

mistral-large-instruct-24112

IA Mistral

Não disponível

mistral-nemo-instruct-24072

IA Mistral

Não disponível

mixtral-8x7b-base2

IA Mistral

Não disponível

poro-34b-chat

LumiOpen

Não disponível 

*Os preços apresentados são indicativos, podem variar de acordo com o país, excluem impostos e taxas aplicáveis e estão sujeitos à disponibilidade de ofertas do produto em uma localidade. 

Preços específicos por recurso

Caso de uso Plano Essentials Plano Standard

Modelos de aprendizado de máquina

0,52 USD/Unidade de capacidade-hora

0,42 USD/Unidade de capacidade-Hora

Extração de texto3

USD 0,038 /Página

0,03 USD/página

Ajuste fino com LoRA

Não disponível

NVIDIA 1 x A100 GPU: 5,88 USD / Hora

NVIDIA 1 x H100 GPU: 13,86 USD / Hora

Hospedagem de modelo/Implementação sob demanda

Não disponível

NVIDIA 1 x L40S GPU: 4,43 USD / Hora

NVIDIA 2 x L40S GPU: 8,86 USD / Hora

NVIDIA 1 x A100 GPU: 5,80 USD / Hora

NVIDIA 2 x A100 GPU: 11,60 USD / Hora

NVIDIA 4 x A100 GPU: 23,20 USD / Hora

NVIDIA 8 x A100 GPU: 46,40 USD / Hora

NVIDIA 1 x H100 GPU: 14,50 USD / Hora

NVIDIA 2 x H100 GPU: 29,00 USD / Hora

NVIDIA 4 x H100 GPU: 58,00 USD / Hora

NVIDIA 8 x H100 GPU: 116,00 USD / Hora

NVIDIA 1 x H200 GPU: 16 USD / Hora

NVIDIA 2 x H200 GPU: 32,00 USD / Hora

NVIDIA 4 x H200 GPU: 64,00 USD / Hora

NVIDIA 8 x H200 GPU: 128,00 USD / Hora

*Os preços apresentados são indicativos, podem variar de acordo com o país, excluem impostos e taxas aplicáveis e estão sujeitos à disponibilidade de ofertas do produto em uma localidade. 

Dê o próximo passo

Experimente o watsonx.ai sem nenhum custo ou continue sua jornada de descoberta.

  1. Comece sua avaliação sem custo
  2. Agende uma demonstração em tempo real
Notas de rodapé

Na inferência do modelo de base, as cobranças baseiam-se em uma métrica de unidade de recurso (RU) equivalente a mil tokens (incluindo tokens de entrada e saída). 

Os modelos comerciais do Mistral têm uma taxa de hospedagem de GPU e uma taxa de acesso ao modelo. Para mais informações, veja a documentação.

* Os preços apresentados são indicativos, podem variar de acordo com o país, excluem impostos e taxas aplicáveis e estão sujeitos à disponibilidade de oferta do produto em uma localidade.

^ Os preços por hora de unidade de capacidade dependem do ambiente e das ferramentas utilizadas em um mês de faturamento.

3 A menos que esteja especificado em contrário em Preços do software, todas as funcionalidades, recursos e possíveis atualizações referem-se exclusivamente ao SaaS. A IBM não afirma que as funcionalidades e os recursos do SaaS e do software serão iguais.