IBM watsonx.ai | Preços

Preços do watsonx.ai

Explore os níveis de preços dos nossos planos de avaliação, essencial e padrão no IBM watsonx.ai. Para informações sobre preços de modelos, explore a seção de modelos de base e de embedding da IBM, bem como os preços de modelos de base e de embedding de terceiros.

Modelos de base da IBM

Inclui cobrança por uso com preço por milhão de tokens e taxas por hora para hospedagem e implementação sob demanda de modelos.

Saiba mais

Modelos de embedding

Inclui modelos da IBM e de terceiros disponíveis por USD 0,10 por milhão de tokens.

Saiba mais

Modelos de base de terceiros

Inclui modelos de terceiros da Meta, Google, DeepSeek, Mistral e outros, com cobrança por uso por milhão de tokens e opções por hora para hospedagem e implementação sob demanda.

Saiba mais

Preços específicos para casos de uso

Inclui preços baseados no caso de uso para aprendizado de máquina, extração de texto e personalização de modelos, com opções de pacotes Essential e Standard.

Saiba mais

Encontre o pacote certo para o seu caso de uso de IA

Inicie o assistente do watsonx para ajudar você a criar a combinação de produtos certa para seu caso de uso. Esse processo rápido fornece insights sobre o portfólio do watsonx e como ele pode acelerar o time to value.

Iniciar assistente de compra

Níveis de precificação (SaaS)

Gratuitamente.

Ambiente de testes da caixa de ferramentas

Modelos de base: até 300.000 tokens por mês

Ferramentas de aprendizado de máquina: até 20 horas de uso de computação (CUH) por mês

Extração de texto: até 100 documentos por mês

Comece sua avaliação sem custo

Essentials (Pré-pago)

Implementações da produção

A partir de USD 0/mês^*

Detalhamento do preço do modelo^***

Detalhamento de preços por recurso^**

Standard (Pré-pago)

Enterprise production

A partir de USD 1050/mês^*

Detalhamento do preço do modelo***

Detalhamento de preços por recurso**

IU do ambiente de testes

Inferência

Modelos de software livre

Modelos IBM watsonx

Trabalhar com modelos de base (PromptLab)

Oferece suporte à geração aumentada de recuperação (RAG)

Trabalho com agentes (AgentLab)

Gerador de dados sintéticos

Funcionalidade de ML^**

Extração de texto^**

Ajuste fino de LoRA/QLoRA^*

Modelos de base personalizados^***

Hospedagem de modelos^***

Modelos de implementação sob demanda^***

Suporte

comunidade watsonx e chatbot on-line

Suporte básico incluído: acesso 24 horas por dia, 7 dias por semana ao suporte técnico por meio de casos

Opções disponíveis

Advanced Support com SLAs disponíveis a partir de USD 200 por mês

*Os preços apresentados são indicativos, podem variar de acordo com o país, excluem impostos e taxas aplicáveis e estão sujeitos à disponibilidade de ofertas do produto em uma localidade.

Modelos de Base da IBM

Nome do modelo

Modelo pré-pago

Por milhão de tokens

Hospedagem de modelo/Implementação sob demanda

Por hora

Preços baseados na configuração da GPU

granite-vision-3-2-2b¹

USD 0,10

Não disponível

granite-3-2b-instruct (v3.1)¹

USD 0,10

Não disponível

granite-guardian-3-2b (v3.1)¹ (descontinuado)

USD 0,10

Não disponível

granite-guardian-3-8b (v3.1)¹

USD 0,20

Não disponível

granite-timeseries-ttm-r2¹

USD 0,38

Não disponível

granite-13b-instruct¹ (descontinuado)

USD 0,60

Não disponível

granite-3-8b-instruct (v3.1)

USD 0,20

Não disponível

granite-8b-code-instruct

USD 0,20

granite-3-2-8b-instruct

USD 0,20

granite-3-1-8b-base

Não disponível

granite-20b-code-base-sql-gen¹

Não disponível

granite-20b-code-base-schema-linking¹

Não disponível

granite-3-8b-base¹

Não disponível

granite-7b-lab¹

Não disponível

granite-8b-japanese¹

Não disponível

*Os preços apresentados são indicativos, podem variar de acordo com o país, excluem impostos e taxas aplicáveis e estão sujeitos à disponibilidade de ofertas do produto em uma localidade.

Modelos de embedding

Todos os modelos de embedding custam USD 0,10 por milhão de tokens. Isso inclui modelos IBM ( - granite-embedding-107m-multilingual, granite-embedding-278m-multilingual, slate-125m-english-rtrvr-v2, slate-125m-english-rttrvr, slate-30m-english-rtrvr-v2, slate-30m-english-rtrvr ) e modelos de terceiros ( - all-mini-l6-v2, all-minilm-l12-v2 e multilingual-e5=large).

Modelos de base de terceiros

Nome do modelo

Fornecedor

Modelo pré-pago

Por milhão de tokens

Hospedagem de modelo/Implementação sob demanda

Preços baseados na configuração da GPU

llama-4-maverick-17b-128e-instruct-fp8

Meta

Entrada: USD 0,35 por tokens

Saída: USD 1,40 por tokens

Não disponível

llama-3-2-1b-instruct

Meta

USD 0,10

Não disponível

llama-3-2-3b-instruct

Meta

USD 0,15

Não disponível

llama-3-2-90b-vision-instruct

Meta

USD 2,00

Não disponível

llama-3-405b-instruct

Meta

Entrada: USD 5,00 por tokens

Saída: USD 16,00 por tokens

Não disponível

llama-guard-3-11b-vision

Meta

USD 0,35

Não disponível

mistral-medium-2505

IA Mistral

Entrada: USD 3,00 por tokens

Saída: USD 10,00 por tokens

Não disponível

mistral-large-2²(descontinuado)

IA Mistral

Entrada: USD 3,00 por tokens

Saída: USD 10,00 por tokens

Não disponível

mistral-small-3-1-24b-instruct-2503²

IA Mistral

Entrada: USD 0,10

Saída: USD 0,30

Não disponível

pixtral-12b²(descontinuado)

IA Mistral

USD 0,35

Não disponível

llama-3-3-70b-instruct

Meta

USD 0,71

flan-t5-xl-3b

Descontinuado

Google

USD 0,60

allam-1-13b-instruct

SDAIA

USD 1,80

gpt-oss-120b

OpenAI

Entrada: USD 0,15 por tokens

Saída: USD 0,60 por tokens

llama-3-2-11b-vision-instruct

Meta

USD 0,35

llama-3-13b-chat (descontinuado)

Meta

USD 0,0006 por 1.000 tokens (para entrada e saída)

deepseek-r1-distill-llama-70b

DeepSeek

Não disponível

deepseek-r1-distill-llama-8b

DeepSeek

Não disponível

eurollm-1-7b-instruct

Utter Project

Não disponível

eurollm-9b-instruct

Utter Project

Não disponível

llama-2-70b-chat

Meta

Não disponível

llama-3-1-70b

Meta

Não disponível

llama-3-1-8b

Meta

Não disponível

llama-3-3-70b-instruct-hf

Meta

Não disponível

mistral-large-instruct-2411²

IA Mistral

Não disponível

mistral-nemo-instruct-2407²

IA Mistral

Não disponível

mixtral-8x7b-base²

IA Mistral

Não disponível

poro-34b-chat

LumiOpen

Não disponível

*Os preços apresentados são indicativos, podem variar de acordo com o país, excluem impostos e taxas aplicáveis e estão sujeitos à disponibilidade de ofertas do produto em uma localidade.

Preços específicos por recurso

Caso de uso

Plano Essentials

Plano Standard

Modelos de aprendizado de máquina

0,52 USD/Unidade de capacidade-hora

0,42 USD/Unidade de capacidade-Hora

Extração de texto³

USD 0,038 /Página

0,03 USD/página

Ajuste fino com LoRA

Não disponível

NVIDIA 1 x A100 GPU: 5,88 USD / Hora

NVIDIA 1 x H100 GPU: 13,86 USD / Hora

Hospedagem de modelo/Implementação sob demanda

Não disponível

NVIDIA 1 x L40S GPU: 4,43 USD / Hora

NVIDIA 2 x L40S GPU: 8,86 USD / Hora

NVIDIA 1 x A100 GPU: 5,80 USD / Hora

NVIDIA 2 x A100 GPU: 11,60 USD / Hora

NVIDIA 4 x A100 GPU: 23,20 USD / Hora

NVIDIA 8 x A100 GPU: 46,40 USD / Hora

NVIDIA 1 x H100 GPU: 14,50 USD / Hora

NVIDIA 2 x H100 GPU: 29,00 USD / Hora

NVIDIA 4 x H100 GPU: 58,00 USD / Hora

NVIDIA 8 x H100 GPU: 116,00 USD / Hora

NVIDIA 1 x H200 GPU: 16 USD / Hora

NVIDIA 2 x H200 GPU: 32,00 USD / Hora

NVIDIA 4 x H200 GPU: 64,00 USD / Hora

NVIDIA 8 x H200 GPU: 128,00 USD / Hora

*Os preços apresentados são indicativos, podem variar de acordo com o país, excluem impostos e taxas aplicáveis e estão sujeitos à disponibilidade de ofertas do produto em uma localidade.

Dê o próximo passo

Experimente o watsonx.ai sem nenhum custo ou continue sua jornada de descoberta.

Outras maneiras de explorar

Torne-se um Parceiro de Negócios IBM

Interaja com a comunidade da IBM

Suporte

Notas de rodapé

¹Na inferência do modelo de base, as cobranças baseiam-se em uma métrica de unidade de recurso (RU) equivalente a mil tokens (incluindo tokens de entrada e saída). 

²Os modelos comerciais do Mistral têm uma taxa de hospedagem de GPU e uma taxa de acesso ao modelo. Para mais informações, veja a documentação.

^* Os preços apresentados são indicativos, podem variar de acordo com o país, excluem impostos e taxas aplicáveis e estão sujeitos à disponibilidade de oferta do produto em uma localidade.

^{^} Os preços por hora de unidade de capacidade dependem do ambiente e das ferramentas utilizadas em um mês de faturamento.

³ A menos que esteja especificado em contrário em Preços do software, todas as funcionalidades, recursos e possíveis atualizações referem-se exclusivamente ao SaaS. A IBM não afirma que as funcionalidades e os recursos do SaaS e do software serão iguais.