Preços do watsonx.ai

Um estúdio de desenvolvimento de IA integrado e completo para o desenvolvimento de aplicações de IA de ponta a ponta

Demonstração da página inicial do watsonx.ai mostrando a IU com as opções de projetos da área de testes e espaços de implementação listados

Preços do watsonx.ai

Explore os níveis de preços dos nossos planos de avaliação, essencial e padrão no IBM watsonx.ai. Para informações sobre preços de modelos, explore a seção de modelos de base e de embedding da IBM, bem como os preços de modelos de base e de embedding de terceiros.

Modelos de base da IBM

Inclui cobrança por uso com preço por milhão de tokens e taxas por hora para hospedagem e implementação sob demanda de modelos.

Saiba mais
Modelos de embedding

Inclui modelos da IBM e de terceiros disponíveis por USD 0,10 por milhão de tokens.

Saiba mais
Modelos de base de terceiros

Inclui modelos de terceiros da Meta, Google, DeepSeek, Mistral e outros, com cobrança por uso por milhão de tokens e opções por hora para hospedagem e implementação sob demanda.

Saiba mais
Preços específicos para casos de uso

Inclui preços baseados no caso de uso para aprendizado de máquina, extração de texto e personalização de modelos, com opções de pacotes Essential e Standard.

Saiba mais

Encontre o pacote certo para o seu caso de uso de IA

Inicie o assistente do watsonx para ajudar você a criar a combinação de produtos certa para seu caso de uso. Esse processo rápido fornece insights sobre o portfólio do watsonx e como ele pode acelerar o time to value.

Iniciar assistente de compra

Níveis de precificação (SaaS)

Gratuitamente. Ambiente de testes da caixa de ferramentas

Modelos de base: até 300.000 tokens por mês

Ferramentas de aprendizado de máquina: até 20 horas de uso de computação (CUH) por mês

Extração de texto: até 100 documentos por mês

Comece sua avaliação sem custo
Essentials (Pré-pago) Implementações da produção Standard (Pré-pago) Enterprise production

IU do ambiente de testes

Inferência

Modelos de software livre

Modelos IBM watsonx

Trabalhar com modelos de base (PromptLab)

Oferece suporte à geração aumentada de recuperação (RAG)

Trabalho com agentes (AgentLab)

Gerador de dados sintéticos

Funcionalidade de ML**

Extração de texto**

Ajuste fino de LoRA/QLoRA*

Modelos de base personalizados***

Hospedagem de modelos***

Modelos de implementação sob demanda***

Suporte

comunidade watsonx e chatbot on-line

Suporte básico incluído: acesso 24 horas por dia, 7 dias por semana ao suporte técnico por meio de casos

Suporte básico incluído: acesso 24 horas por dia, 7 dias por semana ao suporte técnico por meio de casos

Opções disponíveis 

Advanced Support com SLAs disponíveis a partir de USD 200 por mês

Advanced Support com SLAs disponíveis a partir de USD 200 por mês

*Os preços apresentados são indicativos, podem variar de acordo com o país, excluem impostos e taxas aplicáveis e estão sujeitos à disponibilidade de ofertas do produto em uma localidade. 

Modelos de Base da IBM 

Nome do modelo Modelo pré-pago Por milhão de tokens Hospedagem de modelo/Implementação sob demanda Por hora Preços baseados na configuração da GPU

granite-vision-3-2-2b1

USD 0,10 

Não disponível

granite-3-2b-instruct (v3.1)1

 

USD 0,10 

Não disponível 

granite-guardian-3-2b (v3.1)1 (descontinuado)

USD 0,10 

Não disponível 

granite-guardian-3-8b (v3.1)1

USD 0,20 

Não disponível

granite-timeseries-ttm-r21

USD 0,38

Não disponível

granite-13b-instruct1 (descontinuado)

USD 0,60 

Não disponível

granite-3-8b-instruct (v3.1)

USD 0,20

Não disponível 

granite-8b-code-instruct

USD 0,20

granite-3-2-8b-instruct

USD 0,20

granite-3-1-8b-base 

Não disponível 

granite-20b-code-base-sql-gen1

Não disponível

granite-20b-code-base-schema-linking1

 

Não disponível

granite-3-8b-base1

Não disponível

granite-7b-lab1

 

Não disponível

granite-8b-japanese1

Não disponível 

*Os preços apresentados são indicativos, podem variar de acordo com o país, excluem impostos e taxas aplicáveis e estão sujeitos à disponibilidade de ofertas do produto em uma localidade. 

Modelos de embedding

Todos os modelos de embedding custam USD 0,10 por milhão de tokens. Isso inclui modelos IBM ( - granite-embedding-107m-multilingual, granite-embedding-278m-multilingual, slate-125m-english-rtrvr-v2, slate-125m-english-rttrvr, slate-30m-english-rtrvr-v2, slate-30m-english-rtrvr ) e modelos de terceiros ( - all-mini-l6-v2, all-minilm-l12-v2 e multilingual-e5=large).

Modelos de base de terceiros

Nome do modelo Fornecedor Modelo pré-pago Por milhão de tokens Hospedagem de modelo/Implementação sob demanda Preços baseados na configuração da GPU

 llama-4-maverick-17b-128e-instruct-fp8

Meta

Entrada: USD 0,35 por tokens

Saída: USD 1,40 por tokens

Não disponível

llama-3-2-1b-instruct

Meta

USD 0,10

Não disponível

llama-3-2-3b-instruct

Meta

USD 0,15

Não disponível

llama-3-2-90b-vision-instruct

Meta

USD 2,00

Não disponível

llama-3-405b-instruct

Meta

Entrada: USD 5,00 por tokens

Saída: USD 16,00 por tokens

Não disponível

llama-guard-3-11b-vision

Meta

USD 0,35

Não disponível

mistral-medium-2505

IA Mistral

Entrada: USD 3,00 por tokens

Saída: USD 10,00 por tokens

Não disponível

mistral-large-22 (descontinuado)

IA Mistral

Entrada: USD 3,00 por tokens

Saída: USD 10,00 por tokens

Não disponível

mistral-small-3-1-24b-instruct-25032

IA Mistral

Entrada: USD 0,10

Saída: USD 0,30

Não disponível

pixtral-12b2 (descontinuado)

IA Mistral

USD 0,35

Não disponível

llama-3-3-70b-instruct

Meta

USD 0,71

flan-t5-xl-3b

Descontinuado

Google

USD 0,60

allam-1-13b-instruct

SDAIA

USD 1,80

gpt-oss-120b

OpenAI

Entrada: USD 0,15 por tokens

Saída: USD 0,60 por tokens

llama-3-2-11b-vision-instruct

Meta

USD 0,35

llama-3-13b-chat (descontinuado)

 

Meta

USD 0,0006 por 1.000 tokens (para entrada e saída)

deepseek-r1-distill-llama-70b

DeepSeek

Não disponível

deepseek-r1-distill-llama-8b

DeepSeek

Não disponível

eurollm-1-7b-instruct

Utter Project

Não disponível

eurollm-9b-instruct

Utter Project

Não disponível

llama-2-70b-chat

Meta

Não disponível

llama-3-1-70b

Meta

Não disponível

llama-3-1-8b

Meta

Não disponível

llama-3-3-70b-instruct-hf

Meta

Não disponível

mistral-large-instruct-24112

IA Mistral

Não disponível

mistral-nemo-instruct-24072

IA Mistral

Não disponível

mixtral-8x7b-base2

IA Mistral

Não disponível

poro-34b-chat

LumiOpen

Não disponível 

*Os preços apresentados são indicativos, podem variar de acordo com o país, excluem impostos e taxas aplicáveis e estão sujeitos à disponibilidade de ofertas do produto em uma localidade. 

Preços específicos por recurso

Caso de uso Plano Essentials Plano Standard

Modelos de aprendizado de máquina

0,52 USD/Unidade de capacidade-hora

0,42 USD/Unidade de capacidade-Hora

Extração de texto3

USD 0,038 /Página

0,03 USD/página

Ajuste fino com LoRA

Não disponível

NVIDIA 1 x A100 GPU: 5,88 USD / Hora

NVIDIA 1 x H100 GPU: 13,86 USD / Hora

Hospedagem de modelo/Implementação sob demanda

Não disponível

NVIDIA 1 x L40S GPU: 4,43 USD / Hora

NVIDIA 2 x L40S GPU: 8,86 USD / Hora

NVIDIA 1 x A100 GPU: 5,80 USD / Hora

NVIDIA 2 x A100 GPU: 11,60 USD / Hora

NVIDIA 4 x A100 GPU: 23,20 USD / Hora

NVIDIA 8 x A100 GPU: 46,40 USD / Hora

NVIDIA 1 x H100 GPU: 14,50 USD / Hora

NVIDIA 2 x H100 GPU: 29,00 USD / Hora

NVIDIA 4 x H100 GPU: 58,00 USD / Hora

NVIDIA 8 x H100 GPU: 116,00 USD / Hora

NVIDIA 1 x H200 GPU: 16 USD / Hora

NVIDIA 2 x H200 GPU: 32,00 USD / Hora

NVIDIA 4 x H200 GPU: 64,00 USD / Hora

NVIDIA 8 x H200 GPU: 128,00 USD / Hora

*Os preços apresentados são indicativos, podem variar de acordo com o país, excluem impostos e taxas aplicáveis e estão sujeitos à disponibilidade de ofertas do produto em uma localidade. 

Dê o próximo passo

Experimente o watsonx.ai sem nenhum custo ou continue sua jornada de descoberta.

Comece sua avaliação sem custo Agende uma demonstração em tempo real
Outras maneiras de explorar Torne-se um Parceiro de Negócios IBM Interaja com a comunidade da IBM Suporte
Notas de rodapé

Na inferência do modelo de base, as cobranças baseiam-se em uma métrica de unidade de recurso (RU) equivalente a mil tokens (incluindo tokens de entrada e saída). 

Os modelos comerciais do Mistral têm uma taxa de hospedagem de GPU e uma taxa de acesso ao modelo. Para mais informações, veja a documentação.

* Os preços apresentados são indicativos, podem variar de acordo com o país, excluem impostos e taxas aplicáveis e estão sujeitos à disponibilidade de oferta do produto em uma localidade.

^ Os preços por hora de unidade de capacidade dependem do ambiente e das ferramentas utilizadas em um mês de faturamento.

3 A menos que esteja especificado em contrário em Preços do software, todas as funcionalidades, recursos e possíveis atualizações referem-se exclusivamente ao SaaS. A IBM não afirma que as funcionalidades e os recursos do SaaS e do software serão iguais.