O que há de novo e mudado no watsonx.ai ?.

as atualizações watsonx.ai podem incluir novos recursos e correções. As liberações são listadas em ordem cronológica reversa para que a liberação mais recente esteja no início do tópico

Você pode ver uma lista dos novos recursos da plataforma e de todos os serviços em O que há de novo em IBM Software Hub.

IBM watsonx™ Versão 2.3.1

Uma nova versão do watsonx.ai foi lançada em fevereiro de 2026.

Esta versão inclui as seguintes alterações:

Novas funcionalidades
Esta versão do " watsonx.ai inclui os seguintes recursos:
Novos modelos de fundação em watsonx.ai

Agora você pode usar os seguintes modelos básicos para fazer inferências no site Prompt Lab e na API:

  • ibm-defense-4-0-small
  • devstral-small-2512
  • devstral-medium-2512
  • ministral-14b-instruct-2512
  • mistral-large-2512

Para obter detalhes, consulte Modelos de fundação compatíveis.

Use texto, áudio, vídeo e imagens como contexto ao inferir um modelo básico personalizado
Agora você pode adicionar texto, áudio, vídeo e imagens como contexto ao inferir qualquer modelo básico personalizado que tenha esses recursos.

Para obter detalhes, consulte Inferência de modelos básicos personalizados implantados.

Use a entrada de áudio ao inferir um modelo básico com a API de watsonx.ai chat
Agora você pode adicionar arquivos de áudio codificados como dados binários como contexto ao inferir modelos básicos multimodais instalados em seu cluster que suportam entrada de áudio com a API watsonx.ai de chat.

Para obter detalhes, consulte Adicionando a função de chat generativo às suas aplicações com a API de chat.

Passe os parâmetros do modelo ao invocar os serviços RAG AutoAI implantados
Agora você pode incluir parâmetros temperature de modelo top_p e ao invocar serviços RAG AutoAI implantados. Com essas configurações adicionais, você tem um controle mais flexível sobre como o modelo responde a cada solicitação, em vez de depender apenas do comportamento padrão. Você pode ajustar o tom e a saída do modelo sem alterar a implantação em si.

Para obter detalhes, consulte Salvando um padrão RAG como um serviço de IA implantável.

Novo requisito de tempo de execução em experimentos AutoAI RAG
AutoAI O RAG agora é executado no ambiente de execução GenAI, substituindo o ambiente de execução anterior 24.1. O tempo de execução do GenAI é compatível com os modelos básicos mais recentes, melhora o desempenho e oferece um ambiente mais estável para cargas de trabalho RAG. Certifique-se de que o runtime do GenAI esteja instalado em seu ambiente para executar com sucesso os experimentos e as implantações do RAG.

Para obter detalhes, consulte Automatizando um padrão RAG com AutoAI.

Novo requisito de modelo para experimentos AutoAI RAG com bases de conhecimento SQL
Se você tiver modelos que utilizam bases de conhecimento SQL no AutoAI RAG, certifique-se de que esses modelos possuam a autoai_sql_rag função. AutoAI A RAG utiliza esta função para avaliar e selecionar corretamente modelos que funcionam com bases de conhecimento SQL para recuperação.

Para obter detalhes, consulte Modelos de fundação compatíveis com AutoAI experimentos.

Atualizações
As seguintes atualizações foram introduzidas nesta versão:
Use NVIDIA L40S GPUs para ajustar modelos básicos
Agora você pode usar NVIDIA L40S GPUs para ajustar modelos básicos usando os métodos de ajuste fino completo e adaptação de baixa classificação ( LoRA ).
Problemas corrigidos nesta versão
Os seguintes problemas foram corrigidos nesta versão:
A atualização para IBM® Software Hub a versão 5.3 falha com ImagePullBackOff o erro
  • Problema: Após atualizar para a versão 5.3:
    • Os recursos watsonxaiifmibm_redis_cp personalizados (CRs) permanecem presos no in progress estado indefinidamente.
    • Todos os pods que pertencem ao complemento watsonx_ai_ifm têm ImagePullBackOff status.
  • Resolução: O problema foi corrigido.
Problemas relatados por clientes corrigidos nesta versão
Para obter uma lista dos problemas relatados pelos clientes que foram corrigidos nesta versão, consulte a Lista de correções para IBM Cloud Pak for Data no site de suporte da IBM.
Recursos Reprovados
Os seguintes recursos foram descontinuados nesta versão:
A API de geração watsonx.ai de texto está obsoleta
Os pontos finais “Infer text” e “Infer text event stream” da API de geração watsonx.ai de texto estão agora obsoletos e serão removidos no futuro. Mova todas as sessões de prompt, modelos, cadernos e serviços de IA que usam a API de geração de texto para a API de watsonx.ai chat.

Para obter detalhes, consulte a documentação de watsonx.ai referência da API.

A descontinuação da API de geração de texto inclui as seguintes alterações:
  • Sessões de prompt, modelos e cadernos salvos que utilizam a API de geração de texto podem não retornar resultados de inferência conforme o esperado. Você não pode salvar novas sessões de prompt ou modelos que usam a API de geração de texto como ativos do projeto.
  • Os seguintes recursos não serão suportados após a remoção da API:
    • Avaliação de modelos de prompt
    • Os modos Estruturado e Livre no Prompt Lab. Use o modo Chat em vez disso.
Alguns modos de extração de pares chave-valor estão obsoletos na API de watsonx.ai extração de texto
Os modos de extração de invoice pares chave-valor utility e na API de watsonx.ai extração de texto estão agora obsoletos e serão removidos no futuro.

Você pode continuar a extrair texto e dados de pares chave-valor de faturas e contas de serviços públicos com o modo generic_with_semantic de extração.

Para obter detalhes, consulte Modos de extração de pares chave-valor.

Os seguintes campos no parâmetro da API de semantic_config extração de texto também estão obsoletos:
  • target_image_width.
  • enable_text_hints e target_image_width no campo schemas .
Para obter detalhes, consulte a documentação de watsonx.ai referência da API.

IBM watsonx Versão 2.3.0

Uma nova versão do watsonx.ai foi lançada em dezembro de 2025.

Esta versão inclui as seguintes alterações:

Novas funcionalidades
Esta versão do " watsonx.ai inclui os seguintes recursos:
Novos modelos de fundação em watsonx.ai

Agora você pode usar os seguintes modelos básicos para fazer inferências no site Prompt Lab e na API:

  • granite-4-h-tiny
  • granite-docling-258M
  • ibm-defense-4-0-micro

Para obter detalhes, consulte Modelos de fundação compatíveis.

Acesse modelos em vários provedores com o gateway de modelos

Agora você pode configurar e interagir com segurança com modelos básicos de vários fornecedores usando o gateway de modelos por meio da API. Além disso, você pode gerenciar o gateway do modelo com balanceamento de carga integrado, políticas de acesso e limites de taxa.

Para obter detalhes, consulte Modelo de gateway.

Capture o significado semântico e refine os resultados recuperados usando modelos personalizados de incorporação e reclassificação

Agora você pode adicionar modelos personalizados de incorporação e watsonx.ai reclassificação e usá-los para capturar o significado semântico e refinar os resultados recuperados.

Todos os modelos de fundação personalizados agora utilizam o servidor de vLLM inferência

Todos os modelos de fundação personalizados agora utilizam o servidor vLLM de inferência. Se os seus modelos implantados utilizam o servidor de inferência TGIS, talvez seja necessário migrá-los.

Para obter detalhes, consulte Requisitos para implantar modelos de base personalizados.

Nova API de classificação de texto em watsonx.ai
Agora você pode usar o novo método de classificação de texto na API watsonx.ai REST para classificar seu documento antes de extrair o conteúdo textual para usar em uma solução RAG.

Você pode classificar seu documento com a API de classificação em um dos vários tipos de documentos comuns suportados sem executar uma tarefa de extração mais longa. Ao pré-processar o documento, você pode personalizar sua solicitação de extração de texto para extrair com eficiência os detalhes relevantes do seu documento.

Para obter detalhes sobre a API de classificação de texto e a biblioteca de compreensão de documentos, consulte Classificação de texto [Classificação de texto] e Compreensão de documentos.

Nova API transacional de índice vetorial em watsonx.ai
Agora você pode usar os novos métodos da API transacional do índice vetorial para criar e gerenciar ativos do índice vetorial em um projeto.

Para obter detalhes, consulte Criar um índice vetorial programaticamente.

Use a interface do usuário para Synthetic Data Generator gerar dados sintéticos não estruturados
A interface do usuário para criar tarefas para gerar dados sintéticos não estruturados já está disponível. A interface do usuário Synthetic Data Generator facilita a criação e a execução de tarefas, organizando todas as configurações e requisitos do documento inicial em opções e campos simples.

Para obter detalhes, consulte Criação de tarefas para gerar dados sintéticos não estruturados.

Melhorias para AutoAI experimentos RAG
Agora você pode usar os seguintes recursos para seus experimentos AutoAI RAG:
  • Use o chunking semântico em AutoAI para experimentos RAG

    Agora você pode usar o método de segmentação semântica para dividir documentos em um experimento AutoAI RAG. A segmentação semântica divide os documentos com base no significado, tornando-a adequada para dados complexos ou não estruturados.

    Para obter detalhes, consulte Personalizar configurações de fragmentação.

  • Use modelos de API de chat em AutoAI para experimentos RAG

    Agora você pode usar modelos de API de chat em AutoAI para experimentos RAG, em vez de modelos de modelo de prompt. Esses modelos devem ter recursos de chat para funcionar em experimentos AutoAI RAG.

    Para obter detalhes, consulte Modelos de fundação compatíveis.

  • Padrão de implantação automática em AutoAI para experimentos RAG

    Agora você pode habilitar a implantação automática do padrão de melhor desempenho após a conclusão de AutoAI um experimento RAG. Você pode ativar a implantação automática ao configurar o experimento. A implantação automática ajuda a reduzir as etapas manuais e automatiza ainda mais o fluxo de trabalho do experimento.

    Para obter detalhes, consulte Criando o experimento AutoAI RAG.

  • Use vários índices vetoriais em AutoAI para experimentos RAG

    Agora você pode selecionar até 20 índices vetoriais para sua coleção de documentos em um experimento AutoAI RAG. Durante a configuração do experimento, ao adicionar documentos e fontes de avaliação, escolha Bases de conhecimento e selecione até 20 conexões. Em seguida, você pode definir detalhes para cada conexão, como nome do índice e modelos de incorporação. O uso de vários índices oferece mais flexibilidade e pode melhorar a qualidade e o desempenho de seus experimentos.

    Para obter detalhes, consulte Usando bases de conhecimento de armazenamento vetorial em experimentos AutoAI RAG.

  • Use esquemas de banco de dados SQL em AutoAI para experimentos RAG

    Agora você pode escolher um esquema de banco de dados SQL como base de conhecimento em um experimento AutoAI RAG. Você pode usar conexões SQL como Db2, PostgreSQL, e MySQL. Ao usar fontes SQL, as configurações de fragmentação são desativadas e apenas as métricas de correção das respostas estão disponíveis para otimização. Com um SQL RAG, os dados estruturados podem ser recuperados diretamente do banco de dados relacional, o que pode melhorar a precisão e a relevância das respostas quando comparado com fontes baseadas em documentos.

    Para obter detalhes, consulte Usando bases de conhecimento SQL em experimentos AutoAI RAG.

Atualizações
As seguintes atualizações foram introduzidas nesta versão:
Novas conexões de dados adicionadas para AutoAI experimentos RAG
Agora você pode usar essas conexões de dados para coleções de documentos e dados de teste em AutoAI experimentos RAG:
  • Google Cloud Storage
  • Box
  • Dropbox
Use a API watsonx.ai de chat para controlar o raciocínio do modelo básico
Agora você pode configurar a capacidade de raciocínio dos modelos básicos e especificar a quantidade de detalhes que um modelo inclui na resposta usando novas configurações na API watsonx.ai de chat.

Para obter detalhes, consulte Adicionando a função de chat generativo às suas aplicações.

Use novos tipos de armazenamento para guardar seus documentos e resultados da API de extração de texto
Agora você pode usar a API de extração de texto com documentos armazenados nos seguintes repositórios de dados:
  • Box
  • IBM watsonx.data™ SharePoint
  • IBM FileNet P8
Além disso, você pode armazenar a saída do processo de extração de texto em um Box armazenamento de dados.

Para obter detalhes, consulte Extração de texto.

Converse com documentos em vários armazenamentos de dados vetoriais usando o Prompt Lab
Agora você pode selecionar documentos armazenados em vários repositórios de dados vetoriais para fundamentar modelos básicos no modo de bate-papo no Prompt Lab.

Para obter detalhes, consulte Conversando com documentos e arquivos de mídia.

Ajuste os modelos básicos usando métodos de ajuste fino eficientes em termos de parâmetros no Tuning Studio
Agora você pode ajustar os modelos básicos usando métodos de ajuste eficientes em termos de parâmetros, como adaptação de baixa classificação e ajuste de adaptação de baixa classificação quantizada na Tuning Studio interface do usuário, além da API watsonx.ai de ajuste.

Para mais detalhes, consulte Tuning Studio.

Use NVIDIA RTX PRO 6000 GPUs com modelos básicos em watsonx.ai
Agora você pode usar NVIDIA RTX PRO 6000 GPUs para executar seus modelos básicos. Os seguintes modelos são compatíveis comNVIDIA RTX PRO 6000 GPUs:
  • granite-4-h-small
  • granite-speech-3-3-8b
  • granite-guardian-3-2-5b
  • llama-3-2-11b-vision-instruct
  • llama-guard-3-11b-vision
Problemas corrigidos nesta versão
Os seguintes problemas foram corrigidos nesta versão:
A instalação do modelo codestral-2508 de fundação resulta em um CrashLoopBackOff erro
  • Problema: Após instalar o codestral-2508 modelo, o status indica um CrashLoopBackOff erro.
  • Resolução: O problema foi corrigido.
Os modelos podem demorar indefinidamente para carregar após a atualização para a versão 5.2.x
  • Problema: Após a atualização watsonxaiifm, alguns modelos podem não carregar e permanecer em um estado de carregamento indefinido durante a inferência.
  • Resolução: O problema foi corrigido.
O upload de arquivos grandes em índices vetoriais pode resultar em tempos limite
  • Problema: Ao criar um índice vetorial, o upload de tipos de arquivos grandes, com tamanho superior a 1GB, pode resultar em tempos limite.
  • Resolução: O problema foi corrigido.
Problemas relatados por clientes corrigidos nesta versão
Para obter uma lista dos problemas relatados pelos clientes que foram corrigidos nesta versão, consulte a Lista de correções para IBM Cloud Pak for Data no site de suporte da IBM.
Recursos Reprovados
Os seguintes recursos foram descontinuados nesta versão:
O ajuste rápido foi removido
Você não pode mais usar o ajuste rápido como método para ajustar modelos básicos. Todas as implantações de ajuste rápido existentes serão removidas quando você atualizar o watsonx.ai serviço.

Para obter detalhes sobre métodos alternativos de ajuste, consulte Métodos de ajuste do modelo básico.

Modelos básicos obsoletos e removidos
O seguinte modelo básico está agora obsoleto e será removido em uma versão futura:
  • pixtral-12b
Os seguintes modelos básicos foram removidos do serviço watsonx.ai :
  • codestral-22b
  • flan-t5-xl-3b
  • granite-13b-instruct-v2
  • jais-13b-chat
  • llama-4-scout-17b-16e-instruct
  • llama-3-405b-instruct
  • llama-2-13b-chat
  • mistral-large
  • mistral-small-24b-instruct-2501
  • mistral-small-instruct
  • mixtral-8x7b-instruct-v01

Para obter detalhes, consulte Ciclo de vida do modelo da Fundação.