O que há de novo e mudado no watsonx.ai ?.
as atualizações watsonx.ai podem incluir novos recursos e correções. As liberações são listadas em ordem cronológica reversa para que a liberação mais recente esteja no início do tópico
Você pode ver uma lista dos novos recursos da plataforma e de todos os serviços em O que há de novo em IBM Software Hub.
IBM watsonx™ Versão 2.3.1
Uma nova versão do watsonx.ai foi lançada em fevereiro de 2026.
Esta versão inclui as seguintes alterações:
- Novas funcionalidades
- Esta versão do " watsonx.ai inclui os seguintes recursos:
- Novos modelos de fundação em watsonx.ai
Agora você pode usar os seguintes modelos básicos para fazer inferências no site Prompt Lab e na API:
ibm-defense-4-0-smalldevstral-small-2512devstral-medium-2512ministral-14b-instruct-2512mistral-large-2512
Para obter detalhes, consulte Modelos de fundação compatíveis.
- Use texto, áudio, vídeo e imagens como contexto ao inferir um modelo básico personalizado
- Agora você pode adicionar texto, áudio, vídeo e imagens como contexto ao inferir qualquer modelo básico personalizado que tenha esses recursos.
Para obter detalhes, consulte Inferência de modelos básicos personalizados implantados.
- Use a entrada de áudio ao inferir um modelo básico com a API de watsonx.ai chat
- Agora você pode adicionar arquivos de áudio codificados como dados binários como contexto ao inferir modelos básicos multimodais instalados em seu cluster que suportam entrada de áudio com a API watsonx.ai de chat.
Para obter detalhes, consulte Adicionando a função de chat generativo às suas aplicações com a API de chat.
- Passe os parâmetros do modelo ao invocar os serviços RAG AutoAI implantados
- Agora você pode incluir parâmetros
temperaturede modelotop_pe ao invocar serviços RAG AutoAI implantados. Com essas configurações adicionais, você tem um controle mais flexível sobre como o modelo responde a cada solicitação, em vez de depender apenas do comportamento padrão. Você pode ajustar o tom e a saída do modelo sem alterar a implantação em si.Para obter detalhes, consulte Salvando um padrão RAG como um serviço de IA implantável.
- Novo requisito de tempo de execução em experimentos AutoAI RAG
- AutoAI O RAG agora é executado no ambiente de execução GenAI, substituindo o ambiente de execução anterior 24.1. O tempo de execução do GenAI é compatível com os modelos básicos mais recentes, melhora o desempenho e oferece um ambiente mais estável para cargas de trabalho RAG. Certifique-se de que o runtime do GenAI esteja instalado em seu ambiente para executar com sucesso os experimentos e as implantações do RAG.
Para obter detalhes, consulte Automatizando um padrão RAG com AutoAI.
- Novo requisito de modelo para experimentos AutoAI RAG com bases de conhecimento SQL
- Se você tiver modelos que utilizam bases de conhecimento SQL no AutoAI RAG, certifique-se de que esses modelos possuam a
autoai_sql_ragfunção. AutoAI A RAG utiliza esta função para avaliar e selecionar corretamente modelos que funcionam com bases de conhecimento SQL para recuperação.Para obter detalhes, consulte Modelos de fundação compatíveis com AutoAI experimentos.
- Atualizações
- As seguintes atualizações foram introduzidas nesta versão:
- Use NVIDIA L40S GPUs para ajustar modelos básicos
- Agora você pode usar NVIDIA L40S GPUs para ajustar modelos básicos usando os métodos de ajuste fino completo e adaptação de baixa classificação ( LoRA ).
- Problemas corrigidos nesta versão
- Os seguintes problemas foram corrigidos nesta versão:
- A atualização para IBM® Software
Hub a versão 5.3 falha com
ImagePullBackOffo erro - Problema: Após atualizar para a versão 5.3:
- Os recursos
watsonxaiifmibm_redis_cppersonalizados (CRs) permanecem presos noin progressestado indefinidamente. - Todos os pods que pertencem ao complemento
watsonx_ai_ifmtêmImagePullBackOffstatus.
- Os recursos
- Resolução: O problema foi corrigido.
- Problema: Após atualizar para a versão 5.3:
- A atualização para IBM® Software
Hub a versão 5.3 falha com
- Problemas relatados por clientes corrigidos nesta versão
- Para obter uma lista dos problemas relatados pelos clientes que foram corrigidos nesta versão, consulte a Lista de correções para IBM Cloud Pak for Data no site de suporte da IBM.
- Recursos Reprovados
- Os seguintes recursos foram descontinuados nesta versão:
- A API de geração watsonx.ai de texto está obsoleta
- Os pontos finais “Infer text” e “Infer text event stream” da API de geração watsonx.ai de texto estão agora obsoletos e serão removidos no futuro. Mova todas as sessões de prompt, modelos, cadernos e serviços de IA que usam a API de geração de texto para a API de watsonx.ai chat.
Para obter detalhes, consulte a documentação de watsonx.ai referência da API.
- Alguns modos de extração de pares chave-valor estão obsoletos na API de watsonx.ai extração de texto
- Os modos de extração de
invoicepares chave-valorutilitye na API de watsonx.ai extração de texto estão agora obsoletos e serão removidos no futuro.Você pode continuar a extrair texto e dados de pares chave-valor de faturas e contas de serviços públicos com o modo
generic_with_semanticde extração.Para obter detalhes, consulte Modos de extração de pares chave-valor.
Os seguintes campos no parâmetro da API desemantic_configextração de texto também estão obsoletos:target_image_width.enable_text_hintsetarget_image_widthno camposchemas.
IBM watsonx Versão 2.3.0
Uma nova versão do watsonx.ai foi lançada em dezembro de 2025.
Esta versão inclui as seguintes alterações:
- Novas funcionalidades
- Esta versão do " watsonx.ai inclui os seguintes recursos:
- Novos modelos de fundação em watsonx.ai
Agora você pode usar os seguintes modelos básicos para fazer inferências no site Prompt Lab e na API:
granite-4-h-tinygranite-docling-258Mibm-defense-4-0-micro
Para obter detalhes, consulte Modelos de fundação compatíveis.
- Acesse modelos em vários provedores com o gateway de modelos
Agora você pode configurar e interagir com segurança com modelos básicos de vários fornecedores usando o gateway de modelos por meio da API. Além disso, você pode gerenciar o gateway do modelo com balanceamento de carga integrado, políticas de acesso e limites de taxa.
Para obter detalhes, consulte Modelo de gateway.
- Capture o significado semântico e refine os resultados recuperados usando modelos personalizados de incorporação e reclassificação
Agora você pode adicionar modelos personalizados de incorporação e watsonx.ai reclassificação e usá-los para capturar o significado semântico e refinar os resultados recuperados.
- Todos os modelos de fundação personalizados agora utilizam o servidor de vLLM inferência
Todos os modelos de fundação personalizados agora utilizam o servidor vLLM de inferência. Se os seus modelos implantados utilizam o servidor de inferência TGIS, talvez seja necessário migrá-los.
Para obter detalhes, consulte Requisitos para implantar modelos de base personalizados.
- Nova API de classificação de texto em watsonx.ai
- Agora você pode usar o novo método de classificação de texto na API watsonx.ai REST para classificar seu documento antes de extrair o conteúdo textual para usar em uma solução RAG.
Você pode classificar seu documento com a API de classificação em um dos vários tipos de documentos comuns suportados sem executar uma tarefa de extração mais longa. Ao pré-processar o documento, você pode personalizar sua solicitação de extração de texto para extrair com eficiência os detalhes relevantes do seu documento.
Para obter detalhes sobre a API de classificação de texto e a biblioteca de compreensão de documentos, consulte Classificação de texto [Classificação de texto] e Compreensão de documentos.
- Nova API transacional de índice vetorial em watsonx.ai
- Agora você pode usar os novos métodos da API transacional do índice vetorial para criar e gerenciar ativos do índice vetorial em um projeto.
Para obter detalhes, consulte Criar um índice vetorial programaticamente.
- Use a interface do usuário para Synthetic Data Generator gerar dados sintéticos não estruturados
- A interface do usuário para criar tarefas para gerar dados sintéticos não estruturados já está disponível. A interface do usuário Synthetic Data Generator facilita a criação e a execução de tarefas, organizando todas as configurações e requisitos do documento inicial em opções e campos simples.
Para obter detalhes, consulte Criação de tarefas para gerar dados sintéticos não estruturados.
- Melhorias para AutoAI experimentos RAG
- Agora você pode usar os seguintes recursos para seus experimentos AutoAI RAG:
- Use o chunking semântico em AutoAI para experimentos RAG
Agora você pode usar o método de segmentação semântica para dividir documentos em um experimento AutoAI RAG. A segmentação semântica divide os documentos com base no significado, tornando-a adequada para dados complexos ou não estruturados.
Para obter detalhes, consulte Personalizar configurações de fragmentação.
- Use modelos de API de chat em AutoAI para experimentos RAG
Agora você pode usar modelos de API de chat em AutoAI para experimentos RAG, em vez de modelos de modelo de prompt. Esses modelos devem ter recursos de chat para funcionar em experimentos AutoAI RAG.
Para obter detalhes, consulte Modelos de fundação compatíveis.
- Padrão de implantação automática em AutoAI para experimentos RAG
Agora você pode habilitar a implantação automática do padrão de melhor desempenho após a conclusão de AutoAI um experimento RAG. Você pode ativar a implantação automática ao configurar o experimento. A implantação automática ajuda a reduzir as etapas manuais e automatiza ainda mais o fluxo de trabalho do experimento.
Para obter detalhes, consulte Criando o experimento AutoAI RAG.
- Use vários índices vetoriais em AutoAI para experimentos RAG
Agora você pode selecionar até 20 índices vetoriais para sua coleção de documentos em um experimento AutoAI RAG. Durante a configuração do experimento, ao adicionar documentos e fontes de avaliação, escolha Bases de conhecimento e selecione até 20 conexões. Em seguida, você pode definir detalhes para cada conexão, como nome do índice e modelos de incorporação. O uso de vários índices oferece mais flexibilidade e pode melhorar a qualidade e o desempenho de seus experimentos.
Para obter detalhes, consulte Usando bases de conhecimento de armazenamento vetorial em experimentos AutoAI RAG.
- Use esquemas de banco de dados SQL em AutoAI para experimentos RAG
Agora você pode escolher um esquema de banco de dados SQL como base de conhecimento em um experimento AutoAI RAG. Você pode usar conexões SQL como Db2, PostgreSQL, e MySQL. Ao usar fontes SQL, as configurações de fragmentação são desativadas e apenas as métricas de correção das respostas estão disponíveis para otimização. Com um SQL RAG, os dados estruturados podem ser recuperados diretamente do banco de dados relacional, o que pode melhorar a precisão e a relevância das respostas quando comparado com fontes baseadas em documentos.
Para obter detalhes, consulte Usando bases de conhecimento SQL em experimentos AutoAI RAG.
- Atualizações
- As seguintes atualizações foram introduzidas nesta versão:
- Novas conexões de dados adicionadas para AutoAI experimentos RAG
- Agora você pode usar essas conexões de dados para coleções de documentos e dados de teste em AutoAI experimentos RAG:
- Google Cloud Storage
- Box
- Dropbox
- Use a API watsonx.ai de chat para controlar o raciocínio do modelo básico
- Agora você pode configurar a capacidade de raciocínio dos modelos básicos e especificar a quantidade de detalhes que um modelo inclui na resposta usando novas configurações na API watsonx.ai de chat.
Para obter detalhes, consulte Adicionando a função de chat generativo às suas aplicações.
- Use novos tipos de armazenamento para guardar seus documentos e resultados da API de extração de texto
- Agora você pode usar a API de extração de texto com documentos armazenados nos seguintes repositórios de dados:
- Box
- IBM watsonx.data™ SharePoint
- IBM FileNet P8
Para obter detalhes, consulte Extração de texto.
- Converse com documentos em vários armazenamentos de dados vetoriais usando o Prompt Lab
- Agora você pode selecionar documentos armazenados em vários repositórios de dados vetoriais para fundamentar modelos básicos no modo de bate-papo no Prompt Lab.
Para obter detalhes, consulte Conversando com documentos e arquivos de mídia.
- Ajuste os modelos básicos usando métodos de ajuste fino eficientes em termos de parâmetros no Tuning Studio
- Agora você pode ajustar os modelos básicos usando métodos de ajuste eficientes em termos de parâmetros, como adaptação de baixa classificação e ajuste de adaptação de baixa classificação quantizada na Tuning Studio interface do usuário, além da API watsonx.ai de ajuste.
Para mais detalhes, consulte Tuning Studio.
- Use NVIDIA RTX PRO 6000 GPUs com modelos básicos em watsonx.ai
- Agora você pode usar NVIDIA RTX PRO 6000 GPUs para executar seus modelos básicos. Os seguintes modelos são compatíveis comNVIDIA RTX PRO 6000 GPUs:
- granite-4-h-small
- granite-speech-3-3-8b
- granite-guardian-3-2-5b
- llama-3-2-11b-vision-instruct
- llama-guard-3-11b-vision
- Problemas corrigidos nesta versão
- Os seguintes problemas foram corrigidos nesta versão:
- A instalação do modelo codestral-2508
de fundação resulta em um
CrashLoopBackOfferro - Problema: Após instalar o codestral-2508
modelo, o status indica um
CrashLoopBackOfferro. - Resolução: O problema foi corrigido.
- Problema: Após instalar o codestral-2508
modelo, o status indica um
- Os modelos podem demorar indefinidamente para carregar após a atualização para a versão 5.2.x
- Problema: Após a atualização
watsonxaiifm, alguns modelos podem não carregar e permanecer em um estado de carregamento indefinido durante a inferência. - Resolução: O problema foi corrigido.
- Problema: Após a atualização
- O upload de arquivos grandes em índices vetoriais pode resultar em tempos limite
- Problema: Ao criar um índice vetorial, o upload de tipos de arquivos grandes, com tamanho superior a 1GB, pode resultar em tempos limite.
- Resolução: O problema foi corrigido.
- A instalação do modelo codestral-2508
de fundação resulta em um
- Problemas relatados por clientes corrigidos nesta versão
- Para obter uma lista dos problemas relatados pelos clientes que foram corrigidos nesta versão, consulte a Lista de correções para IBM Cloud Pak for Data no site de suporte da IBM.
- Recursos Reprovados
- Os seguintes recursos foram descontinuados nesta versão:
- O ajuste rápido foi removido
- Você não pode mais usar o ajuste rápido como método para ajustar modelos básicos. Todas as implantações de ajuste rápido existentes serão removidas quando você atualizar o watsonx.ai serviço.
Para obter detalhes sobre métodos alternativos de ajuste, consulte Métodos de ajuste do modelo básico.
- Modelos básicos obsoletos e removidos
- O seguinte modelo básico está agora obsoleto e será removido em uma versão futura:
pixtral-12b
codestral-22bflan-t5-xl-3bgranite-13b-instruct-v2jais-13b-chatllama-4-scout-17b-16e-instructllama-3-405b-instructllama-2-13b-chatmistral-largemistral-small-24b-instruct-2501mistral-small-instructmixtral-8x7b-instruct-v01
Para obter detalhes, consulte Ciclo de vida do modelo da Fundação.