Nouveautés et modifications apportées à watsonx.ai

les mises à jour watsonx.ai peuvent inclure de nouvelles fonctionnalités et des correctifs. Les éditions sont répertoriées par ordre chronologique inverse de sorte que la dernière édition se trouve au début de la rubrique.

Vous pouvez consulter la liste des nouvelles fonctionnalités de la plateforme et de tous les services sur le site What's new in IBM Software Hub.

IBM watsonx™ Version 2.3.1

Une nouvelle version de watsonx.ai a été publiée en février 2026.

Cette version comprend les changements suivants :

De nouvelles fonctionnalités
Cette version de " watsonx.ai comprend les fonctionnalités suivantes :
Nouveaux modèles de fondations dans watsonx.ai

Vous pouvez désormais utiliser les modèles de base suivants pour l'inférence à partir de Prompt Lab et de l'API :

  • ibm-defense-4-0-small
  • devstral-small-2512
  • devstral-medium-2512
  • ministral-14b-instruct-2512
  • mistral-large-2512

Pour plus de détails, voir Modèles de fondations pris en charge.

Utilisez du texte, de l'audio, de la vidéo et des images comme contexte lorsque vous déduisez un modèle de base personnalisé
Vous pouvez désormais ajouter du texte, de l'audio, de la vidéo et des images comme contexte lorsque vous effectuez une inférence sur un modèle de base personnalisé doté de ces capacités.

Pour plus d'informations, consultez la section Inférence à partir de modèles de base personnalisés déployés.

Utilisez l'entrée audio lorsque vous déduisez un modèle de base avec l'API watsonx.ai de chat
Vous pouvez désormais ajouter des fichiers audio encodés sous forme de données binaires comme contexte lorsque vous effectuez une inférence sur des modèles multimodaux de base installés dans votre cluster qui prennent en charge l'entrée audio avec l'API watsonx.ai chat.

Pour plus d'informations, consultez Ajouter une fonction de chat génératif à vos applications avec l'API de chat.

Transmettre les paramètres du modèle lors de l'appel des services RAG AutoAI déployés
Vous pouvez désormais inclure les paramètres temperature top_p et lorsque vous invoquez des services RAG AutoAI déployés. Grâce à ces paramètres supplémentaires, vous disposez d'un contrôle plus flexible sur la manière dont le modèle répond à chaque requête, au lieu de vous fier uniquement au comportement par défaut. Vous pouvez ajuster le ton et le rendement du modèle sans modifier le déploiement lui-même.

Pour plus d'informations, consultez la section Enregistrer un modèle RAG en tant que service IA déployable.

Nouvelle exigence en matière de durée d'exécution dans les expériences AutoAI RAG
AutoAI RAG fonctionne désormais sur le runtime GenAI, qui remplace l'ancien runtime 24.1. Le runtime d' GenAI est compatible avec les derniers modèles de base, améliore les performances et offre un environnement plus stable pour les charges de travail RAG. Assurez-vous que le runtime GenAI est installé dans votre environnement pour pouvoir exécuter correctement les expériences et les déploiements RAG.

Pour plus de détails, consultez Automatisation d'un modèle RAG avec AutoAI.

Nouvelle exigence relative au modèle pour les expériences AutoAI RAG avec bases de connaissances SQL
Si vous disposez de modèles qui utilisent des bases de connaissances SQL dans AutoAI RAG, vous devez vous assurer que ces modèles disposent de la autoai_sql_rag fonction. AutoAI RAG utilise cette fonction pour évaluer et sélectionner correctement les modèles qui fonctionnent avec les bases de connaissances SQL pour la recherche.

Pour plus de détails, consultez les modèles de base pris en charge pour AutoAI les expériences.

Mises à jour
Les mises à jour suivantes ont été introduites dans cette version :
Utilisez NVIDIA L40S les GPU pour optimiser les modèles de base
Vous pouvez désormais utiliser NVIDIA L40S des GPU pour ajuster les modèles de base à l'aide des méthodes d'ajustement fin complet et d'ajustement fin par adaptation de rang faible ( LoRA ).
Problèmes corrigés dans cette version
Les problèmes suivants ont été corrigés dans cette version :
La mise à niveau vers IBM® Software Hub la version 5.3 échoue avec ImagePullBackOff l'erreur
  • Problème : après la mise à niveau vers la version 5.3:
    • Les ressources watsonxaiifm personnalisées (CR ibm_redis_cp ) et restent bloquées indéfiniment dans in progress l'état.
    • Tous les pods appartenant à watsonx_ai_ifm l'add-on ont ImagePullBackOff le statut.
  • Résolution : Le problème est maintenant résolu.
Problèmes signalés par les clients et corrigés dans cette version
Pour obtenir la liste des problèmes signalés par les clients et corrigés dans cette version, consultez la liste des corrections IBM Cloud Pak for Data sur le site Web d'assistance d' IBM.
Fonctions obsolètes
Les fonctionnalités suivantes ont été supprimées dans cette version :
L'API de génération watsonx.ai de texte est obsolète
Les points de terminaison « Infer text » et « Infer text event stream » de l'API de génération watsonx.ai de texte sont désormais obsolètes et seront supprimés à l'avenir. Déplacez toutes les sessions de prompt, les modèles, les carnets et les services d'IA qui utilisent l'API de génération de texte vers l'API watsonx.ai de chat.

Pour plus de détails, consultez la documentation watsonx.ai de référence de l'API.

La dépréciation de l'API de génération de texte comprend les modifications suivantes :
  • Les sessions, modèles et blocs-notes enregistrés qui utilisent l'API de génération de texte peuvent ne pas renvoyer les résultats d'inférence attendus. Vous ne pouvez pas enregistrer de nouvelles sessions d'invite ou de nouveaux modèles utilisant l'API de génération de texte en tant que ressources de projet.
  • Les fonctionnalités suivantes ne seront plus prises en charge après la suppression de l'API :
    • Évaluation des modèles de réponse rapide
    • Les modes Structuré et Libre dans le Prompt Lab. Utilisez plutôt le mode Chat.
Certains modes d'extraction de paires clé-valeur sont obsolètes dans l'API d'extraction watsonx.ai de texte
Les modes d'extraction de invoice paires utility clé-valeur et dans l'API d'extraction watsonx.ai de texte sont désormais obsolètes et seront supprimés à l'avenir.

Vous pouvez continuer à extraire du texte et des données de type paire clé-valeur à partir des factures et des factures de services publics grâce au mode generic_with_semantic d'extraction.

Pour plus de détails, consultez les modes d'extraction des paires clé-valeur.

Les champs suivants dans le paramètre API semantic_config d'extraction de texte sont également obsolètes :
  • target_image_width.
  • enable_text_hints et target_image_width sur le schemas terrain.
Pour plus de détails, consultez la documentation watsonx.ai de référence de l'API.

IBM watsonx Version 2.3.0

Une nouvelle version de watsonx.ai a été publiée en décembre 2025.

Cette version comprend les changements suivants :

De nouvelles fonctionnalités
Cette version de " watsonx.ai comprend les fonctionnalités suivantes :
Nouveaux modèles de fondations dans watsonx.ai

Vous pouvez désormais utiliser les modèles de base suivants pour l'inférence à partir de Prompt Lab et de l'API :

  • granite-4-h-tiny
  • granite-docling-258M
  • ibm-defense-4-0-micro

Pour plus de détails, voir Modèles de fondations pris en charge.

Accédez à des modèles provenant de plusieurs fournisseurs grâce à la passerelle de modèles.

Vous pouvez désormais configurer et interagir en toute sécurité avec les modèles de base de plusieurs fournisseurs grâce à la passerelle de modèles, en utilisant l'API. De plus, vous pouvez gérer la passerelle modèle grâce à l'équilibrage de charge intégré, aux politiques d'accès et aux limites de débit.

Pour plus de détails, voir Modèle de passerelle.

Capturez la signification sémantique et affinez les résultats récupérés à l'aide de modèles d'intégration et de reclassement personnalisés

Vous pouvez désormais ajouter des modèles personnalisés d'intégration et de reclassement à watsonx.ai et les utiliser pour saisir le sens sémantique et affiner les résultats récupérés.

Tous les modèles de base personnalisés utilisent désormais le vLLM serveur d'inférence

Tous les modèles de base personnalisés utilisent désormais le vLLM serveur d'inférence. Si vos modèles déployés utilisent le serveur d'inférence TGIS, vous devrez peut-être les migrer.

Pour plus d'informations, consultez la section Conditions requises pour le déploiement de modèles de base personnalisés.

Nouvelle API de classification de texte dans watsonx.ai
Vous pouvez désormais utiliser la nouvelle méthode de classification de texte dans l'API watsonx.ai REST pour classer votre document avant d'extraire le contenu textuel à utiliser dans une solution RAG.

Vous pouvez classer votre document à l'aide de l'API de classification dans l'un des nombreux types de documents courants pris en charge sans avoir à exécuter une tâche d'extraction plus longue. En prétraitant le document, vous pouvez ensuite personnaliser votre demande d'extraction de texte afin d'extraire efficacement les informations pertinentes de votre document.

Pour plus d'informations sur l'API de classification de texte et la bibliothèque de compréhension de documents, consultez Classification de texte [Classification de texte] et Compréhension de documents.

Nouvelle API transactionnelle d'index vectoriel dans watsonx.ai
Vous pouvez désormais utiliser les nouvelles méthodes API transactionnelles d'index vectoriel pour créer et gérer des ressources d'index vectoriel dans un projet.

Pour plus d'informations, consultez Créer un index vectoriel par programmation.

Utilisez l'interface utilisateur pour Synthetic Data Generator générer des données synthétiques non structurées
L'interface utilisateur permettant de créer des tâches pour générer des données synthétiques non structurées est désormais disponible pour tous. L'interface utilisateur de Synthetic Data Generator facilite la création et l'exécution des tâches en organisant tous les paramètres et les exigences relatives aux documents sources en options et champs simples.

Pour plus d'informations, consultez la section Création de tâches pour générer des données synthétiques non structurées.

Améliorations pour AutoAI les expériences RAG
Vous pouvez désormais utiliser les fonctionnalités suivantes pour AutoAI vos expériences RAG :
  • Utiliser le découpage sémantique dans AutoAI pour les expériences RAG

    Vous pouvez désormais utiliser la méthode de segmentation sémantique pour décomposer des documents dans le AutoAI cadre d'une expérience RAG. Le découpage sémantique divise les documents en fonction de leur signification, ce qui le rend particulièrement adapté aux données complexes ou non structurées.

    Pour plus d'informations, consultez la section Personnalisation des paramètres de fragmentation.

  • Utilisez les modèles API de chat dans AutoAI pour les expériences RAG

    Vous pouvez désormais utiliser les modèles API de chat dans AutoAI pour les expériences RAG, au lieu des modèles de modèles de prompt. Ces modèles doivent disposer de capacités de chat pour fonctionner dans AutoAI le cadre d'expériences RAG.

    Pour plus de détails, voir Modèles de fondations pris en charge.

  • Déployer automatiquement le modèle supérieur dans AutoAI pour les expériences RAG

    Vous pouvez désormais activer le déploiement automatique du modèle le plus performant une fois l'expérience AutoAI RAG terminée. Vous pouvez activer le déploiement automatique lorsque vous configurez l'expérience. Le déploiement automatique permet de réduire les étapes manuelles et d'automatiser davantage le flux de travail expérimental.

    Pour plus de détails, voir Création de l'expérience AutoAI RAG.

  • Utilisez plusieurs index vectoriels dans AutoAI pour les expériences RAG

    Vous pouvez désormais sélectionner jusqu'à 20 index vectoriels pour votre collection de documents dans le AutoAI cadre d'une expérience RAG. Lors de la configuration de l'expérience, lorsque vous ajoutez des sources de documents et d'évaluation, choisissez Bases de connaissances, puis sélectionnez jusqu'à 20 connexions. Vous pouvez ensuite définir les détails de chaque connexion, tels que le nom de l'index et les modèles d'intégration. L'utilisation de plusieurs index vous offre davantage de flexibilité et peut améliorer la qualité et les performances de vos expériences.

    Pour plus de détails, voir Utilisation des bases de connaissances de stockage vectoriel dans les expériences AutoAI RAG.

  • Utiliser les schémas de base de données SQL dans AutoAI pour les expériences RAG

    Vous pouvez désormais choisir un schéma de base de données SQL comme base de connaissances dans une expérience AutoAI RAG. Vous pouvez utiliser des connexions SQL telles que Db2, PostgreSQL, et MySQL. Lorsque vous utilisez des sources SQL, les paramètres de segmentation sont désactivés et seules les mesures d'exactitude des réponses sont disponibles pour l'optimisation. Avec un RAG SQL, les données structurées peuvent être récupérées directement à partir de la base de données relationnelle, ce qui peut améliorer la précision et la pertinence des réponses par rapport aux sources basées sur des documents.

    Pour plus de détails, voir Utilisation des bases de connaissances SQL dans les expériences AutoAI RAG.

Mises à jour
Les mises à jour suivantes ont été introduites dans cette version :
Nouvelles connexions de données ajoutées dans AutoAI pour les expériences RAG
Vous pouvez désormais utiliser ces connexions de données pour les collections de documents et les données de test dans AutoAI pour les expériences RAG :
  • Google Cloud Storage
  • Box
  • Dropbox
Utilisez l'API watsonx.ai de chat pour contrôler le raisonnement du modèle de base
Vous pouvez désormais configurer la capacité de raisonnement des modèles de base et spécifier le niveau de détail d'une réponse à l'aide des nouveaux paramètres de l'API watsonx.ai de chat.

Pour plus d'informations, consultez la section Ajouter une fonction de chat génératif à vos applications.

Utilisez de nouveaux types de stockage pour stocker vos documents et les résultats de l'API d'extraction de texte
Vous pouvez désormais utiliser l'API d'extraction de texte avec les documents stockés dans les magasins de données suivants :
  • Box
  • IBM watsonx.data™ SharePoint
  • IBM FileNet P8
De plus, vous pouvez stocker le résultat du processus d'extraction de texte dans un magasin Box de données.

Pour plus de détails, voir Extraction de texte.

Discutez avec des documents dans plusieurs magasins de données vectorielles à l'aide de la fonction Prompt Lab
Vous pouvez désormais sélectionner des documents stockés dans plusieurs bases de données vectorielles pour ancrer des modèles de base dans le mode chat dans Prompt Lab.

Pour plus de détails, consultez la section Discuter avec des documents et des fichiers multimédias.

Affiner les modèles de base à l'aide de méthodes d'ajustement fin efficaces en termes de paramètres dans le Tuning Studio
Vous pouvez désormais affiner les modèles de base à l'aide de méthodes de réglage efficaces en termes de paramètres, telles que l'adaptation de rang faible et le réglage quantifié de rang faible dans l'interface Tuning Studio utilisateur, en plus de l'API watsonx.ai de réglage.

Pour plus de détails, voir Tuning Studio.

Utilisez NVIDIA RTX PRO 6000 les GPU avec les modèles de base dans watsonx.ai
Vous pouvez désormais utiliser NVIDIA RTX PRO 6000 des GPU pour exécuter vos modèles de base. Les modèles suivants sont pris en charge avecNVIDIA RTX PRO 6000 les GPU :
  • granite-4-h-small
  • granite-speech-3-3-8b
  • granite-guardian-3-2-5b
  • llama-3-2-11b-vision-instruct
  • llama-guard-3-11b-vision
Problèmes corrigés dans cette version
Les problèmes suivants ont été corrigés dans cette version :
L'installation du codestral-2508 modèle de base entraîne une CrashLoopBackOff erreur
  • Problème : après l'installation du codestral-2508 modèle, l'état indique une CrashLoopBackOff erreur.
  • Résolution : Le problème est maintenant résolu.
Les modèles peuvent se charger indéfiniment après la mise à niveau vers la version 5.2.x
  • Problème : après la mise à niveau watsonxaiifm, certains modèles peuvent ne pas se charger et rester dans un état de chargement indéfini pendant l'inférence.
  • Résolution : Le problème est maintenant résolu.
Le téléchargement de fichiers volumineux dans des index vectoriels peut entraîner des délais d'attente
  • Problème : lorsque vous créez un index vectoriel, le téléchargement de fichiers volumineux supérieurs à 1GB peut entraîner des délais d'attente.
  • Résolution : Le problème est maintenant résolu.
Problèmes signalés par les clients et corrigés dans cette version
Pour obtenir la liste des problèmes signalés par les clients et corrigés dans cette version, consultez la liste des corrections IBM Cloud Pak for Data sur le site Web d'assistance d' IBM.
Fonctions obsolètes
Les fonctionnalités suivantes ont été supprimées dans cette version :
Le réglage rapide est supprimé
Vous ne pouvez plus utiliser le réglage rapide comme méthode pour régler les modèles de base. Tous les déploiements de réglage rapide existants seront supprimés lorsque vous mettrez à niveau le watsonx.ai service.

Pour plus d'informations sur les autres méthodes de réglage, consultez la section Méthodes de réglage du modèle de base.

Modèles de base obsolètes et supprimés
Le modèle de base suivant est désormais obsolète et sera supprimé dans une prochaine version :
  • pixtral-12b
Les modèles de base suivants sont désormais supprimés du service watsonx.ai :
  • codestral-22b
  • flan-t5-xl-3b
  • granite-13b-instruct-v2
  • jais-13b-chat
  • llama-4-scout-17b-16e-instruct
  • llama-3-405b-instruct
  • llama-2-13b-chat
  • mistral-large
  • mistral-small-24b-instruct-2501
  • mistral-small-instruct
  • mixtral-8x7b-instruct-v01

Pour plus de détails, consultez le cycle de vie du modèle de base.