IBM nommé leader dans le cadre de l’étude IDC Marketscape Worldwide GenAI Evaluation Technology Products 2025 Vendor Assessment

Auteurs

Maryam Ashoori

VP of Product and Engineering, watsonx.governance

IBM

Manish Bhide

Distinguished Engineer and CTO, watsonx.governance

IBM

Sahiba Pahwa

Product Marketing, watsonx.governance

IBM

IBM a été nommé leader dans le cadre de l’étude IDC MarketScape: Worldwide GenAI Evaluation Technology Products 2025 Vendor Assessment.

Nous estimons que cette reconnaissance reflète l’impact croissant et l’innovation continue d’IBM® watsonx.governance, et l’engagement d’IBM à répondre aux exigences de modernité en matière d’IA responsable, évolutif et fiable.

« Les entreprises qui disposent d’un environnement de technologies diversifiées peuvent constater qu’IBM est un fournisseur neutre. Par exemple, il n’est pas lié à un service cloud particulier. En outre, les entreprises qui apprécient l’ensemble plus large d’offres IBM adjacentes, y compris la documentation automatisée, les garde-fous et les offres de sécurité, doivent prendre en compte IBM », souligne le rapport IDC MarketScape.

Le modèle d’analyse des fournisseurs IDC MarketScape est conçu pour fournir un aperçu de la compétitivité des technologies et des fournisseurs sur un marché donné. L’étude utilise une méthodologie de notation rigoureuse basée sur des critères qualitatifs et quantitatifs qui conduit à une représentation graphique unique montrant la position de chaque fournisseur sur un marché donné. Le score de capacité mesure le produit du fournisseur, la mise sur le marché et l’exécution de l’entreprise à court terme. Le score de stratégie mesure l’alignement des stratégies des fournisseurs sur les exigences des clients sur une période de 3 à 5 ans. La part de marché des fournisseurs est représentée par la taille des icônes

Les 5 catégories de la méthodologie IDC MarketScape 

Le cadre des exigences rigoureux d’IDC MarketScape fournit une évaluation tierce objective à laquelle les entreprises peuvent se fier lorsqu’elles prennent des décisions en matière de technologies d’évaluation de modèles IA.

Le cadre des exigences prend en compte les catégories suivantes :

  1. Satisfaction des clients : des entretiens directs avec les clients ont fourni des informations sur la réussite de la mise en œuvre, le ROI et le support continu, non seulement sur les offres actuelles, mais aussi sur leur vision et la feuille de route pour relever les défis liés aux risques émergents.
  2. Fonctionnalité ou offre : le rapport évalue la neutralité, comme la facilité d’utilisation, quels que soient les outils utilisés pour les créer ou l’endroit où ils sont exécutés, ou la personnalisation en termes de tableau de bord et d’indicateurs.
  3. Innovation technologique : les fournisseurs ont été évalués en fonction de leurs capacités différenciées ou de leur offre qui apporte une valeur ajoutée notable au client.
  4. Gamme de services : le rapport a examiné les nombreuses fonctionnalités de l’évaluation de la RAG, en accordant une attention particulière à la capacité d’évaluer les agents.
  5. Portefeuille : une attention particulière a été accordée au nombre d’offres adjacentes au réglage des modèles, telles que la surveillance de la production, la gouvernance et la sécurité des modèles, et l’intégration transparente des outils d’évaluation tout au long du cycle de vie, du développement à la production.

Points forts d’IBM watsonx.governance 

Selon nous, voici les points forts d’IBM :

1. Développement et gouvernance rationalisés des modèles

IBM watsonx.governance propose une approche unifiée de la gestion du cycle de vie de l’IA, du développement au déploiement. À travers un questionnaire guidé, les utilisateurs peuvent définir les problématiques métier, aider à découvrir et à identifier les risques potentiels et à mettre au point des stratégies d’atténuation.

Ces dimensions de risque sont mappées sous la forme d’indicateurs qui peuvent être utilisés pendant le processus d’évaluation. De plus, ce processus intégré extrait automatiquement les métadonnées pendant le processus d’évaluation et les stocke dans une fiche d’information centralisée et fournit un enregistrement transparent du processus de développement d’application, y compris des informations sur le modèle, les prompts et plus encore. En intégrant la technologie d’évaluation dans ce cycle de vie étroitement intégré, qui inclut la documentation, nous devenons la solution idéale pour les utilisateurs professionnels.

2. Identification automatique des risques en cours d’exécution grâce à des tableaux de bord dynamiques

En intégrant les données relatives aux risques (évaluations des risques et des contrôles, événements internes et externes causant des pertes et des indicateurs de risques clés), les équipes peuvent obtenir une vue complète de leur posture en matière de risques dans toute l’entreprise. Cela permet aux entreprises d’identifier automatiquement les risques au fur et à mesure qu’ils surviennent, en temps réel. En outre, IBM watsonx.governance fournit une évaluation automatique des risques, donnant aux équipes de gestion des risques une évaluation claire et objective du niveau de risque. Les tableaux de bord dynamiques et les graphiques facilitent une identification, une mesure, une surveillance et une analyse rapides, tandis que les alertes automatisées permettent une résolution rapide lorsque les seuils de risque sont dépassés.

3. Indicateurs prêts à l’emploi

Grâce à IBM watsonx.governance, les utilisateurs ont accès à un large éventail d’indicateurs préconfigurés qui permettant d’évaluer les performances et l’efficacité des systèmes d’IA. Parmi ceux-ci, il existe des indicateurs permettant d’identifier les dérives, d’évaluer la performance des modèles et d’autres domaines clés :

  • HAP
  • pii
  • Injection de prompt
  • Pertinence contextuelle
  • Fidélité
  • Similarité des réponses
  • Pertinence des réponses
  • Taux de réussite
  • Précision moyenne
  • Rang réciproque
  • Demandes infructueuses
  • Et bien d’autres

Ces indicateurs, entre autres, fournissent un cadre des exigences pour évaluer les performances et l’efficacité des systèmes d’IA. En outre, les utilisateurs peuvent créer des indicateurs personnalisés pour adapter leurs évaluations à des exigences métier et à des profils de risque spécifiques, fournissant ainsi un cadre des exigences complet.

4. Optimisation et expérimentation efficaces et agiles des agents

Autre innovation de l’équipe IBM, le « studio d’évaluation ». Cette fonctionnalité offre deux capacités clés :

  1. L’optimisation des prompts en comparant différentes versions des prompts côte à côte et
  2. Le suivi des expérimentations pour les agents

Le studio d’évaluation aide les développeurs à évaluer différentes versions du prompt sur un jeu de données et à comparer les résultats dans une interface utilisateur intuitive.  Il prend également en charge un classement personnalisé unique où les utilisateurs peuvent créer un système de classement personnalisé en sélectionnant des indicateurs et en leur attribuant des pondérations en fonction de leur importance.  Cela permet aux utilisateurs d’optimiser facilement un prompt qui doit être utilisé dans un outil ou un agent. 

Le studio d’évaluation watsonx.governance prend également en charge le suivi des expériences, un outil puissant permettant de créer de meilleurs systèmes d’IA agentique. Vous pouvez rapidement configurer des expériences, essayer différentes variantes (de l’agent) et les étiqueter avec des détails tels que le modèle, le récupérateur ou le prompt que vous avez utilisés. Les comparaisons côte à côte basées sur la latence, le coût et la qualité (par exemple, la fidélité) facilitent l’identification de ce qui fonctionne le mieux. Il est important de noter que la plateforme vous aide à enregistrer le code exact pour chaque exécution, ce qui libère du temps pour les développeurs et leur permet de se concentrer sur la création et l’amélioration de l’agent.

5. Évaluateurs intégrés : un facteur de différenciation clé sur le marché

La solution IBM watsonx.governance prend en charge des évaluateurs intégrés basés sur des décorateurs, ce qui établit une nouvelle norme pour la gouvernance des agents, offrant aux clients la possibilité d’évaluer les indicateurs et de les utiliser pour décider du flux d’exécution de l’agent. IBM watsonx.governance prend également en charge l’évaluation des agents hors ligne via des évaluateurs d’agents, qui permettent d’évaluer les agents IA sur les données de test au fur et à mesure de leur création. En voici les principales caractéristiques :

  • Évaluateurs intégrés à la boucle : les évaluateurs intégrés à la boucle peuvent être utilisés pour calculer un indicateur chaque fois qu’un outil ou un nœud dans un agent LangGraph est exécuté. Ils peuvent être utilisés pour calculer divers indicateurs tels que la pertinence du contexte, la fidélité, l’hallucination de l’outil et plus encore. Le flux d’exécution des agents peut être ajusté en fonction de la valeur des indicateurs calculés. Par exemple, si dans une application Agentic RAG, la pertinence du contexte est faible, il n’y a aucun intérêt à générer une réponse en utilisant le contexte récupéré.  Par conséquent, le flux d’agent peut être modifié en fonction de la valeur de pertinence contextuelle calculée pour ne pas accéder au nœud de génération de réponse, mais pour répondre directement à l’utilisateur.
  • Facilité d’utilisation : en règle générale, les évaluateurs intégrés à la boucle servent à ajouter du code personnalisé en tant que nœud dans l’application LangGraph. Les évaluations intégrées de watsonx.governance sont disponibles sous forme de décorateurs python, ce qui les rend très faciles à utiliser lors de la création d’une application d’IA agentique.

Cet outil innovant offre une visibilité et un contrôle inégalés sur la performance des agents, permettant aux clients d’optimiser leur workflow et d’obtenir de meilleurs résultats.

Répondre à l’évolution des besoins des équipes Ops IA/ML : la feuille de route du futur

Pour renforcer les équipes chargées des opérations IA/ML, IBM s’engage à stimuler l’innovation avec un pipeline de nouvelles fonctionnalités. Dans les versions à venir, vous découvrirez des fonctionnalités supplémentaires de gouvernance agentique, telles que :

  1. La surveillance avancée de la production pour l’IA agentique : IBM watsonx.governance offrira une surveillance continue des applications agentiques, en lançant des alertes lorsque l’un des indicateurs spécifiés dépasse ses limites prédéfinies. Cette fonctionnalité garantit une gestion proactive et une intervention rapide pour maintenir des performances d’IA optimales et fiables.
  2. Un catalogue des agents pris en charge : cela permettra aux utilisateurs d’ajouter de la gouvernance au processus d’ajout d’outils et d’agents à un catalogue central. Les entreprises pourront s’assurer que seuls les outils et agents fiables sont mis à la disposition de leurs développeurs.

La gouvernance n’est plus un obstacle défini par la conformité et l’audit. Cet outil permet aux équipes de créer des systèmes d’IA générative robustes, transparents et prêts à être déployés dans les entreprises. La gouvernance consiste à créer des agents IA, des applications et des modèles qui sont efficaces, sûrs et dignes de confiance dès le départ.

Alors que l’IA générative continue d’évoluer, watsonx.governance permet aux équipes d’évoluer rapidement avec confiance, transparence et contrôle. Notre approche de l’évaluation se concentre sur la gestion des risques en temps réel, la gestion automatisée des expériences, le suivi et la transparence à chaque étape. Conçue en tenant compte de la complexité du monde réel, la solution watsonx.governance aide les équipes à se dimensionner de manière responsable, à réduire les risques et à déverrouiller tout le potentiel de l’IA générative sans vous ralentir.

