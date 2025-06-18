18 juin 2025
L'IA agentique est une source de progrès, Gartner prévoyant qu'un tiers des interactions de l'IA générique utiliseront des modèles d'action et des agents autonomes d'ici à 2028.
Mais les agents d'IA non supervisés peuvent fonctionner avec une autonomie et un pouvoir importants, exposant les entreprises à de nombreux risques imprévisibles qui peuvent avoir un impact préjudiciable et irréversible à la fois pour les entreprises et les clients. Leurs processus de prise de décision complexes, influencés par les données, peuvent créer des biais, compliquer la traçabilité et introduire des problèmes de sécurité. Les hallucinations et les choix incorrects aggravent encore davantage ces problèmes.
Pour relever ces défis, en mars, nous avons annoncé l’aperçu technique de nos capacités de gouvernance de l’IA agentique. En nous appuyant sur cette dynamique, nous déployons de nouvelles fonctionnalités au sein de watsonx.governance.
Le catalogue d'agents gouvernés (Governed Agentic Catalog) est une ressource complète pour gérer et sélectionner les outils d'IA, les agents et les workflows, conçu pour rationaliser la sélection des outils/agents et promouvoir la réutilisation entre les utilisateurs et les cas d'utilisation. Ce référentiel centralisé aide les équipes à maintenir la cohérence et l’efficacité en consolidant un large éventail d’outils, chacun effectuant des tâches spécifiques essentielles à la conception et au développement de systèmes agentiques. Ces outils agentiques englobent diverses fonctionnalités, telles que la récupération des données et les connexions externes.
Les fonctionnalités principales du catalogue incluent :
En s'appuyant sur le catalogue d'agents gouverné, les équipes peuvent gérer la prolifération des outils, s'assurer de leur utilisation appropriée et maintenir la cohérence entre les services. Cette approche globale de la gestion des outils permet d’accélérer les progrès et favorise un environnement collaboratif pour le développement de systèmes agentiques.
La prévalence croissante des agents d'IA introduit des complexités importantes, telles que le défi d'évaluer la performance, la fiabilité, la sécurité et le comportement éthique de ces agents d'IA autonomes.
Les bonnes pratiques d’évaluation de l’IA agentique peuvent réduire l’exposition à divers risques, prévisibles et inconnus. Cependant, un suivi efficace de la performance peut constituer un défi pour les entreprises et les développeurs, car les agents exigent d'observer non seulement la production, mais aussi les comportements, les décisions et les intentions. Avec watsonx.governance, les entreprises peuvent évaluer les performances des agents en utilisant :
Depuis mars, watsonx.governance a introduit ces nouvelles capacités pour prendre en charge des indicateurs spécialisés supplémentaires. Les nouveaux indicateurs d’évaluation de l’IA agentique RAG sont désormais disponibles. L'ensemble complet d'indicateurs pour évaluer la performance, notamment HAP, PII, l'injection de prompt, la pertinence du contexte, la fidélité, la similarité des réponses, la pertinence des réponses, le taux de réussite, la précision moyenne, le classement mutuel et les demandes infructueuses, entre autres, afin de garantir une évaluation approfondie de l'efficacité de notre système. Cela permet de confirmer que les agents agissent de manière appropriée et de détecter les signes d'alerte en ajoutant les garde-fous nécessaires pour réguler le comportement des agents en fonction des résultats souhaités.
Ces indicateurs seront disponibles en ajoutant un simple décorateur python au nœud de l'outil dans une application LangGraph. L'ajout de ce décorateur entraînera le calcul de cet indicateur en tant que sous-produit de l'exécution du nœud dans l'application agentique. Le calcul peut alors être utilisé dans l'application pour prendre des décisions concernant le flux. Par exemple, si le contexte extrait de la base de données vectorielle n’est pas pertinent pour la requête de l’utilisateur, ne générez pas de réponse, mais lancez une recherche sur le Web pour récupérer le bon contexte. Ces évaluateurs ne sont pas seulement faciles à utiliser, ils sont également efficaces et comprennent à la fois des indicateurs open source et des indicateurs avancés d’IBM. Ils offrent donc un large éventail de capacités d’évaluation et conviennent à différents cas d’utilisation et types de tâches.
Le suivi des expérimentations est essentiel pour gouverner un agent IA, car il fournit un enregistrement complet de tous les changements, itérations et améliorations apportés au cours du processus de développement. Cela inclut des modifications apportées aux algorithmes, aux entrées de données, aux hyperparamètres et à d’autres aspects critiques.
Le développement d'une application agentique est un processus itératif. Les développeurs construisent une application d'IA agentique, la testent, la peaufinent si nécessaire et construisent une nouvelle version pour améliorer le rendement, et le processus se poursuit pour une optimisation supplémentaire. Watsonx.governance prendra automatiquement en charge le suivi de diverses expériences et la comparaison à l’aide d’Evaluation Studio :
Watsonx.governance accélère le processus d’itération et de développement en permettant des comparaisons rapides des applications d’IA agentique. Cette fonctionnalité ne se limite pas aux applications d'IA développées sur notre plateforme watsonx ; elle s'étend également aux plateformes tierces, offrant ainsi une grande polyvalence.
Les indicateurs de surveillance peuvent vous aider à suivre les performances des agents, à détecter des problèmes tels que la dégradation des performances, la dérive des données et les biais des modèles en production, et à orienter les améliorations. Sans une évaluation appropriée, il devient difficile de faire confiance, de contrôler ou de calibrer les agents d'IA pour améliorer la précision, ce qui augmente le risque de résultats imprévus.
Dans les scénarios où l'IA agentique est déployée en production, une surveillance continue devient impérative pour résoudre des problèmes tels que l'hallucination, le temps de réponse, la dérive du modèle et les biais. Déployer des applications d'IA agentiques avec une surveillance continue de la production est essentiel pour maintenir la fiabilité et la confiance du système. La surveillance en temps réel permet aux équipes MLOps et AgentOps de suivre le comportement des modèles et des agents, la dérive des performances et les résultats inattendus, ce qui permet d’intervenir immédiatement en cas d’écart. Cette disponibilité opérationnelle garantit que les systèmes autonomes restent alignés sur les objectifs et les contraintes de sécurité prévus.
Dans les prochaines versions, watsonx.governance d'IBM sera équipé pour offrir une surveillance continue des applications agentiques, en lançant des alertes lorsque l'un des paramètres spécifiés dépasse les limites prédéfinies. Cette fonctionnalité garantit une gestion proactive et une intervention rapide pour maintenir une performance optimale de l’IA.
Comme d’autres technologies évoluant rapidement, les agents d’IA peuvent présenter des risques, des défis et des conséquences sociétales. Parmi les nouveaux risques introduits par les agents d'IA, on peut citer la distorsion des données, les actions redondantes, les hallucinations des fonctions, le partage d'informations confidentielles et les attaques sur les ressources externes d'un agent d'IA. Au-delà de cela, l’IA agentique intensifie les risques, les défis et les effets sociétaux existants.
L’IBM Risk Atlas fournit une liste des risques inhérents aux données et à l'IA et est en cours de mise à jour pour refléter les risques et menaces agentiques.
La gouvernance de l’IA est nécessaire tout au long du cycle de vie de l’IA, de la création, du développement et de la validation des cas d’utilisation à la surveillance de la production. À chaque étape, il y a des risques et des pièges qui, s'ils ne sont pas correctement gérés, peuvent causer des problèmes actuels ou futurs. Par exemple, lors de la création d’un nouveau cas d’utilisation, watsonx.governance fournit une évaluation des risques, qui vous aide à identifier les risques auxquels votre cas d’utilisation est exposé, afin que vous puissiez intégrer les techniques nécessaires à la gestion des risques. De même, lors du développement d'une application agentique, vous devez mesurer et évaluer les performances de chaque outil ou nœud dans l'application afin d'améliorer les itérations futures.
watsonx.governance fournit une bibliothèque avec plus de 50 indicateurs qui peuvent être ajoutés en tant que décors à votre application et à mesurer ses performances. Sans gouvernance, vous ne pouvez pas faire évoluer votre IA ou la fiabiliser.
Une gouvernance et une sécurité efficaces sont indispensables, mais à mesure que les entreprises se développent et adoptent l'IA à grande échelle, la mise en œuvre d'une structure de gouvernance de l'IA fiable devient essentielle pour garantir une expérimentation sécurisée et gérer efficacement les complexités liées à l'adoption généralisée de l'IA.
Essayez watsonx.governance pour découvrir ces nouvelles versions de fonctionnalités et plusieurs autres améliorations conçues pour aider les entreprises à exploiter le véritable potentiel de l'IA et à transformer votre expérience de gouvernance de l'IA dès aujourd’hui.
