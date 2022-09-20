Les entreprises dépendent de plus en plus de l’IA et du machine learning pour aider les humains à la prise de décision. C’est ainsi que les grandes entreprises améliorent les interactions avec les clients et accélèrent la mise sur le marché des biens et services. Mais ces entreprises doivent pouvoir faire confiance à leurs modèles d’IA/ML avant qu’ils ne puissent être opérationnalisés et utilisés dans des processus métier critiques. L’IA digne de confiance est devenue une exigence pour réussir l’adoption de l’IA dans tous les secteurs.
De nos jours, si un modèle IA prend une décision biaisée, injuste impliquant la santé, la richesse ou le bien-être des humains, une entreprise peut faire la une des actualités pour de mauvaises raisons. Outre le risque important pour la réputation des marques, il existe un ensemble croissant de réglementations relatives aux données et à l’IA à travers le monde et dans tous les secteurs, comme l’EU AI Act, que les entreprises doivent respecter.
Avant de pouvoir faire confiance à un modèle d’IA et à ses informations, vous devez pouvoir faire confiance aux données qui sont utilisées. La bonne solution de data fabric soutiendra naturellement ces piliers et vous aidera à créer des modèles d’IA digne de confiance.
Considérez ces trois étapes cruciales dans le cycle de vie de la création de votre prochain modèle d’IA ou de machine learning ou de l’amélioration d’un modèle actuel :
Tout d’abord, vous avez besoin d’accéder à toutes les données pertinentes et d’en avoir des informations.
D’après certaines études, jusqu’à 68 % des données ne sont pas analysées dans la plupart des entreprises. Mais les implémentations réussies de l’IA nécessitent une connexion à des données précises et de haute qualité, prêtes à être utilisées en libre-service par les bonnes parties prenantes. Sans la possibilité d’agréger des données provenant de sources internes et externes disparates (sur site, clouds publics ou privés), vous disposerez d’un modèle d’IA de qualité inférieure, tout simplement parce que vous ne disposerez pas de toutes les informations dont vous avez besoin.
Deuxièmement, vous devez veiller à ce que les données elles-mêmes soient fiables. Un ensemble de données de confiance comporte deux facteurs :
Selon Gartner, 53 % des projets d’IA et de ML sont bloqués dans des phases de préproduction. Vous pouvez rendre votre IA opérationnelle en examinant toutes les étapes du cycle de vie de l’IA. Des outils de science des données automatisés et intégrés permettent de créer, de déployer et de contrôler des modèles d’IA. Cette approche permet d’assurer la transparence et la responsabilisation à chaque étape du cycle de vie du modèle. Mais pour ce faire, vous devez également vous assurer que l’équité, la robustesse, la collecte de faits et plus encore sont garanties.
Souvent, les data scientists ne sont pas enthousiastes à l’idée de produire toute la documentation nécessaire pour répondre aux normes éthiques et réglementaires. C’est là qu’une technologie comme IBM FactSheets peut être utile en réduisant le travail manuel nécessaire pour capturer les métadonnées et autres faits concernant un modèle à travers les étapes du cycle de vie de l’IA. Grâce aux solutions de gouvernance de l’IA, un data scientist utilisant des bibliothèques et des cadres des exigences Python standard et ouverts peut collecter automatiquement des faits sur la création de modèles et la formation.
De même, les faits peuvent être collectés au cours des phases de test et de validation du modèle. Toutes ces informations sont intégrées dans des workflows de bout en bout pour garantir que l’équipe répond aux normes éthiques et réglementaires.
Dans la plupart des entreprises, il existe un certain nombre d’outils de science des données, ce qui complique la gouvernance et la gestion des informations, sans parler du respect des réglementations de plus en plus strictes en matière de sécurité, de conformité et de gouvernance. Vous pouvez utiliser la gouvernance de l’IA évolutive pour favoriser des processus cohérents et reproductibles conçus pour accroître la transparence des modèles et assurer à la fois la traçabilité et la responsabilité. Vous pouvez améliorer la collaboration, comparer les prédictions des modèles, quantifier les risques et optimiser les performances des modèles, identifier et atténuer les biais, réduire les risques tels que la dérive et diminuer le besoin de recyclage des modèles.
En fin de compte, la gestion des données et l’accès des utilisateurs aux bonnes données au bon moment sont au cœur du succès de l’IA et de la gouvernance de l’IA. Une architecture data fabric vous aide à atteindre cet objectif en minimisant les complexités liées à l’intégration des données et en simplifiant l’accès aux données au sein d’une entreprise afin de faciliter l’utilisation des données en fonction de ses besoins.
Avec IBM® Cloud Pak for Data, vous pouvez formaliser un workflow qui permet à différentes équipes d’interagir avec votre modèle à différentes étapes. Il ne s’agit pas seulement d’accorder un accès approprié aux équipes de science des données. Votre équipe de gestion des risques liés au modèle, votre équipe chargée des opérations informatiques et vos employés ont également besoin d’un accès approprié.
Vous pouvez également gérer différents jeux de données et sources, des données d’entraînement aux données de charge utile en passant par les données de vérité terrain, avec les niveaux appropriés de confidentialité et de gouvernance. Vous pouvez automatiser la capture des métadonnées à partir de chaque ensemble de données et modèle et les conserver dans un catalogue central. IBM Cloud Pak for Data vous permet de faire ceci à l’échelle avec cohérence et de l’appliquer à des modèles créés à l’aide d’outils open source ou tiers.
L’avantage potentiel de l’IA se reflète dans les tendances stratégiques des leaders des secteurs. Selon l’étude 2025 du PDG de l’Institute for Business Value (IBV) d’IBM, 68 % des PDG affirment que l’IA modifie les aspects de leur cœur de métier, et 61 % affirment que l’avantage concurrentiel dépend de qui possède l’IA générative la plus avancée. Mais pour gagner la confiance des clients, il est essentiel que des contrôles appropriés soient mis en place tout au long du cycle de vie de l’IA, en particulier lorsque l’IA est utilisée dans des situations critiques.
IBM nommé leader en matière d’outils d’intégration de données, pour la 19e année consécutive, dans l’édition 2024 du rapport Magic Quadrant™ de Gartner.
Découvrez pourquoi l’intelligence des données et l’intégration des données alimentées par l’IA sont essentielles pour préparer les données structurées et non structurées et accélérer les résultats de l’IA.
Découvrez la puissance de l’intégration d’une stratégie de data lakehouse dans votre architecture de données, notamment l’optimisation des coûts de vos workloads et le dimensionnement de l’IA et des analyses, avec toutes vos données, partout.
Explorez le guide pour les responsables des données sur le développement d’une organisation axée sur les données et d’un avantage métier.
Découvrez 5 bonnes raisons de moderniser votre intégration des données sur IBM Cloud Pak for Data.
Créez et gérez des pipelines intelligents de diffusion de données en continu via une interface graphique intuitive, facilitant ainsi une intégration fluide des données dans les environnements hybrides et multicloud.
Découvrez IBM Databand, le logiciel d’observabilité pour les pipelines de données. Il collecte automatiquement les métadonnées pour établir des lignes de base historiques, détecter les anomalies et créer des workflows afin de résoudre les problèmes de qualité des données.
Créez des pipelines de données résilients, performants et optimisés en termes de coûts pour vos initiatives d’IA générative, vos analyses en temps réel, la modernisation de vos entrepôts et vos besoins opérationnels avec les solutions d’intégration des données d’IBM.
Découvrez IBM DataStage, un outil ETL (Extraction, Transformation, Chargement) qui offre une interface visuelle destinée à la conception, au développement et au déploiement de pipelines de données. Il est disponible en version SaaS géré sur IBM Cloud, en auto-hébergement et en tant qu’extension pour IBM Cloud Pak for Data.