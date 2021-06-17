L’attention du secteur portée à l’IA digne de confiance est motivé par plusieurs forces — la posture de responsabilité sociale des entreprises, les préoccupations liées au risque de réputation et un ensemble croissant de réglementations. Les entreprises reconnaissent qu’elles ont besoin d’une approche systématique pour garantir que l’IA et le machine learning peuvent être fiables et opérationnalisés. Les aspects de l’IA digne de confiance comprennent l’équité, la robustesse, la protection de la vie privée, l’explicabilité et la transparence. Les cas d’utilisation comprennent la réalisation de bilans de santé des applications existantes et la création d’un cadre organisationnel pour la gouvernance de l’IA, mais aujourd’hui, nous nous concentrerons sur l’opérationnalisation des nouvelles applications.
Les organisations ont besoin d’une approche systématique pour créer et exploiter de nouvelles applications d’IA de manière fiable. Cette approche doit prendre en considération le cycle de vie de la science des données et de l’IA de bout en bout. Le cycle de vie de l’IA se compose d’une séquence d’étapes qui regroupent différents personas et bonnes pratiques. (Voir le rapport d’O’Reilly Operationalizing AI pour une vue d’ensemble). Les étapes du cycle de vie comprennent :
Dans un scénario idéal, les aspects de l’IA digne de confiance devraient être abordés à chacune de ces étapes et pas seulement à la fin. Nous avons besoin de garde-fous appropriés à chaque étape, qu’il s’agisse de la définition de l’activité, de l’exploration des données, de la création de modèles, de la validation, du déploiement, de la surveillance et de la gestion continue des modèles. Examinons de plus près chaque étape et comment les différents aspects de l’IA digne de confiance sont traités.
Cette étape guide la hiérarchisation des cas d’utilisation et l’élaboration d’un plan d’action en matière d’IA. L’équipe – composée d’une partie prenante métier, d’un data scientist, d’un responsable des données, d’un responsable des opérations et d’autres rôles – se concentre d’abord sur le cas d’utilisation métier, définit la valeur métier et spécifie les KPI métier. Elle s’attaque ensuite à la tâche technique, en traduisant l’objectif commercial en tâches spécifiques d’IA à résoudre. Enfin, l’équipe élabore un plan d’action structuré pour une solution aux tâches techniques identifiées afin de soutenir l’objectif commercial.
L’application des principes du design thinking d’entreprise est une bonne pratique à ce stade. Le design thinking permet d’identifier et de définir divers aspects commerciaux et techniques des biais/de l’équité, de la robustesse, de l’explicabilité, etc. dans le contexte du cas d’utilisation. Cette étape permet de répondre à des questions telles que :
Il est également important de prendre note de toutes les politiques organisationnelles en matière de données et d’IA que l’équipe devra suivre lors de l’élaboration de ces cas d’utilisation, afin d’éviter tout problème de dernière minute lors des tentatives de validation pour l’utilisation en production.
Cette étape permet au consommateur de données de trouver et d’accéder aux jeux de données pertinents. Les équipes de science des données peuvent « faire leur marché de données » dans un catalogue central en utilisant soit des métadonnées, soit des termes métier pour effectuer une recherche. Elles peuvent comprendre les données, y compris leur propriétaire, leur traçabilité, leur relation avec d’autres jeux de données, etc. Il est important de fournir aux data scientists une vue technique de la traçabilité des données, afin qu’ils puissent comprendre chaque transformation des données susceptible d’avoir un impact sur la façon dont ils créent et utilisent les fonctionnalités.
Sur la base de cette exploration, ils peuvent demander un flux de données. Une fois approuvés, les jeux de données peuvent être mis à la disposition de l’équipe de science des données dans son environnement de développement de science des données.
Si l’équipe doit travailler avec des données personnelles réglementées telles que des informations personnelles identifiables (PII) ou des informations de santé protégées (PHI), le Data Steward ou un fournisseur de données doit s’assurer que les données partagées respectent les réglementations par une anonymisation appropriée.
Les équipes de science des données explorent et préparent les données, et construisent, entraînent et testent leurs modèles d’IA/ML à ce stade. Les activités de cette étape sont idéalement réalisées sous forme de sprints agiles. Il est important que les biais dans les données soient vérifiés à ce stade, avant même que le travail de construction du modèle ne commence. Il s’agit d’un garde-fou interne pour l’équité, et de tels garde-fous peuvent être mis en place pendant et après les étapes de construction du modèle. La robustesse du modèle, l’explicabilité et d’autres aspects peuvent également être pris en compte et testés au cours de cette étape.
Une fois ces tests réussis, un pipeline MLOps permet de déplacer le modèle et les actifs associés de l’environnement de développement vers un environnement de validation de pré-production.
Cette étape comprend la validation du modèle et son déploiement en production. Les activités de validation peuvent être réalisées par une équipe autre que celle qui a construit le modèle, par exemple l’équipe de validation du modèle ou de gestion du risque de modèle de l’entreprise ou une entité externe.
Cette équipe valide la qualité, la robustesse, l’équité, etc., et génère des rapports de validation. Il est important d’enregistrer les résultats de la validation à des fins de référence et de comparaison. Les fiches techniques des modèles, les explications locales et globales et d’autres paramètres sont également vérifiés.
Si le modèle passe la validation, l’équipe d’exploitation peut le promouvoir dans l’environnement de production à l’aide d’un pipeline MLOps. Le modèle y est déployé, soit pour un appel en ligne, soit pour un appel par lots.
À ce stade, l’équipe d’exploitation met en place une surveillance et une gestion continues du modèle d’IA/ML en production. L’équipe configure des moniteurs pour la collecte périodique et programmée d’indicateurs. La qualité, la robustesse et l’équité sont contrôlées à des fréquences dictées par les besoins de l’entreprise. La surveillance de la dérive des données et de la précision, ainsi que la génération d’explications pour les transactions sélectionnées ainsi que pour le comportement global sont des exemples d’activités continues.
L’entreprise peut choisir d’agir si les moniteurs détectent qu’un seuil a été dépassé, en déclenchant des alertes ou en prenant des mesures correctives. Des étapes d’atténuation des biais ou de réentraînement des modèles peuvent être configurées pour garantir un comportement fiable et continu. Les modèles peuvent être mis hors service sur la base de critères commerciaux ou techniques. Cette étape établit les garde-fous les plus externes pour une IA digne de confiance.
Ces étapes du cycle de vie de l’IA s’inscrivent dans un cadre global de gouvernance de l’IA à l’échelle de l’entreprise. Un tel cadre permet à de multiples cas d’utilisation de suivre les étapes du cycle de vie de manière cohérente, quels que soient les outils de développement utilisés. Il contribue à automatiser la documentation tout au long du cycle de vie et offre une vue cohérente aux différentes parties prenantes.
L’opérationnalisation d’une IA digne de confiance exige de réunir les personnes (expertise), les processus (bonnes pratiques) et la plateforme (technologie). IBM Cloud Pak for Data et IBM Spectrum Fusion fournissent un cadre technologique qui prend en charge les différentes étapes du cycle de vie de bout en bout de l’IA. Il peut s’intégrer dans des environnements existants et compléter les outils de développement et de déploiement de modèles existants. La plateforme peut fonctionner sur une grande variété d’infrastructures cloud (IBM, AWS, Azure, GCP, etc.) et sur site, offrant ainsi de véritables capacités de cloud hybride.
IBM propose un ensemble d’offres de services combinant la formation, l’expertise, les bonnes pratiques et la technologie pour aider les clients à démarrer l’opérationnalisation de l’IA digne de confiance.