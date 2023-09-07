En affaires, la confiance est indispensable. « Faites-nous confiance » n’est pas un argument, surtout lorsqu’il s’agit d’IA. Étant l’une des premières entreprises à développer l’IA d’entreprise, IBM adopte une approche du développement de l’IA guidée par des principes fondamentaux fondés sur des engagements de confiance et de transparence. Les produits IBM watsonx vous permettent de ne plus vous contenter d’être utilisateur d’IA et de devenir créateur de valeur IA. Il dispose d’un processus de bout en bout pour la construction et le test des modèles de fondation et de l’IA générative, commençant par la collecte de données et se terminant par des points de contrôle pour le suivi des déploiements responsables des modèles et des applications, axé sur la gouvernance, l’évaluation des risques, l’atténuation des biais et la conformité.

Étant donné que les clients pourront adapter les modèles Granite à leur propre application, chaque jeu de données utilisé pour l’entraînement est soumis à un processus d’examen défini de gouvernance, de risque et de conformité (GRC). Nous avons mis au point des procédures de gouvernance pour l’intégration des données dans la pile de données IBM, qui sont conformes aux principes d’éthique de l’IA d’IBM. L’application des critères de GRC pour les données couvre l’intégralité du cycle de vie des données d’entraînement. Notre objectif est d’établir un lien auditable entre un modèle de fondation entraîné et la version spécifique du jeu de données sur laquelle le modèle a été entraîné.

Une grande partie de l’attention médiatique s’est (à juste titre) portée sur le risque que l’IA générative produise des résultats haineux ou diffamatoires. Chez IBM, nous savons que les entreprises ne peuvent pas se permettre de prendre de tels risques. C’est pourquoi nos modèles Granite sont entraînés sur des données examinées par notre propre « détecteur HAP », un modèle de langage entraîné par IBM pour détecter et éradiquer les contenus haineux et grossiers (d’où l’acronyme anglais « HAP » signifiant « Hateful And Profane »), qui est évalué par rapport à des modèles internes ainsi que publics. Après l’attribution d’une note à chaque phrase d’un document, des analyses sont effectuées sur les phrases et les notes afin de découvrir la distribution, qui détermine le pourcentage de phrases à filtrer.

En outre, nous appliquons un large éventail d'autres mesures de qualité. Nous recherchons et supprimons les doublons qui améliorent la qualité des résultats et utilisons des filtres de qualité des documents pour supprimer les documents de faible qualité qui ne conviennent pas à la formation. Nous déployons également des mesures de protection des données régulières et permanentes, notamment en surveillant les sites web connus pour le piratage de matériel ou la publication d'autres contenus offensants, et en évitant ces sites web.

Et comme le paysage de l'IA générative est en constante évolution, notre processus de bout en bout évoluera et s’améliorera en permanence, offrant ainsi aux entreprises des Résultats auxquels elles peuvent faire confiance.