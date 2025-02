IBM s'engage à développer et à déployer l'IA de manière responsable. Et cet engagement s'étend aux données que nous utilisons pour construire et entraîner nos systèmes d'IA. En tant que « client zéro », nous voulions évaluer les normes de provenance des données dans un environnement rigoureux afin de vraiment comprendre leur impact et de les mettre à l’épreuve de manière significative. Nous avons donc implémenté des éléments clés au sein de notre propre programme intégré de gouvernance (IGP) qui régit les données et les modèles développés et utilisés par IBM, en commençant par une évaluation de l’exhaustivité des normes. Pour ce faire, nous avons comparé les normes de provenance des données à nos propres exigences d'intégration des données pour les ensembles de données utilisés pour développer des modèles de fondation, et nous avons évalué dans quelle mesure la taxonomie des métadonnées des normes de provenance des données nous permettait de valider l'adéquation des données pour une variété de cas d'utilisation.

Dans un second temps, nous avons demandé à des data scientists et chercheurs IBM de différents niveaux d'expérience d'appliquer les normes de provenance des données à plusieurs types de données courants, notamment des données propriétaires IBM, des données tierces et des données contenant du matériel HAP (discours haineux, langage abusif et blasphèmes).

Pour finir, nous avons demandé à des experts de l'IBM Office of Privacy and Responsible Technology d'examiner l'exhaustivité et l'exactitude des soumissions de métadonnées conformément aux normes de provenance des données, en examinant les soumissions avec les data scientists et chercheurs afin de mieux comprendre leurs difficultés ou leurs confusions. Ces commentaires qualitatifs nous ont permis d'identifier précisément les termes, définitions et orientations qui étaient peu clairs ou ambigus.