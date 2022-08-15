En tant que data scientists, nous sommes parfois tellement déterminés à concevoir un modèle parfait que nous pouvons involontairement y inclure des biais humains. Souvent, ces biais s’insinuent dans les données d’entraînement, puis sont amplifiés et intégrés dans le modèle. Si un tel modèle entre dans un cycle de production, il peut avoir des implications graves liées à ces biais, telles que des prédictions erronées de la cote de crédit ou des examens médicaux. Dans divers secteurs, les exigences réglementaires en matière d’équité des modèles et de fiabilité de l’IA visent à empêcher les modèles biaisés d’entrer dans ces cycles de production.

Pour être un data scientist responsable, il y a deux considérations clés à prendre en compte lors de la création d’un pipeline de modèles :

Biais : un modèle qui réalise des prédictions pour des personnes d’un groupe (ou d’une ethnie, d’un sexe, d’un groupe ethnique, etc.) différent les discrimine régulièrement par rapport aux autres Iniquité : un modèle qui fait des prédictions de manière à priver des personnes de leurs biens ou de leur liberté sans visibilité

Détecter et définir les biais et les iniquités n’est pas une tâche facile. Pour aider les data scientists à réfléchir et à identifier les problèmes éthiques éventuels, le processus standard de data mining doit inclure trois étapes supplémentaires : l’évaluation des risques relatifs aux données, l’évaluation des risques liés aux modèles et la surveillance de la production.