En tant que data scientists, nous sommes parfois tellement déterminés à concevoir un modèle parfait que nous pouvons involontairement y inclure des biais humains. Souvent, ces biais s’insinuent dans les données d’entraînement, puis sont amplifiés et intégrés dans le modèle. Si un tel modèle entre dans un cycle de production, il peut avoir des implications graves liées à ces biais, telles que des prédictions erronées de la cote de crédit ou des examens médicaux. Dans divers secteurs, les exigences réglementaires en matière d’équité des modèles et de fiabilité de l’IA visent à empêcher les modèles biaisés d’entrer dans ces cycles de production.
Pour être un data scientist responsable, il y a deux considérations clés à prendre en compte lors de la création d’un pipeline de modèles :
Détecter et définir les biais et les iniquités n’est pas une tâche facile. Pour aider les data scientists à réfléchir et à identifier les problèmes éthiques éventuels, le processus standard de data mining doit inclure trois étapes supplémentaires : l’évaluation des risques relatifs aux données, l’évaluation des risques liés aux modèles et la surveillance de la production.
Cette étape permet à un data scientist d’évaluer s’il existe des déséquilibres entre différents groupes de personnes par rapport à la variable cible. Ainsi, nous observons encore que les hommes sont plus souvent acceptés à des postes de direction que les femmes. Mais nous savons tous qu’il est illégal d’offrir un emploi en fonction du sexe. Pour équilibrer le modèle, nous pourrions donc faire valoir que le sexe n’a pas d’importance et qu’il pourrait être supprimé. Mais quel autre impact cela pourrait-il avoir ? Avant d’agir, cette étape doit être examinée avec les experts compétents afin de déterminer si les contrôles actuels sont suffisants pour atténuer les biais potentiels du modèle.
L’objectif de l’équilibrage des données est d’imiter la distribution des données utilisées dans la production, afin de garantir que les données d’entraînement soient aussi proches que possible des données employées en temps réel dans l’environnement de production. Ainsi, même si la réaction initiale consiste à supprimer la variable biaisée, cette approche a peu de chances de résoudre le problème. Les variables sont souvent corrélées et le biais peut s’infiltrer par l’un des champs corrélés, se substituant ainsi à la variable dans le modèle. Par conséquent, toutes les corrélations doivent être examinées avant de supprimer le biais afin de s’assurer qu’il est véritablement éliminé.
Les prédictions des modèles ont des implications immédiates et graves : elles peuvent en effet complètement bouleverser la vie d’une personne. Si un modèle prédit que vous avez une faible cote de crédit, cela pourrait avoir des répercussions sur tous les aspects de votre vie, car vous aurez du mal à obtenir des cartes de crédit et des prêts, à trouver un logement et à bénéficier de taux d’intérêt raisonnables. De plus, si vous ne comprenez pas la raison de cette faible cote, vous n’aurez aucune possibilité de l’améliorer.
Le travail des data scientists consiste à s’assurer que les modèles fournissent les résultats les plus équitables pour tous. Si les données sont biaisées, le modèle apprendra de ce biais et fera des prédictions injustes. Les modèles boîte noire fournissent d’excellents résultats, mais leur faible interprétabilité et explicabilité rendent impossible la vérification de l’existence de signaux d’alerte permettant de garantir l’équité. Une analyse approfondie des résultats du modèle est donc nécessaire. Les data scientists doivent évaluer le compromis entre l’interprétabilité et les performances des modèles et sélectionner ceux qui répondent le mieux à ces deux exigences.
Une fois qu’un modèle est développé par les data scientists, il est souvent remis à l’équipe MLOps. Lorsque les données du nouveau modèle sont mises en production, cela peut entraîner un nouveau biais ou renforcer un biais qui avait été négligé auparavant en l’absence d’une surveillance adéquate. Les données de production peuvent entraîner une dérive des performances ou de la cohérence, et introduire un biais dans le modèle et les données. Il est très important de surveiller les modèles en mettant en place des alertes adaptées indiquant la détérioration des performances du modèle et un mécanisme permettant de décider quand retirer un modèle qui n’est plus adapté à l’utilisation à l’aide d’un outil tel qu’IBM® Watson Studio. Là encore, la qualité des données doit être suivie en comparant la distribution des données de production aux données utilisées pour entraîner le modèle.
Une approche responsable de la science des données implique de considérer le modèle au-delà du code et des performances, en tenant compte de la qualité et de la fiabilité des données utilisées. En définitive, l’atténuation des biais est un processus délicat, mais essentiel, qui contribue à garantir que les modèles suivent les processus humains appropriés. Cela ne signifie pas que vous devez intervenir, mais il est important de repenser et de reformuler ce que nous, en tant que data scientists, faisons déjà afin de garantir que cela soit fait de manière responsable.
