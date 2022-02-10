En tant que data scientist pour IBM Consulting, j’ai eu la chance de travailler sur plusieurs projets pour répondre aux différents besoins des clients d’IBM. Durant mon expérience chez IBM, j’ai vu la technologie appliquée à divers cas d’utilisation que je n’aurais jamais crus possibles au départ, c’est pourquoi j’étais ravie de piloter la mise en œuvre de l’intelligence artificielle pour lutter contre l’un des problèmes sociétaux les plus insidieux auxquels nous sommes confrontés aujourd’hui : l’injustice raciale.
Alors que le mouvement Black Lives Matter commençait à se répandre dans tout le pays et le monde en 2020, je me suis immédiatement demandé si ma capacité à résoudre des problèmes pour des clients pouvait être appliquée à de grands enjeux sociétaux. C’est avec cette idée que j’ai décidé de chercher des opportunités pour rejoindre la lutte pour l’égalité raciale et j’ai trouvé une communauté interne IBM travaillant sur des projets qui devaient être lancés via le Call for Code for Racial Justice.
De nombreux projets étaient en cours d’incubation au sein d’IBM, mais j’ai été attirée par l’un d’entre eux en particulier, qui portait sur les biais implicites et explicites. Ce projet, TakeTwo, allait devenir l’un des sept projets qui ont été publiés en tant que projet open source externe il y a un peu plus d’un an. Le projet TakeTwo utilise la compréhension du langage naturel pour aider à détecter et à éliminer les préjugés raciaux, à la fois explicites et subtils, dans le contenu écrit. Utiliser TakeTwo pour détecter des expressions et mots qui peuvent être perçus comme racialement biaisés peut aider les créateurs de contenu à atténuer de manière proactive les biais potentiels lors de l’écriture. Il permet à un créateur de contenu de vérifier le contenu qu’il a créé avant de le publier, actuellement via un éditeur de texte en ligne. Considérez cela comme un Grammarly pour repérer un langage potentiellement raciste. TakeTwo est conçu pour tirer parti des annuaires de termes inclusifs compilés par des sources fiables comme l’Inclusive Naming Initiative.
Non seulement TakeTwo m’a permis d’appliquer mon expertise pour améliorer le projet, mais cela m’a également donné l’occasion de me pencher sur certains des biais raciaux implicites que j’ai pu avoir, mais dont je n’étais pas consciente auparavant. Travailler sur TakeTwo était une excellente façon de contribuer à une mission importante pour le monde, tout en offrant une opportunité de réflexion personnelle.
Découvrir la solution en action :
En travaillant sur TakeTwo, il est apparu clairement que, même si la solution vise à détecter les biais en analysant et en évaluant d’énormes quantités de données, il est important de reconnaître que les données elles-mêmes peuvent contenir des biais implicites. En s’appuyant sur l’intelligence artificielle et des technologies open source telles que Python, FastAPI, JavaScript et CouchDB, la solution TakeTwo peut continuer à évaluer les données qu’elle ingère et mieux détecter les biais qu’elles contiennent. Par exemple, un mot ou une phrase qui peut être acceptable aux États-Unis peut ne pas l’être au Japon – nous devons donc en être conscients et faire en sorte que notre solution fonctionne en conséquence. Passionnée par la science des données, je sais d'expérience que la qualité de notre modèle dépend des données dont nous l'alimentons. À ce propos, une chose que j’ai apprise en travaillant sur ce projet, c’est que nous avons besoin de meilleurs ensembles de données qui peuvent nous aider à entraîner les modèles d’apprentissage automatique (ML) qui sous-tendent ces systèmes. Les jeux de données Kaggle ont été un excellent point de départ pour nous, mais si nous voulons étendre le projet pour lutter contre le racisme partout où il existe, nous aurons besoin de données plus diversifiées.
Par ailleurs, les compétences requises pour des projets de ce type vont bien au-delà de la simple science des données. En particulier pour ce projet, il était important de tirer parti d'experts en linguistique qui peuvent aider à définir certaines des nuances culturelles qui existent dans la langue et qu’un système comme TakeTwo doit soit codifier, soit ignorer. Ce n’est qu’en travaillant de manière interdisciplinaire que nous pourrons trouver une solution viable.
La valeur que le machine learning et l’IA apportent à l’amélioration de solutions telles que TakeTwo est une source d’inspiration. Qu’il s’agisse d’embaucher des employés ou d’obtenir une approbation pour un prêt à la banque, le ML et l’IA s’infiltrent dans la façon dont nous interagissons les uns avec les autres et contribuent à éliminer autant que possible les biais raciaux dans la prise de décisions. En tant que technologues, nous avons l’obligation de produire des modèles honnêtes, non biaisés et performants au plus haut niveau possible afin de pouvoir faire confiance à leurs résultats.
Vous pouvez découvrir ici comment nous, chez IBM, développons une meilleure IA. TakeTwo continue de progresser dans le développement et le renforcement de son efficacité, et vous pouvez contribuer à améliorer ce projet open source. Consultez TakeTwo et tous les autres projets Call for Code for Racial Justice dès aujourd’hui !
Ce billet fait partie d’une série organisée à l’occasion du Mois de l’histoire des Noirs et qui traite de la relation entre l’intelligence artificielle et la justice sociale.
