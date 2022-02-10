Als Data Scientist bei IBM Consulting hatte ich das Glück, an mehreren Projekten mitzuarbeiten, um die verschiedenen Bedürfnisse der IBM-Kunden zu erfüllen. Während meiner Zeit bei IBM habe ich Technologien in verschiedenen Anwendungsfällen gesehen, die ich ursprünglich nie für möglich gehalten hätte, weshalb ich begeistert war, die Implementierung künstlicher Intelligenz zu betreuen, um eines der heimtückischsten gesellschaftlichen Probleme anzugehen, mit denen wir heute konfrontiert sind: rassistische Diskriminierung.
Als sich die Black Lives Matter-Bewegung 2020 im ganzen Land und weltweit ausbreitete, fragte ich mich sofort, ob meine Fähigkeit, Probleme für Klienten zu lösen, auf große gesellschaftliche Themen anwenden kann. Mit dieser Idee im Hinterkopf beschloss ich, nach Möglichkeiten zu suchen, mich dem Kampf für Rassengleichheit anzuschließen, und fand eine interne IBM-Community, die an Projekten arbeitete, die im Rahmen des Call for Code for Racial Justice veröffentlicht werden sollten.
Es gab zahlreiche Projekte, die innerhalb von IBM entwickelt wurden, aber ich fühlte mich zu einem bestimmten hingezogen, das sowohl eine implizite als auch eine explizite Voreingenommenheit zeigte. Dieses Projekt war TakeTwo und sollte eines von sieben Projekten werden, die vor etwas mehr als einem Jahr als externes Open-Source-Projekt veröffentlicht wurden. Das TakeTwo-Projekt nutzt Natural Language Understanding, um offene und subtile Verzerrung in schriftlichen Inhalten zu erkennen und zu beseitigen. Die Verwendung von TakeTwo zum Erkennen von Phrasen und Wörtern, die als rassistisch voreingenommen werden können, kann den Autoren von Inhalten dabei helfen, potenzielle Verzerrung beim Schreiben proaktiv zu entschärfen. Es ermöglicht dem Ersteller von Inhalten, die von ihm erstellten Inhalte vor der Veröffentlichung zu überprüfen, aktuell mithilfe eines Online-Texteditors. Man kann sich das wie ein Grammarly vorstellen, das potenziell rassistische Formulierungen aufspürt. TakeTwo ist darauf ausgelegt, Verzeichnisse inklusiver Begriffe zu nutzen, die von vertrauenswürdigen Quellen wie der Inclusive Naming Initiative zusammengestellt wurden.
TakeTwo hat mir nicht nur die Möglichkeit gegeben, mein Fachwissen in die Verbesserung des Projekts einzubringen, sondern auch die Gelegenheit, mich mit einigen impliziten rassistischen Verzerrungen auseinanderzusetzen, die ich vielleicht hatte, mir aber bisher nicht bewusst war. Die Arbeit an TakeTwo war eine großartige Möglichkeit, an einer Mission zu arbeiten, die für die Welt wichtig ist und gleichzeitig die Möglichkeit zur Selbstreflexion bietet.
Sehen Sie sich die Lösung in Aktion an:
Während der Arbeit an TakeTwo wurde sehr deutlich, dass die Lösung zwar darauf abzielt, Verzerrungen durch die Erfassung und Auswertung riesiger Datenmengen zu erkennen, dass es jedoch wichtig ist, zu erkennen, dass die Daten selbst implizite Verzerrungen enthalten können. Durch den Einsatz von Künstlicher Intelligenz und Open-Source-Technologien wie Python, FastAPI, JavaScript und CouchDB kann die TakeTwo-Lösung weiterhin die aufgenommenen Daten auswerten und besser erkennen, wenn darin Verzerrungen vorliegen. Zum Beispiel ist ein Wort oder eine Phrase, die in den Vereinigten Staaten akzeptabel ist, in Japan möglicherweise nicht akzeptabel – daher müssen wir uns dessen so gut wie möglich bewusst sein und unsere Lösung entsprechend funktionieren lassen. Als jemand, der sich leidenschaftlich für Data Science einsetzt, weiß ich aus erster Hand, dass unser Modell nur so gut ist wie die Daten, mit denen wir es füttern. In diesem Zusammenhang habe ich aus der Arbeit an diesem Projekt gelernt, dass wir bessere Datensätze brauchen, die uns helfen können, die Modelle des maschinellen Lernens (ML) zu trainieren, die diesen Systemen zugrunde liegen. Die Datensätze von Kaggle waren ein guter Ausgangspunkt für uns, aber wenn wir das Projekt ausweiten und Rassismus überall dort bekämpfen wollen, wo er existiert, benötigen wir vielfältigere Daten.
Die für Projekte wie diese erforderlichen Fähigkeiten gehen weit über Data Science hinaus. Besonders für dieses Projekt war es wichtig, Experten zu nutzen, die dabei helfen können, einige der kulturellen Nuancen der Sprache zu definieren, die ein System wie TakeTwo entweder kodifizieren oder ignorieren muss. Nur wenn wir disziplinübergreifend arbeiten, können wir eine praktikable Lösung finden.
Der Mehrwert, den ML und KI für die Verbesserung von Lösungen wie TakeTwo bieten, ist inspirierend. Von der Einstellung von Mitarbeitern bis hin zur Genehmigung eines Kredits bei der Bank: ML und KI durchdringen die Art und Weise, wie wir miteinander interagieren, und können dazu beitragen, dass wir bei der Entscheidungsfindung so viel Vorurteile wie möglich beseitigen. Als Technologen haben wir eine besondere Verantwortung, Modelle zu entwickeln, die ehrlich, unvoreingenommen sind und auf höchstem Niveau performen, damit wir deren Ausgabe vertrauen können.
Hier können Sie nachsehen, wie wir bei IBM bessere KI entwickeln. TakeTwo arbeitet kontinuierlich an der Weiterentwicklung und Stärkung seiner Effizienz, und auch Sie können dazu beitragen, dieses Open-Source-Projekt noch besser zu machen. Schauen Sie sich TakeTwo und alle anderen Projekte von Call for Code for Racial Justice noch heute an!
Dieser Beitrag ist Teil einer Serie während des Black History Month, die sich mit der Beziehung zwischen künstlicher Intelligenz und sozialer Gerechtigkeit befasst.
