Innovation

Gesichtserkennung: KI-Systeme fairer und präziser machen

Sind Sie schon einmal unfair behandelt worden? Wenn ja, dann wissen Sie, dass sich das nicht gut anfühlt. Die meisten Menschen sind sich darin einig, dass eine faire Welt eine bessere Welt ist – und unsere KI-Forscher sehen das genauso. Und deshalb nutzen wir die Kraft der Wissenschaft, um KI-Systeme fairer und genauer zu machen.

Viele unserer jüngsten Entwicklungen haben bemerkenswerte Fortschritte gebracht und dafür gesorgt, das KI-Anwendungen immer anspruchsvollere und wichtigere Aufgaben erfüllen können. Beispiele dafür sind Übersetzungen in verschiedene Sprachen, um die Kommunikation zwischen unterschiedlichen Kulturen zu erleichtern, Verbesserungen komplexer Interaktionen zwischen Menschen und Maschinen oder die automatische Erkennung von Videoinhalten zur Unterstützung von Sicherheitsanwendungen.

Die Datenqualität ist entscheidend

Ein Großteil der Leistungsfähigkeit von KI kommt heute durch den Einsatz von immer präziseren datengetriebenen Deep-Learning-Optimierungseinheiten, die immer größere Datenmengen nutzen, um KI-Systeme zu trainieren. Die Stärke dieser Methode kann aber gleichzeitig auch eine Schwäche sein. Denn KI-Systeme lernen, was ihnen beigebracht wird. Werden sie nicht mit soliden und vielfältigen Datensätzen optimiert, kann die Genauigkeit leiden, die Ergebnisse verzerrt werden und damit auch die Fairness leiden. Deshalb müssen IBM, andere KI-Entwickler und die Forschungsgemeinschaft im Ganzen sehr genau darauf achten, welche Daten zu Trainingszwecken verwendet werden. IBM setzt sich für die Entwicklung von KI-Systemen ein, um die Welt fairer zu gestalten.

Vielfalt menschlicher Gesichter erschwert Erkennung

Die Herausforderung beim Training von Künstlicher Intelligenz zeigen sich besonders bei der Gesichtserkennung. Denn es ist gar nicht so einfach, Gesichtserkennungssysteme zu entwickeln, die in punkto Fairness unseren Erwartungen entsprechen. Der Kern des Problems liegt dabei nicht in der KI-Technologie selbst, sondern in der Art und Weise, wie die KI-gestützten Gesichtserkennungssysteme optimiert und trainiert werden. Um die gewünschten, immer exakteren Resultate zu erzielen, müssen die Trainingsdaten vielfältig sein und eine enorme Bandbreite an Informationen abdecken. Nur so kann die KI die Nuancen erkennen, durch die sich Gesichter in verschiedenen Situationen voneinander unterscheiden. Die Trainingsbilder müssen diese unterschiedlichen Gesichtsmerkmale der Gesichter widerspiegeln.

GesichtserkennungAber wie lässt sich die Vielfalt menschlicher Gesichter messen? Wir wissen, dass Gesichter durch Alter, Geschlecht oder Hautfarbe voneinander abweichen. Ein besonderer Fokus in der Gesichtserkennung liegt deshalb darauf, wie gut sie innerhalb dieser Merkmale unterscheiden kann. Studien zeigen allerdings, dass diese Merkmale nur ein kleiner Teil des Puzzles sind, das die Vielfalt menschlicher Gesichter charakterisiert. Dinge wie Gesichtssymmetrie, Ausdruck oder die Länge und Breite von Merkmalen wie Augen, Nase, Stirn und andere sind ebenfalls wichtig.

1 Million Bilder für eine faire Gesichtserkennung

IBM Research veröffentlicht heute einen neuen, umfangreichen Datensatz namens Diversity in Faces (DiF), um die Entwicklung einer genaueren und fairen Gesichtserkennung voranzutreiben. Als erster Datensatz seiner Art stellt DiF der globalen Forschungsgemeinschaft eine Million Bilder von menschlichen Gesichtern zur Verfügung. Mit öffentlich zugänglichen Bildern der YFCC-100M (Yahoo Flickr Creative Commons) wurden Gesichter nach zehn etablierten und unabhängigen Verfahren aus der wissenschaftlichen Literatur annotiert [1-10]. Die Kodierungsschemata beinhalten allgemeine objektive Maße des menschlichen Gesichts wie zum Beispiel so genannte kraniofaziale Merkmale (Länge des Kopfes und der Nase oder Breite der Stirn) sowie subjektivere Annotationen wie Alter und Geschlecht. Wir sind davon überzeugt, dass wir mit der Bereitstellung des DiF-Datensatzes die Entwicklung von genaueren und fairen KI-Gesichtserkennungssystemen beschleunigen können. Die heutige Veröffentlichung ist dafür der erste Schritt.

Der DiF-Datensatz und seine zehn Gesichtskodierungsschemata ist ein ausgezeichneter Ausgangspunkt für Wissenschaftler auf der ganzen Welt, die sich mit der Gesichtserkennung befassen. Die Schemata enthalten unter anderem die zuvor erwähnten kraniofazialen Messungen, Gesichtssymetrie, visuelle Attribute (Alter, Geschlecht) sowie Ausdruck und andere Elemente. Sie sind in der wissenschaftlichen Literatur anerkannt und bilden damit eine gute Grundlage für unser kollektives Wissen.

Unsere erste Analyse hat gezeigt, dass der DiF-Datensatz im Vergleich zu früheren Datensätzen eine ausgewogenere Verteilung und breitere Abdeckung an Gesichtern bietet. Darüber hinaus haben die Erkenntnisse aus der statistischen Analyse der Kodierungsschemata des Datensatzes unser eigenes Verständnis darüber gefördert, was für die Charakterisierung menschlicher Gesichter wichtig ist und es uns so ermöglicht, wichtige Forschungen zur Verbesserung der Gesichtserkennungstechnologie fortzusetzen.

Kollektives Wissen nutzen

Der Datensatz steht der globalen Forschungsgemeinschaft auf Anfrage zur Verfügung und IBM ist stolz darauf, ihn bereitstellen zu können. Unser Ziel ist es, die Forschung auf diesem Gebiet gemeinsam voranzutreiben und dazu beizutragen, dass KI-Systeme fairer werden.

Denn obwohl IBM Research sich der kontinuierlichen Erforschung und Untersuchung fairer Gesichtserkennungssysteme verschrieben hat, glauben wir nicht, dass wir es alleine schaffen können. Mit der heutigen Veröffentlichung fordern wir andere auf, dazu beizutragen und diese wichtige wissenschaftliche Agenda voranzutreiben.

Details und Zugriff auf den Datensatz gibt es hier: http://ibm.biz/dif-dataset

Add Comment
No Comments

Leave a Reply

Your email address will not be published.Required fields are marked *

More Innovation Stories

Data-Driven Creativity – Ein Blick in die Zukunft

In einer Zeit, in der Daten als neues Öl gehandelt werden, überrascht es nicht, dass Datenanalyse auch vermehrt Eingang in kreative Bereiche findet. Den Einsatz von Daten im Zusammenhang mit Kreativität umgibt seit einigen Jahren ein ausgeprägter Hype. Entsprechend polarisierend sind die Meinungen zu solchen Ansätzen. Während manche darin das Tor zu einem neuen Level […]

„Guten Tag, wie kann ich Ihnen behilflich sein?“ Über Welcome Agents im Einzelhandel

Eine möglichst effiziente Organisation von Wartezeiten macht in beratungsintensiven Verkaufsumgebungen den wesentlichen Unterschied in Sachen Kundenerlebnis. Die Anliegen sind dabei von Kunde zu Kunde unterschiedlich: Benötigt der Kunde eine ausführliche Beratung zu einem bestimmten Produkt oder möchte er lediglich seine Bestellung im Shop abholen? Beides typische Szenarien im Einzelhandel, die allerdings vollkommen unterschiedliche Anforderungen hinsichtlich […]

Wie ein WOL-Circle mir geholfen hat, meine Selbstwirksamkeit zu steigern

WOL – drei Buchstaben, fünf Prinzipien, zwölf Wochen. Derzeit scheint man als HR- oder New-Work-Interessent an dieser Abkürzung (für Working Out Loud) nicht vorbeizukommen. Es finden sich zahlreiche Artikel im Netz, in den sozialen Medien haben sich engagierte Communities gebildet und namhafte Traditionsunternehmen wie Bosch, Daimler, Siemens und BMW sind bekennende „WOLLER“. Als HR-Consultant mit […]