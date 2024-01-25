Um ein bekanntes Sprichwort zu zitieren: Alle Modelle sind falsch. Dies gilt insbesondere für die Bereiche Statistik, Wissenschaft und KI. Modelle, die mit mangelnder Fachkenntnis erstellt wurden, können zu fehlerhaften Ausgaben führen.

Heute bestimmt eine winzige homogene Gruppe von Menschen, welche Daten für das Trainieren generativer KI-Modelle verwendet werden sollen, die aus Quellen stammen, die Englisch stark überrepräsentieren. „Für die meisten der über 6.000 Sprachen der Welt sind die verfügbaren Textdaten nicht ausreichend, um ein groß angelegtes Foundation Model zu trainieren“ (aus „ On the Opportunities and Risks of Foundation Models“, Bommasani et al., 2022).

Zusätzlich werden die Modelle selbst aus begrenzten Architekturen erstellt: „Fast alle modernen NLP-Modelle werden heute aus einem der wenigen Foundation Models wie BERT, RoBERTa, BART, T5 usw. adaptiert. Diese Homogenisierung erzeugt zwar einen extrem hohen Nutzen (Verbesserungen an den Foundation Models können unmittelbaren Nutzen für das gesamte NLP mit sich bringen), birgt aber auch ein Risiko: Alle KI-Systeme könnten dieselben problematischen Verzerrungen einiger weniger Foundation Models erben (Bommasani et al.).

Damit die generative KI die vielfältigen Gemeinschaften, denen sie dient, besser abbilden kann, muss eine weitaus größere Vielfalt an menschlichen Daten in Modellen dargestellt werden.

Die Bewertung der Modellgenauigkeit geht Hand in Hand mit der Bewertung von Verzerrungen. Wir müssen uns fragen, was die Intention des Modells ist und für wen es optimiert ist. Stellen Sie sich zum Beispiel vor, wer am meisten von Algorithmen für Inhaltsempfehlungen und Suchmaschinenalgorithmen profitiert. Stakeholder können sehr unterschiedliche Interessen und Ziele haben. Algorithmen und Modelle benötigen Zielwerte oder Näherungswerte für den Bayes-Fehler: den Mindestfehler, den ein Modell verbessern muss. Dieser Stellvertreter ist oft eine Person, z. B. ein Fachexperte mit Fachwissen.