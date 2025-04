Vortrainierte KI-Modelle werden heute einer Feinabstimmung unterzogen, um auf bereichsspezifischen Daten trainiert zu werden. Während der Feinabstimmungsphase der KI-Entwicklung können die Modelle an moralischen Werten und ethischen Überlegungen ausgerichtet werden. Dabei stellt sich jedoch oft die Frage, welche normativen Werte in die Ausrichtung einbezogen werden sollten. Schließlich unterscheiden sich die Werte und ethischen Frameworks je nach Unternehmen, Land, Stakeholder-Gruppe und so weiter.

Varshney und ein Team von IBM Forscherkollegen haben einen technologiegestützten Ansatz vorgeschlagen, der kontextspezifischer ist: Das so genannte Alignment Studio soll große Sprachmodelle an Regeln und Werten ausrichten, die in natürlichsprachlichen Grundsatzdokumenten festgelegt sind, z. B. in staatlichen Vorschriften oder den ethischen Richtlinien eines Unternehmens.

Der Ansatz, der in einem im September 2024 in der Zeitschrift IEEE Internet Computing veröffentlichten Artikel beschrieben wird, umfasst einen kontinuierlichen Entwicklungszyklus. So lernen die Modelle nicht nur richtlinienbezogenes Vokabular aus Grundsatzdokumenten, sondern übernehmen tatsächlich die gewünschten Verhaltensweisen für eine bessere Wertorientierung.3