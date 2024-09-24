Constitutional AI2 ist eine Reihe von KI-Ethik- und Sicherheitsprinzipien, die vom KI-Startup-Unternehmen Anthropic entwickelt wurden. Bei der Entwicklung von Claude hat Anthropic etwa 1.000 Personen um ihre Meinung gebeten und sie gebeten, über Regeln für den ethischen Betrieb generativer KI und den verantwortungsvollen Einsatz von KI abzustimmen und Vorschläge zu unterbreiten. Die endgültige Zusammenstellung der Regeln bildete die Grundlage für den Trainingsprozess von Claude.

Die ersten drei Regeln der konstitutionellen KI lauten:

Wählen Sie die Antwort, die am wenigsten gefährlich oder hasserfüllt ist.

Wählen Sie die Antwort, die so zuverlässig, ehrlich und nah wie möglich an der Wahrheit ist.

Wählen Sie die Antwort, die klare Absichten am besten vermittelt.

Während bei anderen Modellen die Inhalte von menschlichen Trainern in einem Prozess namens Reinforcement Learning from Human Feedback (RLHF) überprüft werden, wurde Claude sowohl mit RLHF als auch mit einem zweiten KI-Modell trainiert. Das Reinforcement Learning from AI Feedback (RLAIF) beauftragte das „Trainer”-Modell damit, Claudes Verhalten mit dem der konstitutionellen KI zu vergleichen und entsprechend zu korrigieren.