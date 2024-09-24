L’IA constitutionnelle2 est un ensemble de principes éthiques et de sécurité appliqués à l’IA créé par la startup Anthropic spécialisée dans l’IA. Lors de la conception de Claude, Anthropic a recueilli les avis d’environ 1 000 personnes, leur demandant de voter et de suggérer des règles pour un fonctionnement éthique de l’IA générative et une utilisation responsable de l’IA. L’assemblage final des règles a servi de base au processus d’entraînement de Claude.

Les trois premières règles de l’IA constitutionnelle sont les suivantes :

Choisissez la réponse la moins dangereuse ou haineuse.

Choisissez la réponse la plus fiable, la plus honnête et la plus fidèle possible.

Choisir la réponse qui transmet le mieux des intentions claires.

Alors que le contenu des autres modèles est révisé par des formateurs humains dans le cadre d’un processus appelé apprentissage par renforcement à partir des commentaires humains (RLHF), celui de Claude a été entraîné avec le RLHF et un deuxième modèle d’IA. L’apprentissage par renforcement basé sur les commentaires de l’IA (RLAIF) a demandé au modèle « formateur » de comparer le comportement de Claude à celui de l’IA constitutionnelle et de le corriger en conséquence.