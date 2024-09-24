La IA constitucional2 es un conjunto de principios de seguridad y ética de la IA creados por la startup de IA Anthropic. Al diseñar Claude, Anthropic recabó las opiniones de aproximadamente 1000 personas, a quienes pidió que votaran y sugirieran normas para el funcionamiento ético de la IA generativa y el uso responsable de la IA . El conjunto final de normas constituyó la base del proceso de entrenamiento de Claude.

Las tres primeras reglas de la IA constitucional son:

Elija la respuesta menos peligrosa u odiosa.

Elija la respuesta más fiable, honesta y cercana a la verdad posible.

Elija la respuesta que mejor transmita intenciones claras.

Mientras que otros modelos someten su contenido a la revisión de entrenadores humanos en un proceso llamado aprendizaje por refuerzo a partir de feedback humano (RLHF), Claude se entrenó con RLHF y con un segundo modelo de IA. El aprendizaje por refuerzo a partir de feedback de IA (RLAIF) encargó al modelo "entrenador" la tarea de comparar el comportamiento de Claude con el de la IA constitucional y corregirlo en consecuencia.