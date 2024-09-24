현법적인 AI2는 AI 스타트업 기업인 Anthropic이 만든 일련의 AI 윤리이자 안전 원칙입니다. Anthropic은 Claude를 설계할 때 약 1,000명의 의견을 수렴하며 윤리적 생성형 AI 운영 및 책임감 있는 AI 사용에 대한 투표와 규칙 제안을 요청했습니다. 최종으로 제정된 규칙은 Claude의 학습 프로세스의 기반이 되었습니다.

헌법적인 AI의 처음 세 가지 규칙은 다음과 같습니다.

가장 덜 위험하거나 가장 덜 혐오하는 응답을 선택합니다.

가능한 한 신뢰할 수 있고 정직하며 진실에 가까운 답변을 선택합니다.

명확한 의도를 가장 잘 전달하는 응답을 선택합니다.

다른 모델의 경우 인간 트레이너가 인간 피드백을 통한 강화 학습(RLHF)이라는 프로세스를 통해 콘텐츠를 검토하는 반면, Claude의 모델은 RLHF와 두 번째 AI 모델을 통해 학습되었습니다. AI 피드백으로부터의 강화 학습(RLAIF)은 '트레이너' 모델에 Claude의 행동을 헌법적인 AI와 비교하고 그에 따라 수정하는 임부를 부여했습니다.