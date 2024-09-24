ConstitutionalAI2は、AIスタートアップ企業のAnthropicによって開発された一連のAI倫理と安全原則です。Claudeを設計する際、Anthropicは約1,000人から意見を集め、倫理的な生成AIの運用と責任あるAIの使用に関するルールについて投票と提案を求めました。最終的にまとめられたルールが、Claudeのトレーニング・プロセスの基礎となっています。

憲法AIの最初の3つのルールは次のとおりです。

危険や憎悪が最も少ない応答を選択する。

できるだけ信頼性が高く、率直で、真実に近い回答を選択する。

明確な意図を最もよく伝える応答を選択する。

他のモデルでは、「人間のフィードバックによる強化学習（RLHF）」と呼ばれるプロセスで人間のトレーナーがコンテンツを検証しますが、ClaudeのモデルはRLHFに加えて2番目のAIモデルを使用してトレーニングされました。「AIフィードバックからの強化学習（RLAIF）」では、「トレーナー」モデルにClaudeの動作を憲法AIと比較し、それに応じて修正するというタスクを課しました。