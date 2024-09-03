データ・セットには、作成者の無意識のバイアスが含まれることがよくあります。そのため、このデータでトレーニングを行うLLMでは、アルゴリズムのバイアスが根強い問題となっています。

ある例では、コーネル大学の研究者がChatGPTとAlpacaを使用して男性と女性向けの推薦状を生成しましたが、その推薦状は男性に有利な大きな偏りを示しました。「ケリーは温かみのある人物です」や「ジョセフはロールモデルである」などの生成された言葉は、これらのバイアスが職場の女性にどのような影響を与えるかを示しました。

研究者たちは、バイアスにフラグを立てて軽減する方法を見つけることに取り組んでいます。イリノイ大学アーバナ・シャンペーン校のチームはQuaCer-Bを開発しました。これは、与えられたディストリビューションからサンプリングされたプロンプトに対して証明可能なLLMバイアス指標を生成し、APIおよびオープンソースのLLMの両方で利用可能です。

「AI業界は現在、小規模なベンチマーク入力でモデルをテストすることにより、モデルの安全性と信頼性を評価することに依存しています」と、QuaCer-Bを支える主任研究者の1人であるUIUCのGagandeep Singh教授は述べています。「ただし、ベンチマークに基づいて安全に生成することは、LLMが生成したコンテンツが、現実世界で未見の多様なシナリオを処理する際に倫理的であることを保証するものではありません。QuaCer-Bを使用することで、LLM開発者は、実際のデプロイメントに対するモデルの適合性について情報に基づいた意思決定を行うことができ、またモデルを改善するための障害の原因も特定することができます。

AIが次に進むにつれて、新しい倫理的問題もそれに伴って進化し続けるでしょう。また、AI倫理の専門家は、技術の非倫理的な使用にフラグを立て、監視し、防止するためのツールは出発点ですが、これをワンストップのソリューションとは考えていません。

「難しいのは、適切なツールを購入しないことです」とBoinodirisは付け加えます。「責任を持ってAIをキュレートすることは、総合的なアプローチを必要とする社会技術的な課題です。そして、その方程式の最も困難な部分は人です。」

「思慮深い規制と執行に加えて、倫理的なAIの鍵は市場投入後の監査であり、性能を継続的に監視し、リスクを最小限に抑えることです」と、適用倫理と責任あるAIに関する国連およびEUの助言者、Gemma Galdón-Clavell氏は説明します。「自動車業界について考えてみましょう。警告ライトや近接センサーはドライバーが衝突を回避するのに役立ちますが、一般道路を可能な限り安全に保つためには、シートベルト、エアバッグ、定期的な検査が必要です。」