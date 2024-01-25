私たちは皆、IBMのテクノロジーに反映された理想的な人間の価値観を知りたいと思っています。私たちは、人工知能（AI）などのテクノロジーが、私たちに嘘をつかず、差別的でなく、私たちや子供たちにとって安全に利用できるものであることを期待しています。しかし、多くのAI作成者は現在、モデルで明らかになったバイアス、不正確さ、問題のあるデータの使用に対して、反発に直面しています。これらの問題には、技術的、アルゴリズム的、またはAIベースのソリューションだけでは不十分です。実際には、総合的で社会技術的なアプローチが必要となります。
AIを含むすべての予測モデルは、多様な人間の知性とエクスペリエンスを組み込むと、より正確になります。これは意見ではありません。経験的な妥当性を持っています。ダイバーシティー予測定理について考えてみましょう。簡単に言えば、グループ内のダイバーシティーが大きい場合、群衆のミスは小さく、これは「群衆の叡智」という概念をサポートするものです。影響力のある研究では、能力の低い問題解決者の多様なグループが、能力の高い問題解決者のグループよりも優れていることが示されました（Hong & Page、2004）。
数学的言語では、分散が広いほど平均が標準的になります。これを数式で表すと次のようになります。
ここで、
c = 群衆の平均予測
𝜽 = 実際の値
si = 個人の予測 i番目 個体
n= 個体数
さらなる研究により、他のメンバーの予測に無知であることや、予測や判断が極端に異なる（負の相関を持つ）人々を含むなど、賢明な群衆の統計的定義を洗練させる計算が行われた。つまり量だけでなくダイバーシティーが予測を改善します。この洞察はAIモデルの評価にどのような影響を与える可能性があるのでしょうか。
一般的な格言を引用すると、すべてのモデルは間違っています。統計、科学、AIの分野でも同じことが言えます。ドメインの専門知識が不足している状態で作成されたモデルは、誤ったアウトプットにつながる可能性がある。
現在、少数の同種の人々が、生成AIモデルのトレーニングにどのようなデータを使用するかを決定しています。データは、英語を大幅に超過するソースから抽出されています。「世界中の6,000を超える言語のほとんどでは、利用可能なテキスト・データは大規模な基盤モデルをトレーニングするのに十分ではありません」（「基盤モデルの機会とリスクについて」、Bommasaniら、2022年から）。
さらに、モデル自体も限定的なアーキテクチャーから作成されています。「最先端のNLPモデルのほとんどすべてが、BERT、RoBERTa、BART、T5など、少数の基盤モデルのいずれかをベースに適応させています。この均一化は非常に高い活用率を生み出します（基盤モデルの改善は、すべてのNLPで即座にメリットにつながります）が、欠点でもあります。すべてのAIシステムは、いくつかの基盤モデル（Bommasani et al. など）の同じ問題のあるバイアスを引き継いでいる可能性があります。」
生成AIがサービスを提供する多様なコミュニティーをより適切に反映するには、はるかに多様な人間のデータをモデルで表現する必要があります。
モデルの精度の評価は、バイアスの評価と密接に関係しています。そのモデルの意図は何か、誰のために最適化されているかを考えなければなりません。たとえば、コンテンツ推奨アルゴリズムと検索エンジン・アルゴリズムから最もメリットを受けるのは誰かを考えてみましょう。利害関係者の興味や目標は大きく異なる場合があります。アルゴリズムとモデルには、ベイズエラー、つまりモデルが改善する必要がある最小エラーのターゲットまたはプロキシーが必要です。このプロキシーは、多くの場合、ドメインの専門知識を持つ対象分野の専門家などの人物です。
新しいAI規制や行動計画では、アルゴリズムの影響アセスメントフォームの重要性がますます浮き彫りになっています。これらのフォームの目的は、AIモデルに関するクリティカルな情報を収集し、ガバナンス・チームがAIモデルをデプロイする前にリスクを評価して対処できるようにすることです。一般的な質問には以下が含まれます。
善意を持って設計されているものの、問題は、ほとんどのAIモデル所有者がユースケースのリスク評価方法を理解していないということです。「個人情報（PII）を収集していないのに、モデルはどのように不公平なのか？」などはよくある質問です。その結果、ガバナンス・システムがリスク要因に正確にフラグを立てるために必要な配慮が行き届いていることはほとんどありません。
したがって、このソリューションの社会技術的な性質が強調されるのです。モデル所有者（個人）に、そのユースケースが害を及ぼすかどうかを評価するためのチェックボックスのリストを単純に与えることはできません。代わりに、広く異なるエクスペリエンスを持つ人々が、心理的安全を提供するコミュニティーに集まり、異種の影響について困難な会話を行うことが必要です。
IBM®は、「クライアント・ゼロ」アプローチを採用し、コンサルティングと製品主導のソリューション全体で、自社のクライアント向けの推奨事項とシステムを実装することを信条としています。このアプローチは倫理的実践にまで及ぶため、IBMは信頼できるAIセンター・オブ・エクセレンス（COE）を設立しました。
上で説明したように、AIの影響を適切に評価するには、経験とスキルセットの多様性が重要です。しかし、AIイノベーター、専門家、著名なエンジニアがひしめく企業では、センター・オブ・エクセレンスに参加することは不安を感じてしまう可能性があるため、心理的セーフティーのコミュニティーを育成する必要があります。IBMはこれを明確に伝えています。「AIに興味がありますか？AI倫理にご関心がある場合あなたはこのテーブルに座っています。」
COEは、あらゆるレベルの実務家にAI倫理に関する研修を提供しています。同期学習（授業環境での教師と生徒）と非同期学習（セルフガイド型）プログラムの両方が提供されます。
しかし、COEの応用トレーニングこそが、実際のプロジェクトでグローバルで多様な学分野にわたるチームと協力して異種の影響をより深く理解する中で、実務担当者に最も深い洞察を提供します。また、IBMのDesign for AIグループが社内やクライアントと使用しているデザイン思考のフレームワークを活用し、疎外されがちな人々を念頭に置きながら、AIモデルの意図しない影響を評価します。(個人の特性がどのように交錯して人々を特権化したり疎外したりするかについては、シルヴィア・ダックワースの「Powerと特権の輪」を参照のこと)。IBMはまた、多くのフレームワークをオープンソースコミュニティのDesign Ethicallyに寄贈しました。
以下は、これらのプロジェクトに関してIBMが公開したレポートの一部です。
AIモデルのパフォーマンスに関する重要な洞察を収集するには、自動化されたAIモデル・ガバナンス・ツールが必要です。ただし、モデルが開発され、本番環境に稼働するかなり前にリスクを捉えることが最適であることに注意してください。多様で学際的な実践者のコミュニティーを作成し、人々が異種の影響について厳しい会話を行うための安全なスペースを提供することで、原則の運用化と責任あるAI開発への旅を始めることができます。
実際に、AI実践者を採用する際には、モデルを作成する上での労力の70％以上が、適切なデータをキュレートすることであることを考慮してください。代表的でかつ同意を得たデータの収集方法を知っている人を雇用したいと考えています。また、専門家が正しいアプローチを持っていることを確認して、ドメインの専門家と緊密に連携することを望んでいます。これらの実務者が、謙虚さと識別力を備えて責任を持ってAIをキュレートするという課題に取り組むためのエモーショナル・インテリジェンス（感情知能）を手に入れられることは重要です。AIシステムが人間の知性を補強するのと同じくらい、どのように、いつ不平等を悪化させるかを認識する方法を意図的に学ぶ必要があります。
生成AIがもたらす新たな課題、AIモデルおよびMLモデルを制御する必要性、信頼性と透明性を高めた説明可能なAIフレームワークを構築する手順をご紹介します。
IBM watsonx.governanceを使用すれば、生成AIモデルをあらゆる場所から管理したり、クラウドまたはオンプレミスにデプロイしたりできます。
AIガバナンスが、どのように従業員のAIに対する信頼向上や、導入とイノベーションの加速、顧客からの信頼向上に役立つかをご覧ください。
IBMコンサルティングを活用して、EUのAI法に備え、責任あるAIガバナンスに取り組みましょう。