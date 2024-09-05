カリフォルニア州を拠点とするSmarter Balanced Assessment Consortiumは、K-12および高等教育に携わる教育者にアセスメントシステムを提供する会員主導の公的機関です。2010 年に設立されたこの組織は、州の教育プログラム機関と提携して、革新的で標準に準拠したテスト アセスメント システムを開発しています。Smarter Balanced は、教育者が学習の機会を特定し、生徒の学習を強化するのに役立つ、形成的、暫定的、総括的なアセスメントを含むツール、レッスン、リソースで教育者をサポートします。
Smarter Balanced は、絶え間なく変化する教育の状況にあって、進化と革新に取り組んでいます。この組織は、IBM Consulting®との協力を通じて、教育アセスメントにおける人工知能 (AI) の使用のための原則的なアプローチを確立することを目指しています。2024年初頭に発表されたこのコラボレーションは、現在も継続中です。
標準化されたテストや構造化された問題など、幼稚園から高校までの生徒向けの従来のスキルアセスメントは、公平性に関するさまざまな理由から批判されています。AIが責任を持って導入された場合、社会から疎外されたグループを含む学生集団全体でのアセスメントの公平性を高めるために、パーソナライズされた学習と評価の経験を提供する変革の可能性を秘めています。したがって、中心的な課題は、学校環境における AI の責任ある実装とガバナンスがどのようなものであるかを定義することです。
その第一歩として、Smarter BalancedとIBM Consultingは、教育測定、人工知能、AIの倫理と政策の専門家、および教育者を含む学際的な諮問委員会を設立しました。この委員会の目標は、教育的測定や学習リソースとしてのAIの活用に正確さと公平性を埋め込むための指針となる原則を策定することです。諮問委員会の検討事項の一部を以下に概説します。
デザイン思考のフレームワークを活用することで、組織は人間中心のアプローチでテクノロジーを導入することができます。このデザイン思考は、ユーザー成果への重点、絶え間ない改革、多様なチームのエンパワーメントという 3 つの人間中心の原則によって導かれます。このフレームワークは、関係者が戦略的に連携し、機能的および非機能的な組織のガバナンス要件に対応できるようにするのに役立ちます。デザイン思考により、開発者と関係者はユーザーのニーズを深く理解し、革新的なソリューションを考案し、プロトタイプを反復的に作成できます。
この方法論は、開発プロセスの早い段階でリスクを特定して評価し、信頼性が高く効果的なAIモデルの作成を促進する上で非常に役立ちます。デザイン思考は、各分野の専門家やその他の関係者の多様なコミュニティと継続的に交流し、そのフィードバックを取り入れることで、技術的に健全で、社会的責任があり、人間中心のAIソリューションを構築するのに役立ちます。
Smarter Balanced プロジェクトのために、統合チームは、さまざまな分野の専門家や思想的リーダーの多様なセットを含むシンクタンクを設立しました。このグループは、教育アセスメントと法律の分野の専門家、神経多様性のある人々、学生、アクセシビリティの問題を持つ人々などで構成されていました。
「Smarter BalancedのAIシンクタンクは、AIが信頼に足る責任あるものであり、AIが学生のエクスペリエンスを向上させることを保証するものです」と、シンクタンクのメンバーで、マーク・キューバン財団のAIブートキャンプのプログラムアーキテクトであるシャーロット・ダンガンは述べています。
考察するタンクの目標は、メンバーの専門知識、視点、生きた経験をガバナンス フレームワークに単に「一回限り」の方法で組み込むことではなく、反復的に組み込むことです。このアプローチは、IBM の AI 倫理の主要原則を反映しています。つまり、AI の目的は人間の知能を増強することであり、置き換えることではありません。多様な関係者による継続的なインプット、評価、レビューを組み込んだシステムは、より信頼を醸成し、公平な結果を促進し、最終的にはより包括的で効果的な教育環境を生み出すことができます。
これらのシステムは、小学校において公平かつ効果的な教育アセスメントを生み出すために不可欠です。多様なチームは、すべての学生を代表するAIモデルの開発に不可欠な幅広い視点、経験、文化的洞察をもたらします。この包括性は、偏見を最小限に抑え、不注意で不平等を永続させたり、さまざまな人口統計グループの固有のニーズを見落としたりしない AI システムを構築するのに役立ちます。これは、IBMにおけるAI倫理のもう 1 つの重要な原則である、「AIのダイバーシティーの重要性は意見ではなく、数学である」を反映しています。
Smarter BalancedとIBM Consultingが共同で行った最初の取り組みの 1 つは、AIモデルに反映させたい人間の価値観を確かめることでした。これは新しい倫理的問題ではないため、IBMのAIの柱、つまりAIの基本的な特性に対応する一連の価値観と定義にたどり着きました。
どのような組織でも、これらの価値観を実践することは困難が伴います。学生のスキルセットを評価する組織では、基準はさらに高くなります。しかし、AIのメリットにより、この仕事は価値のあるものになっています。「生成AIを使用することで、学生の関心を高め、実行可能なフィードバックで学生を正確に評価し、AIツールで積極的に強化できる21世紀のスキルを構築する機会が得られます。つまり、創造性、批判的思考、コミュニケーション戦略、社会的感情に関する学習、成長マインドセットなどです」とダンガン氏は述べます。現在進行中の次のステップは、子どもや若い学習者の評価におけるAI活用の指標となる価値観を探求し、定義することです。
チームが取り組んでいる課題には次のものがあります。
この実践のために、私たちはLayers of Effectと呼ばれるデザイン思考フレームワークに取り組みました。これは、IBM® Design for AIがオープンソース コミュニティのDesign Ethicallyに提供したいくつかのフレームワークの 1 つです。Layers of Effectフレームワークは、関係者に製品やエクスペリエンスの一次効果、二次効果、三次効果を考慮するよう求めます。
このユースケースでは、AIで強化されたアセスメントシステムの（望ましい）一次効果は、教育システム全体の学習成果を向上させる、より公平で代表的かつ効果的なツールとなります。
二次効果には、効率性の向上や、最も必要とされる場所への情報のより適切な割り当てに役立つ関連データの収集などがあります。
三次効果は既知で意図しないものである可能性があります。ここで、関係者は、潜在的な不測の事態がどのようなものになるかを検討する必要があります。
チームは、潜在的に重大な危害を次の 5 つのカテゴリーに分類しました。
不均衡な影響アセスメントは、最初は訴訟に適用され、組織が潜在的なバイアスを特定するのに役立ちました。これらのアセスメントは、一見中立に見える政策や慣行が、人種、宗教、性別、その他の特性に基づく差別を受けやすいプロテクテッド・クラスの個人にどのように不均衡な影響を与える可能性があるかを示しています。このようなアセスメントは、雇用、融資、医療に関連する政策の策定に効果的であることが証明されています。当社の教育プログラムのユースケースでは、状況によりアセスメントから不公平な結果を経験する可能性のある生徒の集団を考慮に入れました。
潜在的な危害を最も受けやすいとされるグループは次のとおりです。
全体として、当社の次の一連の取り組みは、倫理的ハッキングなどのより多くのデザイン思考フレームワークを使用して、これらの危害を軽減する方法を探ることです。また、学生アセスメントでAIを活用しようとする組織の最低要件についても詳しく説明します。
これは、IBM と Smarter Balanced だけの問題ではなく、もっと大きな問題です。当社では、AIの新しい活用法を試みる方々が、モデルの意図しない影響を考慮するべきだと考え、プロセスを公表しています。当社は、教育プログラム用に構築されているAIモデルが、一部の人々だけでなく、社会全体のニーズに、そのすべてのダイバーシティーによって確実に応えられるように支援したいと考えています。
「私たちはこれを、原則的なアプローチを採用し、教育測定コミュニティがAIを採用するのに役立つ学生中心の価値観を開発する機会と捉えています。この取り組みで使用されているプロセスを詳細に説明することで、AIを活用した教育アセスメントを検討している組織が、教育測定における責任あるAIの使用について、より適切で詳細な対話ができるようにしたいと考えています。」
― Rochelle Michel氏、Smarter Balanced、副エグゼクティブプログラム責任者
