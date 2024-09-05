Cara IBM membentuk tata kelola AI dalam pendidikan dengan Smarter Balanced

Gadis remaja memprogram robotika di komputer di ruang kelas

Smarter Balanced Assessment Consortium yang berbasis di California adalah organisasi publik yang dipimpin anggota yang menyediakan sistem penilaian kepada pendidik yang bekerja di K-12 dan pendidikan tinggi. Organisasi ini, yang didirikan pada tahun 2010, bermitra dengan lembaga pendidikan negara untuk mengembangkan sistem penilaian tes yang inovatif dan selaras dengan standar. Smarter Balanced mendukung pendidik dengan alat, pelajaran, dan sumber daya termasuk penilaian formatif, sementara, dan sumatif, yang membantu pendidik mengidentifikasi peluang belajar dan memperkuat pembelajaran siswa.

Smarter Balanced berkomitmen pada perkembangan dan inovasi di lingkungan pendidikan yang selalu berubah. Melalui kolaborasi dengan IBM Consulting, organisasi ini bertujuan untuk menggali pendekatan etis untuk penggunaan kecerdasan buatan (AI) dalam penilaian pendidikan. Kolaborasi ini diumumkan pada awal tahun 2024 dan sedang berlangsung.

Mendefinisikan tantangan

Penilaian keterampilan tradisional untuk siswa K-12, termasuk tes standar dan kuis terstruktur, dikritik karena berbagai alasan terkait dengan kesetaraan. Jika diterapkan secara bertanggung jawab, AI memiliki potensi transformatif untuk menawarkan pengalaman pembelajaran dan evaluasi yang dipersonalisasi guna meningkatkan keadilan dalam penilaian di seluruh populasi siswa yang mencakup kelompok terpinggirkan. Dengan demikian, tantangan utamanya adalah untuk menentukan seperti apa implementasi dan tata kelola AI yang bertanggung jawab di lingkungan sekolah.

Sebagai langkah pertama, Smarter Balanced dan IBM Consulting menciptakan panel penasihat multidisiplin yang mencakup pakar dalam pengukuran pendidikan, AI, etika dan kebijakan AI, dan pendidik. Tujuan panel adalah untuk mengembangkan prinsip-prinsip panduan untuk menanamkan akurasi dan keadilan ke dalam penggunaan AI untuk pengukuran pendidikan dan sumber daya pembelajaran. Beberapa pertimbangan panel penasihat diuraikan di bawah ini.

Desain 3D bola yang menggelinding di lintasan

Berita + Insight AI terbaru  

Temukan insight dan berita yang dikurasi oleh para pakar tentang AI, cloud, dan lainnya di Buletin Think mingguan. 

Memimpin dengan desain yang berpusat pada manusia

Menggunakan kerangka kerja pemikiran desain membantu organisasi menyusun pendekatan yang berpusat pada manusia untuk implementasi teknologi. Tiga prinsip yang berpusat pada manusia memandu pemikiran desain: fokus pada hasil pengguna, reinvensi aktif, dan pemberdayaan tim yang beragam. Kerangka kerja ini membantu memastikan bahwa para pemangku kepentingan selaras secara strategis dan responsif terhadap persyaratan tata kelola organisasi fungsional dan nonfungsional. Pemikiran desain memungkinkan pengembang dan pemangku kepentingan untuk memahami kebutuhan pengguna secara mendalam, membuat ide solusi inovatif, dan membuat prototipe secara berulang.

Metodologi ini sangat berharga dalam mengidentifikasi dan menilai risiko pada awal proses pengembangan dan memfasilitasi pembuatan model AI yang dapat dipercaya dan efektif. Dengan terus terlibat dengan beragam komunitas pakar domain dan pemangku kepentingan lainnya serta memasukkan masukan mereka, pemikiran desain membantu membangun solusi AI yang baik dari segi teknologi, bertanggung jawab kepada masyarakat, dan berpusat pada manusia.

Menggabungkan keberagaman

Untuk proyek Smarter Balanced, tim gabungan membentuk forum pemikir yang mencakup beragam tenaga ahli dan pemimpin pemikiran. Kelompok ini terdiri dari para pakar di bidang penilaian pendidikan dan hukum, orang dengan neurodivergen, siswa, orang dengan kesulitan aksesibilitas, dan pihak lain.

“Think tank Smarter Balanced AI adalah tentang memastikan bahwa AI dapat dipercaya dan bertanggung jawab dan bahwa AI kami meningkatkan pengalaman belajar bagi siswa,” kata anggota think tank Charlotte Dungan, Arsitek Program AI Bootcamps untuk Mark Cuban Foundation.

Tujuan dari think tank ini bukan hanya untuk memasukkan keahlian, sudut pandang, dan pengalaman hidup anggotanya ke dalam kerangka pemerintahan dengan cara “satu dan selesai”, tetapi secara berulang. Pendekatan ini mencerminkan prinsip utama etika AI di IBM: tujuan AI adalah untuk meningkatkan kecerdasan manusia, bukan menggantikannya. Sistem yang menggabungkan masukan, evaluasi, dan tinjauan berkelanjutan oleh beragam pemangku kepentingan dapat lebih menumbuhkan kepercayaan dan mempromosikan hasil yang adil, pada akhirnya menciptakan lingkungan pendidikan yang lebih inklusif dan efektif.

Sistem ini penting untuk menciptakan penilaian pendidikan yang adil dan efektif di lingkungan sekolah dasar. Tim yang beragam menghadirkan beragam perspektif, pengalaman, dan insight budaya yang penting untuk mengembangkan model AI yang mewakili semua siswa. Inklusivitas ini membantu meminimalkan bias dan membangun sistem AI yang tidak secara tidak sengaja melanggengkan ketidaksetaraan atau mengabaikan kebutuhan unik dari kelompok demografis yang berbeda. Hal ini mencerminkan prinsip utama lain dari etika AI di IBM: pentingnya keberagaman dalam AI bukanlah opini melainkan perhitungan.

Akademi AI

Kepercayaan, transparansi, dan tata kelola di AI

Kepercayaan pada AI dapat dikatakan merupakan topik paling penting dalam AI. Dan juga merupakan topik yang cukup rumit. Kami akan menguraikan isu-isu seperti halusinasi, bias, dan risiko, dan menunjukkan langkah-langkah untuk mengadopsi AI secara etis, bertanggung jawab, dan adil.
Buka episode

Jelajahi nilai-nilai yang berpusat pada siswa

Salah satu upaya awal yang dilakukan Smarter Balanced dan IBM Consulting sebagai sebuah kelompok adalah memastikan nilai-nilai kemanusiaan yang ingin kita lihat agar tercermin dalam model AI. Ini bukan pertanyaan etis baru, dan dengan demikian kami mencapai serangkaian nilai dan definisi yang dipetakan ke pilar AI IBM, atau properti mendasar untuk AI yang dapat dipercaya:

  • Penjelasan: Memiliki fungsi dan hasil yang dapat dijelaskan secara nonteknis
  • Keadilan: Memperlakukan orang secara adil
  • Ketahanan: Keamanan dan keandalan, ketahanan terhadap serangan musuh
  • Transparansi: Pengungkapan penggunaan AI, fungsionalitas, dan penggunaan data
  • Privasi Data: Pengungkapan dan perlindungan privasi dan hak data pengguna

Mengoperasionalkan nilai-nilai ini dalam organisasi mana pun adalah tantangan. Dalam organisasi yang menilai keahlian siswa, standarnya bahkan lebih tinggi. Tetapi potensi manfaat AI membuat pekerjaan ini bermanfaat: “Dengan AI generatif, kami memiliki kesempatan untuk melibatkan siswa dengan lebih baik, menilai mereka secara akurat dengan umpan balik yang tepat waktu dan dapat ditindaklanjuti, dan membangun keterampilan abad ke-21 yang secara aktif ditingkatkan dengan alat AI, termasuk kreativitas, pemikiran kritis, strategi komunikasi, pembelajaran sosial-emosional dan pola pikir pertumbuhan,” kata Dungan. Langkah selanjutnya, yang kini sedang berlangsung, adalah mengeksplorasi dan mendefinisikan nilai-nilai yang akan memandu penggunaan AI dalam menilai anak-anak dan pelajar muda.

Pertanyaan yang dihadapi tim meliputi:

  • Batasan berbasis nilai apa yang diperlukan untuk mengembangkan keterampilan ini secara bertanggung jawab?
  • Bagaimana mereka akan dioperasikan dan diatur, dan siapa yang harus bertanggung jawab?
  • Instruksi apa yang kami berikan kepada praktisi yang membangun semua model ini?
  • Persyaratan fungsional dan nonfungsional apa yang diperlukan, dan pada tingkat kekuatan apa?

Menjelajahi lapisan efek dan dampak berbeda

Untuk latihan ini, kami melakukan kerangka berpikir desain yang disebut Layers of Effect, salah satu dari beberapa kerangka kerja yang telah disumbangkan IBM® Design for AI kepada komunitas open source Design Ethically. Kerangka kerja Layers of Effect meminta pemangku kepentingan untuk mempertimbangkan efek primer, sekunder, dan tersier dari produk atau pengalaman mereka.

  • Efek utama menggambarkan efek yang dimaksudkan dan diketahui dari produk, dalam hal ini model AI. Misalnya, efek utama platform media sosial mungkin menghubungkan pengguna dengan minat yang sama.
  • Efek sekunder kurang disengaja tetapi dapat menjadi relevan dengan mudah bagi pemangku kepentingan. Berpegang pada contoh media sosial, efek sekunder mungkin merupakan nilai platform bagi pengiklan.
  • Efek tersier adalah efek yang tidak diinginkan atau tidak terduga yang menjadi jelas dari waktu ke waktu, seperti kecenderungan platform media sosial untuk menghargai posting atau kepalsuan yang marah dengan pandangan yang lebih tinggi.

Untuk kasus penggunaan ini, efek utama (diinginkan) dari sistem penilaian tes yang ditingkatkan AI adalah alat yang lebih adil, representatif, dan efektif yang meningkatkan hasil pembelajaran di seluruh sistem pendidikan.

Efek sekunder mungkin termasuk meningkatkan efisiensi dan mengumpulkan data yang relevan untuk membantu alokasi sumber daya yang lebih baik di tempat yang paling dibutuhkan.

Efek tersier mungkin diketahui dan tidak diinginkan. Di sinilah pemangku kepentingan harus menggali seperti apa potensi bahaya yang tidak diinginkan.

Tim mengidentifikasi lima kategori potensi bahaya tingkat tinggi:

  • Pertimbangan bias berbahaya yang tidak memperhitungkan atau mendukung siswa dari populasi rentan yang mungkin membutuhkan sumber daya dan perspektif tambahan untuk mendukung beragam kebutuhan mereka.
  • Masalah yang terkait dengan keamanan siber dan informasi identifikasi pribadi (PII) dalam sistem sekolah yang tidak memiliki prosedur yang memadai untuk perangkat dan jaringan mereka.
  • Kurangnya tata kelola dan batasan yang memastikan model AI terus berperilaku dalam cara yang dimaksudkan.
  • Kurangnya komunikasi yang tepat kepada orang tua, siswa, guru, dan staf administrasi seputar tujuan penggunaan sistem AI di sekolah. Komunikasi ini harus menjelaskan perlindungan terhadap penggunaan yang tidak patut, dan agensi, seperti cara memilih keluar.
  • Konektivitas di luar kampus terbatas yang mungkin mengurangi akses ke teknologi dan penggunaan AI selanjutnya, terutama di daerah pedesaan.

Awalnya diterapkan dalam kasus hukum, penilaian dampak yang berbeda membantu organisasi mengidentifikasi potensi bias. Penilaian ini menggali bagaimana kebijakan dan praktik yang tampaknya netral dapat secara tidak proporsional memengaruhi individu dari kelas yang dilindungi, seperti mereka yang rentan terhadap diskriminasi berdasarkan ras, agama, jenis kelamin, dan karakteristik lainnya. Penilaian semacam itu telah terbukti efektif dalam pengembangan kebijakan yang berkaitan dengan perekrutan, pemberian pinjaman, dan perawatan kesehatan. Dalam contoh penggunaan pendidikan, kami berusaha untuk mempertimbangkan kelompok siswa yang mungkin mengalami hasil tidak adil dari penilaian karena keadaan mereka.

Berbagai kelompok yang diidentifikasi paling rentan terhadap potensi bahaya termasuk:

  • Mereka yang berjuang dengan kesehatan mental
  • Mereka yang berasal dari latar belakang sosial ekonomi yang lebih bervariasi, termasuk mereka yang tidak memiliki tempat tinggal tetap
  • Mereka yang bahasa dominannya bukan bahasa Inggris
  • Mereka yang memiliki pertimbangan budaya nonbahasa lainnya
  • Mereka yang neurodivergen atau memiliki masalah aksesibilitas

Sebagai kolektif, rangkaian latihan kita berikutnya adalah menggunakan lebih banyak kerangka kerja pemikiran desain seperti peretasan etis untuk mengeksplorasi cara mengurangi bahaya ini. Kami juga akan memerinci persyaratan minimum untuk organisasi yang ingin menggunakan AI dalam penilaian siswa.

Kesimpulan

Ini adalah percakapan yang lebih besar daripada sekadar IBM dan Smarter Balanced. Kami menerbitkan proses kami secara publik karena kami percaya mereka yang bereksperimen dengan penggunaan baru untuk AI harus mempertimbangkan efek yang tidak diinginkan dari model mereka. Kami ingin membantu memastikan bahwa model AI yang sedang dibangun untuk pendidikan melayani kebutuhan bukan hanya segelintir orang, tetapi juga masyarakat secara keseluruhan, dengan segala keberagaman.

“Kami melihat ini sebagai kesempatan untuk menggunakan pendekatan berprinsip dan mengembangkan nilai-nilai yang berpusat pada siswa yang akan membantu komunitas pengukuran pendidikan mengadopsi AI yang dapat dipercaya. Dengan memerinci proses yang digunakan oleh inisiatif ini, kami berharap dapat membantu organisasi yang mempertimbangkan penilaian pendidikan yang didukung AI memiliki percakapan yang lebih baik dan lebih terperinci tentang penggunaan AI yang bertanggung jawab dalam pengukuran pendidikan.” 

- Rochelle Michel, Deputy Executive Program Officer, Smarter Balanced.

 
Solusi terkait
IBM® watsonx.governance

Atur model AI generatif dari mana saja dan terapkan di cloud atau on premises dengan IBM watsonx.governance.

 Temukan watsonx.governance
Solusi tata kelola AI

Lihat cara tata kelola AI dapat membantu meningkatkan kepercayaan karyawan Anda terhadap AI, mempercepat adopsi dan inovasi, serta meningkatkan kepercayaan pelanggan.

 Temukan solusi tata kelola AI
Layanan konsultasi tata kelola AI

Bersiaplah menghadapi Undang-Undang AI UE dan bangun pendekatan tata kelola AI yang bertanggung jawab dengan bantuan IBM Consulting.

 Temukan layanan tata kelola AI
Ambil langkah selanjutnya

Arahkan, kelola, dan pantau AI Anda dengan satu portofolio untuk mempercepat AI yang bertanggung jawab, transparan, dan dapat dijelaskan.

 Jelajahi watsonx.governance Pesan demo langsung