Diagram alur minimal dengan tiga cabang pesan ke bentuk abu-abu muda
Ikhtisar

Tata kelola AI adalah kemampuan untuk memantau dan mengelola aktivitas AI dalam suatu organisasi. Ini mencakup proses dan prosedur untuk melacak dan mendokumentasikan asal data dan model yang diterapkan dalam perusahaan; serta teknik yang digunakan untuk melatih, memvalidasi, dan memantau keakuratan model yang berkelanjutan. Tata kelola AI yang efektif memberikan tiga hasil utama bagi perusahaan:

  • Kepatuhan. Membantu memastikan bahwa solusi AI dan keputusan yang disampaikan AI konsisten dengan praktik yang diterima industri, standar peraturan, dan persyaratan hukum.

  • Kepercayaan. Memungkinkan kepercayaan pada keputusan yang disampaikan oleh AI dengan membantu memastikan bahwa model AI dapat dijelaskan, dan adil.

  • Efisiensi. Meningkatkan kecepatan menuju pasar dan mengurangi biaya pengembangan AI dengan menstandarisasi dan mengoptimalkan praktik pengembangan dan penerapan AI.

Perusahaan yang tidak mengadopsi tata kelola AI berisiko banyak konsekuensi negatif. Proses machine learning bersifat iteratif dan membutuhkan kolaborasi. Tanpa tata kelola dan dokumentasi yang baik, ilmuwan data atau validator tidak dapat memastikan silsilah data suatu model atau bagaimana model tersebut dibangun. Menghasilkan hasil dapat menjadi tantangan untuk direproduksi. Jika administrator melatih model menggunakan data yang salah atau tidak lengkap, pekerjaan berbulan-bulan dapat hancur.

Kekurangan tata kelola AI juga dapat mengakibatkan hukuman yang signifikan. Operator bank telah dikenakan denda tujuh digit karena menggunakan model bias saat menentukan kelayakan pinjaman. UE berencana untuk menambahkan peraturan AI ke Peraturan Perlindungan Data Umum (GDPR). Pelanggaran GDPR saat ini dapat "mengakibatkan denda hingga €20 juta, atau 4% dari pendapatan tahunan perusahaan di seluruh dunia dari tahun keuangan sebelumnya, mana saja yang lebih tinggi."

Reputasi merek juga berisiko. Satu percobaan menggunakan perangkat lunak AI untuk mempelajari pola bicara anak muda di media sosial. Pejabat administratif segera menghapus perangkat lunak tersebut setelah troll internet "mengajarkan" alat tersebut untuk membuat postingan yang bernada rasis, seksis, dan anti-Semit.

 

Arsitektur Konseptual



Ilustrasi diagram alur yang menampilkan komponen utama dan interkoneksinya untuk solusi Pencarian Generatif
Pengguna dan komponen utama dari solusi tata kelola AI perusahaan dan interkoneksi mereka. Termasuk komponen kunci dari Tata Kelola Model, dan Pemantauan Model.

Diagram di atas menunjukkan komponen utama dari solusi tata kelola AI untuk solusi AI generatif menggunakan model bahasa besar (LLM).

Tata Kelola Model adalah pusat clearinghouse untuk tata kelola AI. Ini menyediakan dasbor, laporan, dan kemampuan peringatan yang digunakan oleh staf perusahaan untuk memastikan, mengaudit, dan melaporkan bahwa model AI memenuhi persyaratan untuk keadilan, transparansi, dan kepatuhan. Komponen Tata Kelola Model juga memungkinkan perusahaan untuk menetapkan kriteria gating dan kebijakan lain yang mempengaruhi kapan dan bagaimana model pindah dari pengembangan ke produksi.

Pemantauan Model secara aktif memantau hasil model untuk memastikan bahwa model dapat dijelaskan, adil, dan sesuai dengan peraturan, dan tetap demikian ketika mereka diterapkan. Jika model mulai melayang atau menunjukkan bias dalam outputnya, komponen Pemantauan Model menandainya untuk diselidiki oleh staf operasi AI.

Panduan Konseptual

Diagram di bawah ini membahas interaksi komponen tingkat tinggi untuk memberikan tata kelola AI perusahaan.

Diagram alur kerja tata kelola AI perusahaan yang menampilkan pengiriman melalui interaksi komponen tingkat tinggi Panduan solusi tata kelola AI yang menunjukkan aliran informasi dan interaksi antara komponen untuk pengembangan model dan pemantauan berkelanjutan.
  1. Anggota tim tata kelola perusahaan menggunakan komponen Tata Kelola Model untuk (i) memvisualisasikan model AI (dasar dan non-dasar) yang diterapkan di dalam perusahaan di seluruh infrastruktur pribadi, hyperscalers, dan platform berbasis cloud, dan (ii) menetapkan kriteria operasi minimum dan kebijakan lain untuk model yang akan diterapkan dan dioperasikan di dalam perusahaan. Kriteria dan kontrol kebijakan disebarkan ke komponen Pemantauan Model untuk pemantauan dan peringatan selanjutnya.

  2. Prompt Pengembang Model melakukan prompt tuning model bahasa besar (LLM) dan mengevaluasi respons model terhadap prompt pengujian. Hasil tes ini, bersama dengan statistik ringkasan, ditangkap dan disebarkan ke komponen Pemantauan Model di mana mereka direkam untuk memberikan model dan silsilah data.

  3. Seorang Validator Model melakukan ulasan hasil penyetelan dan pengujian dan, dengan bantuan komponen Pemantauan Model, membandingkannya dengan kriteria dan kontrol gating yang ditetapkan oleh tim tata kelola perusahaan. Setelah kriteria dan kontrol terpenuhi, model disetujui untuk digunakan dalam produksi.

  4. Pengembang Model menggunakan komponen Pemantauan Model untuk memantau kinerja model dari waktu ke waktu; khususnya, Pengembang berusaha memastikan bahwa respons model terus memenuhi kriteria perusahaan untuk keadilan (kurangnya bias), akurasi (respons yang benar), dan transparansi (respons yang dapat dijelaskan).

  5. Komponen Pemantauan Model terus memantau model AI yang diterapkan (model dasar/generatif serta model machine learning 'tradisional') untuk menangkap statistik akurasi dan kinerja.

  6. Komponen Pemantauan Model juga menangkap prompt pengguna dan respons model untuk (i) menjaga lebih lanjut terhadap penyimpangan model (penyimpangan dalam bias dan/atau akurasi model), dan (ii) untuk menangkap data uji dan membantu mengidentifikasi area topik atau domain data yang akan diuntungkan oleh penyetelan tambahan.

Arsitektur Produk IBM

IBM Product Solution Today

 

Pemetaan IBM watsonx.governance saat ini, dan solusi IBM OpenPages untuk model konseptual ditunjukkan pada diagram di bawah ini. Model dasar yang berjalan di platform watsonx.ai, on premises, pada infrastruktur berbasis cloud, atau platform AI pihak ketiga seperti Amazon Sagemaker, dipantau pada saat dijalankan oleh watsonx.governance. watsonx.governance juga menyediakan kemampuan untuk membuat, memperbarui, dan mengelola kartu model, yang dikenal sebagai AI Factsheet dalam watsonx.governance, dan menangkap dan melaporkan metrik kinerja model. Modul Manajemen Risiko Model IBM OpenPages menyediakan kemampuan pelaporan dan manajemen risiko, serta Tata Kelola Model untuk kemampuan manajemen kebijakan pengembangan dan penerapan model.

Diagram pemetaan mode konseptual IBM Watsonx.Governance dan solusi IBM OpenPages
Ilustrasi bagaimana IBM OpenPages dan IBM watsonx.governance cocok dengan solusi; memberikan kemampuan Tata Kelola Model dan Pemantauan Model masing-masing.

Tata kelola solusi AI generatif mirip dengan tata kelola model AI 'tradisional' tetapi kemampuan generatifnya memerlukan pengelolaan input dan output model yang lebih dekat daripada model tradisional untuk melindungi dari prompt yang tidak pantas atau berbahaya, dan untuk memastikan bahwa model menghasilkan hasil yang benar secara faktual dan dapat diterima. Bagian ini menggambarkan bagaimana IBM watsonx.governance diterapkan pada model dasar dalam dua contoh penggunaan inti: manajemen siklus hidup model, dan risiko model dan kepatuhan terhadap peraturan.

Manajemen Siklus Hidup Model

Diagram proses siklus hidup model IBM watsonx.governance
Diagram di atas menggambarkan bagaimana watsonx.governance digunakan untuk mengelola siklus hidup model dari pengujian awal dan validasi hingga data

Diagram di atas menggambarkan bagaimana watsonx.governance digunakan untuk mengelola siklus hidup model dari pengujian awal dan validasi hingga penerapan.

  1. Pengembang Model melakukan prompt tuning model di solusi lokal watsonx.ai, layanan watsonx.ai, atau pada platform lokal atau berbasis cloud lainnya dan mengembangkan serta menguji prompt terhadapnya.

  2. Prompt dan data respons model, bersama dengan metrik kinerja model seperti ROUGE, SARI, Chrf, dan BLEU, ditangkap di watsonx.governance fungsi manajemen inventaris model. Beberapa versi prompt dan data respons diambil untuk memungkinkan perbandingan silang dan pemilihan model serta kombinasi prompt yang paling sesuai dengan kebutuhan perusahaan.

  3. Validator Model meninjau hasil dari prompt individu dan kombinasi model dan memilih versi yang akan disetujui untuk penerapan ke produksi.

  4. Pengembang Model menggunakan kemampuan yang sama untuk melacak kombinasi model/prompt dan kinerjanya untuk contoh penggunaan bisnis tertentu.

Risiko Model dan Kepatuhan Peraturan

Panduan komponen untuk risiko model dan kepatuhan peraturan dalam watsonx.governance ditunjukkan di bawah ini.

Diagram risiko model dan kepatuhan regulasi IBM watsonx.governance
Panduan solusi yang menunjukkan interaksi pengguna dan komponen lain dengan IBM OpenPages dan IBM watsonx.governance untuk mengelola risiko model dan mempertahankan kepatuhan terhadap peraturan.
  1. Anggota tim tata kelola AI perusahaan menentukan dan menetapkan kriteria, ditentukan sebagai variasi minimum, maksimum, dan yang diizinkan dari metrik model seperti ROUGE, yang harus dipenuhi oleh model dalam produksi. Kriteria ini ditetapkan dalam alat Manajemen Risiko Model IBM OpenPages dan kemudian disebarkan ke watsonx.governance.

  2. Pengembang Model melakukan prompt tuning dan mengembangkan prompt pengujian terhadap model dasar yang diterapkan dalam solusi watsonx.ai, layanan watsonx.ai, atau pada solusi lokal atau berbasis cloud lainnya seperti Sagemaker.

  3. Informasi prompt dan data respons model, bersama dengan metrik kinerja model, disebarkan ke watsonx.governance di mana metrik dibandingkan dengan ambang batas yang ditetapkan oleh tim tata kelola.

  4. Hasil perbandingan metrik disebarkan ke IBM OpenPages untuk ulasan dan pelaporan oleh tim tata kelola. Secara khusus, jika kombinasi prompt/model memenuhi semua kriteria yang ditetapkan, maka dapat ditandai sebagai siap untuk diproduksi, atau tidak memiliki risiko. Jika model hanya memenuhi beberapa kriteria, maka model tersebut dapat ditandai sebagai model yang berpotensi berkinerja buruk dan belum layak untuk diproduksi, tergantung pada seberapa ketat tim tata kelola membuat kebijakan.

Keputusan dan Pertimbangan Arsitektur

Pastikan mekanisme untuk mengoperasionalkan AI dengan Keyakinan. Sangat penting untuk mengevaluasi model selama pengembangan dan penerapan bahwa respons dari LLM bukanlah hasil dari halusinasi dan tanpa kata-kata kotor kebencian. Pastikan tanggapan LLM dapat dijelaskan, etis, tepercaya dan tidak bias. Metrik kualitas untuk LLM sangat berbeda dari model AI tradisional yang memiliki kemampuan bagi ilmuwan data untuk memilih metrik yang tepat secara konsisten.

Solusi AI Generatif yang diterapkan harus konsisten tanpa bias atau penyimpangan apa pun yang diperkenalkan dari waktu ke waktu. Tidak jarang melihat Perusahaan menggunakan berbagai LLM di berbagai cloud, memungkinkan tata kelola terpusat secara keseluruhan adalah penting. Memiliki pendekatan tata kelola di berbagai lingkungan penerapan di beberapa cloud adalah pertimbangan utama.

Memastikan mereka menerapkan aplikasi AI Generatif yang terbaru dan sesuai dengan peraturan industri yang terus berkembang. Mendapatkan visibilitas semua model dan kesehatan yang diterapkan perusahaan dalam satu tampilan.

Pastikan tidak ada kata-kata kotor untuk penyalahgunaan kebencian yang digunakan dalam data pelatihan. Juga mampu untuk mengganti rugi perusahaan dari penggunaan data kepemilikan apa pun sementara memastikan tidak ada data PII atau IP yang bocor. Mampu melakukan audit dan mendapatkan silsilah data untuk solusi AI Generatif adalah kuncinya.

 

Ini menguraikan bagaimana model RAG diterapkan secara menyeluruh dengan kemampuan pemantauan dan tata kelola di sepanjang siklus hidup. Selain Tata Kelola Model, Tata Kelola Data juga penting. Kami menunjukkan bagaimana memanfaatkan komponen IBM watsonx.governance seperti AI OpenScale, FactSheets, dan IBM Open Pages, kami dapat memastikan aplikasi AI Generatif dikelola dan diatur. IBM Watson Knowledge Catalog memungkinkan manajemen data yang tepat termasuk pengkatalogan data, silsilah data, manajemen data PII.

Langkah selanjutnya

Bicara kepada kami tentang tata kelola AI.

Cara lain untuk menjelajahi Pusat Arsitektur Hybrid Cloud Alat diagram dan templat Kerangka Kerja IBM Well-Architected
Kontributor

Janki VoraMihai Criveti , Chris Kirby

Diperbarui: 12 Desember 2023