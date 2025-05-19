Agar perangkat lunak dianggap sebagai sumber terbuka, siapa pun harus dapat menggunakan, mempelajari, memodifikasi, dan mendistribusikan kembali kode sumbernya sesuai keinginan mereka dan biasanya tanpa biaya. Namun, cakupan AI sumber terbuka jauh lebih luas daripada perangkat lunak sumber terbuka.

Sistem AI tidak hanya mencakup model AI itu sendiri, tetapi juga kumpulan data yang digunakan selama pelatihan, bobot dan parameter model, serta kode sumber. Kode sumber ini mencakup kode untuk memfilter dan memproses data pelatihan, kode untuk pelatihan dan pengujian model, pustaka pendukung apa pun, dan kode inferensi untuk menjalankan model. Semua komponen ini harus dipatuhi dan disediakan di bawah persyaratan AI sumber terbuka.

Definisi AI sumber terbuka OSI memungkinkan pengecualian data pelatihan non-publik yang tidak dapat dibagikan, seperti informasi identifikasi pribadi (PII).3 Untuk jenis data ini, deskripsi terperinci harus diberikan, termasuk asal, karakteristik dan ruang lingkupnya, bagaimana data dikumpulkan dan dipilih, prosedur pelabelan apa pun dan metode pemrosesan dan penyaringan data.4