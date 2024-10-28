Ketika perusahaan teknologi menggelontorkan miliaran dolar untuk kecerdasan buatan, sebuah strategi yang berlawanan dengan intuisi mulai populer: memberikan kode. Peralihan menuju model AI sumber terbuka mencerminkan tekanan yang semakin besar untuk mengendalikan biaya pengembangan sekaligus mempercepat terobosan di bidang yang menuntut talenta dan daya komputasi berbiaya tinggi.
Lingkungan AI berubah karena perusahaan seperti IBM®, Meta, dan Mistral AI memanfaatkan pengembangan sumber terbuka, membuat teknologi AI canggih tersedia secara bebas bagi pengembang dan peneliti. Sementara pendekatan ini dapat mendemokratisasikan akses dan mempercepat terobosan melalui kolaborasi, para kritikus memperingatkan bahwa hal itu bisa memungkinkan aktor jahat menyalahgunakan atau memodifikasi teknologi untuk tujuan berbahaya.
Para pendukung menyatakan bahwa pengembangan AI sumber terbuka memungkinkan para peneliti dan pengembang di seluruh dunia untuk memeriksa, memodifikasi, dan meningkatkan teknologi. Pendekatan kolaboratif ini telah menghasilkan kemajuan signifikan dalam efisiensi model. Misalnya, model AI Granite 3.0 IBM® yang baru mencapai kinerja setara dengan sistem yang lebih besar, namun hanya membutuhkan sebagian kecil dari sumber daya komputasi.
IBM® merilis model Granite 3.0 sebagai perangkat lunak sumber terbuka di bawah lisensi Apache 2.0, mengambil pendekatan yang sangat berbeda dari para pengembang yang menjaga sistem AI mereka tetap privat. Perusahaan membangun modelnya menggunakan kumpulan data publik seperti GitHub Code Clean dan StarCoder, sehingga memungkinkan mereka menghindari masalah hak cipta yang telah memicu tuntutan hukum terhadap perusahaan AI yang melatih model mereka pada konten berhak cipta, seperti kasus News Corp saat ini melawan Perplexity.
Rilis ini mencakup model bahasa 8B dan 2B yang berfokus pada tugas-tugas perusahaan seperti generasi dengan dukungan pengambilan data dan klasifikasi, disertai varian khusus untuk instruksi dan pemantauan keamanan. Mendukung 116 bahasa pemrograman dan dilatih pada 3-4 terabyte token, model tersebut tersedia melalui berbagai platform, termasuk Hugging Face, GitHub, dan IBM® watsonx.ai. Model-model tersebut berkisar dari 3 hingga 34 miliar parameter dan dapat digunakan untuk riset maupun aplikasi komersial tanpa batasan dalam rilis sumber terbuka secara nominal.
"Memiliki keberagaman pemikiran dan berkontribusi sebagai bagian dari ekosistem terbuka ini merupakan proposisi yang jauh lebih menarik dibandingkan menjaga model kami tetap tertutup di dalam kotak," kata Kate Soule, Direktur Program Pabrik Data dan Model di IBM® Research. “Kami ingin komunitas menggunakannya.”
Gerakan sumber terbuka juga mendapatkan momentum di Eropa, di mana Mistral AI telah muncul sebagai pemimpin industri. Startup yang berbasis di Paris ini telah merilis model yang semakin mampu yang dapat diunduh dan dimodifikasi oleh pengembang dengan bebas.
Strategi sumber terbuka menciptakan pertukaran dua arah: perusahaan berbagi model AI yang hanya dapat dibangun oleh pihak dengan sumber daya besar, sekaligus memperoleh insight dari ribuan pengembang saat mereka menemukan kegunaan baru untuk teknologi tersebut. Membatasi akses, menurut banyak pihak sekarang, berarti kehilangan inovasi kolektif tersebut.
“Bayangkan ada beberapa perubahan kecil dan baru pada arsitektur model Anda yang, bahkan tanpa mengubah hal lain, akan secara signifikan meningkatkan kinerja secara keseluruhan,” kata Dave Bergmann, Penulis Senior di IBM® Think. “Jika Anda merilis model Anda hanya sebagai bobot terbuka dan menolak mengungkapkan informasi serta kode untuk arsitekturnya, Anda mungkin tidak akan pernah menyadari peluang yang ada di sana. Tetapi jika 20.000 orang meneliti kode model Anda, seseorang pasti akan melihatnya.
Peluncuran model Llama sumber terbuka dari Meta merupakan titik balik yang signifikan. Ini berarti salah satu perusahaan teknologi terbesar memberi para peneliti dan organisasi kecil akses ke teknologi AI canggih yang tidak akan pernah mampu mereka bangun secara mandiri.
“Kami pada dasarnya percaya bahwa AI sumber terbuka baik untuk semua orang, dimulai dengan para pengembang yang dapat mengambil model ini dan menyempurnakannya, melatihnya, menyaringnya, dan menggunakannya di mana pun mereka inginkan,” ujar Amit Sangani, Direktur Senior AI Partner Engineering di Meta, dalam pertemuan AI Alliance baru-baru ini. “Semakin terbuka AI, semakin transparan dan aman jadinya. Hal itu diteliti secara luas, dan itu merupakan sesuatu yang positif—karena ketika masalah ditemukan, komunitas, termasuk Meta, akan melakukan perbaikan.”
Terlepas dari kelebihannya, teknologi AI sumber terbuka tetap membawa sejumlah risiko. Beberapa pengamat menyatakan bahwa model AI sumber terbuka lebih mudah dimodifikasi untuk tujuan berbahaya, seperti menghasilkan disinformasi atau membuat malware. Tanpa kontrol terpusat, meskipun pengembang asli mengikuti standar etika yang ketat, versi model yang telah dimodifikasi belum tentu melakukan hal yang sama.
Meskipun demikian, peningkatan efisiensi yang ditunjukkan model seperti Granite 3.0 menunjukkan masa depan potensial di mana kemampuan AI menjadi lebih mudah diakses oleh organisasi dengan sumber daya terbatas. Bisnis kecil yang tidak mampu menjalankan model bahasa besar dapat menerapkan alternatif sumber terbuka yang lebih kecil dan lebih efisien, yang disesuaikan dengan kebutuhan spesifik mereka.
“Sumber terbuka akan memungkinkan lebih banyak inovasi di lebih banyak tempat,” kata Dave Nielsen, Direktur Komunitas AI Alliance. “Dan hal ini akan menghadirkan lebih banyak antusiasme bagi lebih banyak wirausahawan dan lebih banyak pelanggan, serta menciptakan lebih banyak pendapatan.”
