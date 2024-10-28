IBM® merilis model Granite 3.0 sebagai perangkat lunak sumber terbuka di bawah lisensi Apache 2.0, mengambil pendekatan yang sangat berbeda dari para pengembang yang menjaga sistem AI mereka tetap privat. Perusahaan membangun modelnya menggunakan kumpulan data publik seperti GitHub Code Clean dan StarCoder, sehingga memungkinkan mereka menghindari masalah hak cipta yang telah memicu tuntutan hukum terhadap perusahaan AI yang melatih model mereka pada konten berhak cipta, seperti kasus News Corp saat ini melawan Perplexity.

Rilis ini mencakup model bahasa 8B dan 2B yang berfokus pada tugas-tugas perusahaan seperti generasi dengan dukungan pengambilan data dan klasifikasi, disertai varian khusus untuk instruksi dan pemantauan keamanan. Mendukung 116 bahasa pemrograman dan dilatih pada 3-4 terabyte token, model tersebut tersedia melalui berbagai platform, termasuk Hugging Face, GitHub, dan IBM® watsonx.ai. Model-model tersebut berkisar dari 3 hingga 34 miliar parameter dan dapat digunakan untuk riset maupun aplikasi komersial tanpa batasan dalam rilis sumber terbuka secara nominal.

"Memiliki keberagaman pemikiran dan berkontribusi sebagai bagian dari ekosistem terbuka ini merupakan proposisi yang jauh lebih menarik dibandingkan menjaga model kami tetap tertutup di dalam kotak," kata Kate Soule, Direktur Program Pabrik Data dan Model di IBM® Research. “Kami ingin komunitas menggunakannya.”

Gerakan sumber terbuka juga mendapatkan momentum di Eropa, di mana Mistral AI telah muncul sebagai pemimpin industri. Startup yang berbasis di Paris ini telah merilis model yang semakin mampu yang dapat diunduh dan dimodifikasi oleh pengembang dengan bebas.

Strategi sumber terbuka menciptakan pertukaran dua arah: perusahaan berbagi model AI yang hanya dapat dibangun oleh pihak dengan sumber daya besar, sekaligus memperoleh insight dari ribuan pengembang saat mereka menemukan kegunaan baru untuk teknologi tersebut. Membatasi akses, menurut banyak pihak sekarang, berarti kehilangan inovasi kolektif tersebut.

“Bayangkan ada beberapa perubahan kecil dan baru pada arsitektur model Anda yang, bahkan tanpa mengubah hal lain, akan secara signifikan meningkatkan kinerja secara keseluruhan,” kata Dave Bergmann, Penulis Senior di IBM® Think. “Jika Anda merilis model Anda hanya sebagai bobot terbuka dan menolak mengungkapkan informasi serta kode untuk arsitekturnya, Anda mungkin tidak akan pernah menyadari peluang yang ada di sana. Tetapi jika 20.000 orang meneliti kode model Anda, seseorang pasti akan melihatnya.