Model bahasa besar (LLM) kecil telah mendominasi percakapan AI, didorong oleh popularitas ChatGPT dan aplikasi gen AI serupa. Namun, model bahasa kecil (SLM) sedang meningkat. Lebih ringkas dan efisien, SLM menggunakan lebih sedikit memori dan daya pemrosesan. Ini membuatnya sangat cocok untuk lingkungan dengan sumber daya terbatas.
Kemampuan mereka untuk menghasilkan konten unik dan insight dari kumpulan data yang luas telah memikat dunia dan mendorong penciptaan alat dan aplikasi baru, semakin memperkuat dampak budaya mereka, terutama di perusahaan. Dengan Dr. Juan Bernabe Moreno, Director di IBM Research Eropa untuk Inggris Raya dan Irlandia, kami akan menjelajahi bagaimana SLM dapat bermanfaat pada adopsi AI perusahaan.
Kecerdasan buatan generatif (gen AI) memiliki potensi produktivitas yang signifikan bagi perusahaan. Namun, ketika menerapkan model AI, lebih besar tidak selalu berarti lebih baik. Ada 2 masalah utama LLM yang mencegah adopsi perusahaan.
Pertama, banyak LLM bersifat umum sehingga membatasi nilainya. Model perusahaan “rata-rata” tidak efektif karena tidak ada perusahaan “rata-rata”. Model AI yang efektif harus dibangun, disetel, dan diterapkan untuk kebutuhan khusus organisasi.
Kedua, banyak LLM berpemilik adalah 'kotak hitam' — model tertutup di mana hanya perusahaan yang memilikinya yang dapat melihat komponennya — kekurangan transparansi data dan menghambat penyetelan dengan data perusahaan, di mana nilai sebenarnya AI berada. Hal ini membuat perusahaan bertanggung jawab atas kinerja model tanpa insight atau kontrol.
Semua masalah ini mencegah kepercayaan dan pemahaman tentang keamanan model. Tanpa memilih solusi gen AI secara efektif untuk memenuhi persyaratan industri, hukum, dan peraturan, perusahaan tidak dapat sepenuhnya menggunakan kekuatan gen AI.
Untuk gen AI yang sukses, perusahaan membutuhkan 3 hal:
Untuk memenuhi kebutuhan ini dan memaksimalkan nilai AI, perusahaan beralih ke SLM dan menemukan kekuatan dari ukuran kecil. SLM menawarkan alternatif yang menarik untuk LLM bertujuan umum.
SLM kurang diperhatikan dan dipublikasikan, tetapi mereka menawarkan pilihan yang menarik untuk organisasi dari semua ukuran. Efisiensi energi, transparansi data, dan kinerja yang kuat—sering kali cocok atau melampaui model yang lebih besar—membuka adopsi gen AI yang bertanggung jawab tanpa menghalangi inovasi.
Secara umum, model apa pun yang memiliki kurang dari 30 miliar parameter dianggap sebagai SLM. Keuntungan utamanya termasuk biaya yang lebih rendah, penurunan konsumsi energi, dan peningkatan transparansi dan integritas data. Generasi baru model yang lebih kecil, seperti IBM Granite, dibangun di atas kumpulan data yang sederhana dan difilter untuk tugas-tugas tertentu, mengurangi risiko seperti bias dan output yang tidak tepat sekaligus meningkatkan visibilitas data.
Model dasar yang dapat dipercaya ini memungkinkan integrasi data kepemilikan yang meyakinkan, membuka nilai sebenarnya AI. IBM memberikan perlindungan kekayaan intelektual (IP) untuk semua model Granite yang semakin meningkatkan kepercayaan dalam menggabungkan data mereka dengan model.
IBM percaya bahwa model basis sumber terbuka memberdayakan organisasi untuk membuat model khusus yang tertanam data. Untuk mendukung hal ini, IBM akan menjadikan SLM yang dapat disesuaikan dari keluarga Granite sebagai sumber terbuka, dilatih pada kumpulan data yang transparan dan difilter.
Menggabungkan model Granite kecil dengan data perusahaan dapat mencapai kinerja khusus tugas, menyaingi model yang lebih besar dengan biaya yang lebih murah. Bukti konsep awal menunjukkan harga model IBM Granite jauh lebih murah (antara 3 dan 23 kali lebih murah) daripada model untuk tujuan umum, sementara mengungguli atau setara dengan pesaing berukuran sama pada tolok ukur utama.
Selain itu, teknik baru seperti InstructLab—diperkenalkan oleh IBM dan RedHat pada Mei 2024—menyederhanakan penanaman data perusahaan ke dalam LLM. InstructLab memungkinkan perusahaan untuk menyesuaikan model AI menggunakan informasi yang dihasilkan manusia dan sumber daya komputasi yang jauh lebih sedikit daripada pelatihan ulang tradisional.
SLM, termasuk model Granite, sudah menghasilkan dampak. Lembaga olahraga global menggunakan model Granite yang disetel dengan data domain mereka sendiri, untuk meningkatkan pengalaman penggemar dengan komentar yang dihasilkan AI. Secara internal, IBM menggunakan model Granite untuk memberi daya pada platform layanan sumber daya manusia (SDM) miliknya, AskHR. Dengan menggunakan prompt bahasa alami, IBMer dapat mengakses layanan SDM di satu tempat, menghemat waktu bagi karyawan dan profesional SDM.
LLM yang luas bukan satu-satunya cara untuk mendapatkan manfaat dari gen AI. Model khusus yang lebih kecil dan lebih mudah diakses menawarkan efisiensi, kepercayaan, fleksibilitas, dan kinerja yang dibutuhkan dengan biaya lebih rendah, dari segi finansial maupun lingkungan.
