Model bahasa besar (LLM) adalah model dasar yang menggunakan kecerdasan buatan (AI), pembelajaran mendalam, dan kumpulan data yang sangat besar, termasuk situs web, artikel, dan buku, untuk menghasilkan teks, menerjemahkan ke berbagai bahasa, dan menulis berbagai jenis konten. Ada dua jenis model AI generatif ini: model bahasa besar berpemilik dan model bahasa besar sumber terbuka.
Dalam video ini, Martin Keen menjelaskan secara singkat model bahasa besar, bagaimana mereka berhubungan dengan model dasar, cara kerjanya, dan bagaimana mereka dapat digunakan untuk mengatasi berbagai masalah bisnis.
LLM berpemilik dimiliki oleh perusahaan dan hanya dapat digunakan oleh pelanggan yang membeli lisensi. Lisensi dapat membatasi bagaimana LLM dapat digunakan. Di sisi lain, LLM sumber terbuka gratis dan tersedia untuk diakses siapa pun, digunakan untuk tujuan apa pun, dimodifikasi, dan didistribusikan.
Istilah "sumber terbuka" mengacu pada kode LLM dan arsitektur yang mendasarinya yang dapat diakses oleh publik, yang berarti para pengembang dan peneliti bebas untuk menggunakan, meningkatkan, atau memodifikasi model tersebut.
Sebelumnya tampaknya bahwa semakin besar LLM semakin baik, tetapi sekarang perusahaan menyadari bahwa dalam hal riset dan inovasi, LLM bisa sangat mahal. Sebagai tanggapan akan hal ini, ekosistem model sumber terbuka mulai menunjukkan harapan dan menantang model bisnis LLM.
Perusahaan yang tidak memiliki talenta internal di bidang machine learning dapat menggunakan LLM sumber terbuka, yang memberikan transparansi dan fleksibilitas, di dalam infrastruktur mereka sendiri, baik di cloud atau on premises. Ini memberikan kontrol penuh atas data mereka dan berarti informasi sensitif tetap berada di dalam jaringan mereka. Semua ini mengurangi risiko kebocoran data atau akses tidak sah.
LLM sumber terbuka menawarkan transparansi mengenai cara kerja, arsitektur, dan data pelatihan serta metodologi dan cara penggunaannya. Kemampuan untuk memeriksa kode dan memiliki visibilitas tentang algoritma memungkinkan perusahaan untuk lebih mempercayai, membantu dalam hal audit, dan membantu memastikan kepatuhan terhadap etika dan hukum. Selain itu, mengoptimalkan sumber terbuka LLM secara efisien dapat mengurangi latensi dan meningkatkan kinerja.
Mereka umumnya jauh lebih murah dalam jangka panjang daripada LLM berpemilik karena tidak melibatkan biaya lisensi. Namun, biaya pengoperasian LLM memang sudah termasuk biaya infrastruktur cloud atau on premises, dan biasanya melibatkan biaya peluncuran awal yang signifikan.
LLM sumber terbuka yang telah dilatih sebelumnya memungkinkan penyempurnaan. Perusahaan dapat menambahkan fitur pada LLM yang bermanfaat bagi penggunaan spesifik mereka dan LLM juga dapat dilatih pada kumpulan data tertentu. Membuat perubahan atau spesifikasi ini pada LLM berpemilik memerlukan kerja sama dengan vendor serta menghabiskan waktu dan uang.
Sementara LLM berpemilik berarti perusahaan harus bergantung pada satu penyedia, sumber terbuka memungkinkan perusahaan untuk memanfaatkan kontribusi komunitas, banyak penyedia layanan, dan mungkin tim internal untuk menangani pembaruan, pengembangan, pemeliharaan, dan dukungan. Sumber terbuka memungkinkan perusahaan untuk bereksperimen dan menggunakan kontribusi dari berbagai orang dengan perspektif yang berbeda-beda. Ini dapat menghasilkan solusi yang memungkinkan perusahaan untuk tetap berada di ujung tombak teknologi. Ini juga memberikan bisnis pengguna LLM sumber terbuka lebih banyak kontrol atas teknologi mereka dan keputusan mengenai cara penggunaannya.
Buletin industri
Dapatkan kurasi insight tentang berita AI yang paling penting dan menarik. Berlangganan buletin Think mingguan. Lihat Pernyataan Privasi IBM.
Langganan Anda akan dikirimkan dalam bahasa Inggris. Anda akan menemukan tautan berhenti berlangganan di setiap buletin. Anda dapat mengelola langganan atau berhenti berlangganan di sini. Lihat Pernyataan Privasi IBM kami untuk informasi lebih lanjut.
Organisasi dapat menggunakan model LLM sumber terbuka untuk membuat hampir semua proyek yang berguna bagi karyawan mereka atau, jika lisensi sumber terbuka mengizinkan, dapat ditawarkan sebagai produk komersial. Ini mencakup:
Model LLM sumber terbuka memungkinkan Anda membuat aplikasi dengan kemampuan pembuatan bahasa, seperti menulis email, postingan blog, atau cerita kreatif. LLM seperti Falcon-40B, yang ditawarkan di bawah lisensi Apache 2.0, dapat merespons prompt dengan saran teks berkualitas tinggi yang kemudian dapat Anda sempurnakan dan poles.
LLM sumber terbuka yang dilatih pada kode dan bahasa pemrograman yang ada dapat membantu pengembang dalam membangun aplikasi dan menemukan kesalahan dan kesalahan terkait keamanan.
Sumber terbuka LLM memungkinkan Anda membuat aplikasi yang menawarkan pengalaman belajar yang dipersonalisasi, yang dapat disesuaikan dan disempurnakan untuk gaya belajar tertentu.
Alat LLM sumber terbuka yang meringkas artikel panjang, konten berita, laporan riset, dan banyak lagi yang dapat memudahkan untuk mengekstraksi data penting.
Alat ini dapat memahami dan menjawab pertanyaan, menawarkan saran, dan terlibat dalam percakapan bahasa alami.
LLM sumber terbuka yang dilatih pada kumpulan data multibahasa dapat memberikan terjemahan yang akurat dan lancar dalam banyak bahasa.
LLM dapat menganalisis teks untuk menentukan nada emosional atau sentimen, yang sangat berharga dalam manajemen reputasi merek dan analisis masukan pelanggan.
LLM bisa sangat bermanfaat dalam mengidentifikasi dan menyaring konten online yang tidak pantas atau berbahaya, yang sangat membantu dalam menjaga lingkungan online yang lebih aman.
Berbagai jenis organisasi menggunakan LLM sumber terbuka. Misalnya, IBM dan NASA mengembangkan LLM sumber terbuka yang dilatih pada data geospasial untuk membantu para ilmuwan dan organisasi mereka memerangi perubahan iklim.
Penerbit dan jurnalis menggunakan LLM sumber terbuka secara internal untuk menganalisis, mengidentifikasi, dan meringkas informasi tanpa membagikan data kepemilikan di luar ruang redaksi.
Beberapa organisasi layanan kesehatan menggunakan LLM sumber terbuka untuk perangkat lunak layanan kesehatan, termasuk alat diagnosis, pengoptimalan perawatan, dan alat yang menangani informasi pasien, kesehatan masyarakat, dan banyak lagi.
LLM sumber terbuka, FinGPT, dikembangkan khusus untuk industri keuangan.
Open LLM Leaderboard bertujuan untuk melacak, memeringkat, dan mengevaluasi LLM dan chatbot sumber terbuka pada tolok ukur yang berbeda.
Meskipun output LLM terdengar fasih dan otoritatif, mungkin ada risiko yang mencakup menawarkan informasi berdasarkan “halusinasi” serta masalah dengan bias, persetujuan, atau keamanan. Pendidikan tentang risiko ini adalah satu jawaban untuk berbagai masalah data dan AI ini.
Model AI, khususnya LLM, akan menjadi salah satu teknologi paling transformatif pada dekade berikutnya. Karena peraturan AI baru memberlakukan pedoman seputar penggunaan AI, sangat penting untuk tidak hanya mengelola dan mengatur model AI tetapi, yang sama pentingnya, mengatur data yang dimasukkan ke dalam AI.
Untuk membantu organisasi mengatasi kebutuhan ini dan melipatgandakan dampak AI, IBM menawarkan watsonx, platform AI dan data siap perusahaan kami. Bersama-sama, watsonx menawarkan organisasi kemampuan untuk:
Fungsionalitas pencarian percakapan IBM® watsonx Assistant dibangun di atas fondasi integrasi bawaan, kerangka kerja integrasi kode rendah (tautan berada di luar ibm.com), dan pengalaman penulisan no-code. Pengembang dan pengguna bisnis sama-sama dapat mengotomatiskan jawaban pertanyaan dengan pencarian percakapan, membebaskan diri untuk membangun aliran transaksional bernilai lebih tinggi, dan pengalaman digital terintegrasi dengan asisten virtual mereka.
Selain pencarian percakapan, watsonx Assistant terus berkolaborasi dengan IBM Research dan watsonx untuk mengembangkan LLM watsonx khusus yang mengkhususkan diri dalam klasifikasi, penalaran, ekstraksi informasi, peringkasan, dan contoh penggunaan percakapan lainnya. Asisten watsonx telah mencapai kemajuan besar dalam kemampuannya untuk memahami pelanggan dengan sedikit upaya menggunakan model bahasa besar.
Jelajahi pustaka model dasar IBM di portfolio watsonx untuk menskalakan AI generatif untuk bisnis Anda dengan percaya diri.
Gunakan AI di bisnis Anda keahlian AI terdepan di industri dan portofolio solusi dari IBM.
Rancang ulang alur kerja dan operasi yang penting dengan menambahkan AI untuk memaksimalkan pengalaman, pengambilan keputusan secara real-time, dan nilai bisnis.