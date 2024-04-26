Perusahaan yang beroperasi di domain khusus, seperti telekomunikasi atau layanan kesehatan atau perusahaan minyak dan gas, memiliki fokus laser. Meskipun mereka dapat dan memang mendapat manfaat dari skenario dan contoh penggunaan gen AI yang khas, mereka akan lebih baik dilayani dengan model yang lebih kecil.

Dalam kasus telekomunikasi, misalnya, beberapa contoh penggunaan umum adalah asisten AI di pusat kontak, penawaran yang dipersonalisasi dalam pengiriman layanan, dan chatbot didukung AI untuk meningkatkan pengalaman. Kasus penggunaan yang membantu perusahaan telekomunikasi meningkatkan kinerja jaringan mereka, meningkatkan efisiensi spektral dalam jaringan 5G atau membantu mereka menentukan hambatan tertentu dalam jaringan mereka paling baik dilayani oleh data perusahaan sendiri (sebagai lawan dari LLM publik).

Itu membawa kita pada gagasan bahwa lebih kecil lebih baik. Sekarang ada Model Bahasa Kecil (Small Language Models, SLM) yang ukurannya “lebih kecil” dibandingkan dengan LLM. SLM dilatih pada 10 miliar parameter, sementara LLM dilatih pada 100-an miliar parameter. Lebih penting lagi, SLM dilatih pada data yang berkaitan dengan domain tertentu. SLM mungkin tidak memiliki informasi kontekstual yang luas, tetapi berkinerja sangat baik dalam domain pilihan.

Karena ukurannya yang lebih kecil, model ini dapat di-host di pusat data perusahaan alih-alih cloud. SLM bahkan dapat berjalan pada satu chip GPU dalam skala besar, menghemat ribuan dolar dalam biaya komputasi tahunan. Namun, penggambaran antara apa yang hanya dapat dijalankan di cloud atau di pusat data perusahaan menjadi kurang jelas dengan kemajuan dalam desain chip.

Entah itu karena biaya, privasi data atau kedaulatan data, perusahaan mungkin ingin menjalankan SLM ini di pusat data mereka. Sebagian besar perusahaan tidak suka mengirim data mereka ke cloud. Alasan utama lainnya adalah kinerja. Gen AI di tepi melakukan perhitungan dan inferensi sedekat mungkin dengan data, membuatnya lebih cepat dan lebih aman daripada melalui penyedia cloud.

Perlu dicatat bahwa SLM membutuhkan daya komputasi yang lebih sedikit dan ideal untuk penerapan di lingkungan yang terbatas sumber daya dan bahkan pada perangkat mobile.

Contoh lokal mungkin lokasi IBM® Cloud Satellite, yang memiliki koneksi berkecepatan tinggi yang aman ke IBM Cloud yang menghosting LLM. Perusahaan telekomunikasi dapat meng-host SLM ini di stasiun pangkalan mereka dan menawarkan opsi ini kepada klien mereka juga. Ini semua masalah mengoptimalkan penggunaan GPU, karena jarak yang harus ditempuh data berkurang, menghasilkan peningkatan bandwidth.