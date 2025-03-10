Beberapa, seperti peneliti dari Beijing University of Posts and Telecommunications, sekarang merancang model bahasa kecil khusus untuk ponsel pintar. Tim menemukan bahwa model bahasa kecil berjalan “lebih cepat dan efisien” ketika mereka dirancang untuk perangkat keras yang akan mereka jalankan daripada menyempurnakan model yang lebih besar untuk digunakan di telepon, kata rekan penulis Rongjie Yi kepada IBM Think.

Mengapa perlombaan telepon AI makin cepat sekarang? Kemajuan dalam model bahasa kecil (SLM) mendorong evolusi ini dalam teknologi mobile, kata El Maghraoui. “Model yang ringkas, lebih efisien, dan lebih mampu ini dapat melakukan pemrosesan waktu nyata dan menciptakan interaksi yang dipersonalisasi dan aman pada perangkat edge seperti smartphone,” katanya.

El Maghraoui menambahkan bahwa ketika orang menggunakan SLM di smartphone, kita mungkin belajar pelajaran yang sebenarnya akan paling berguna di luar arena konsumen. Model kecil bagus untuk ponsel, tetapi sangat penting untuk “aplikasi yang lebih serius, seperti perangkat tertanam di pabrik di mana data manufaktur sensitif harus diproses secara lokal.”

Dari layanan keuangan hingga perawatan kesehatan hingga manufaktur, ada banyak situasi di mana perusahaan memiliki data yang ingin mereka simpan on premises. Model kecil memungkinkan mereka untuk mengekstrak informasi yang berguna dari data itu tanpa harus mengirimkannya ke cloud publik.

Untuk alasan ini, IBM telah memprioritaskan model yang lebih kecil dan sesuai untuk tujuan seperti seri Granite-nya karena memungkinkan perusahaan untuk mengejar kinerja model terdepan dengan biaya yang lebih murah.

Chairman dan CEO IBM Arvind Krishna menguraikan dalam sebuah artikel di Fortune: “Dalam pekerjaan kami di IBM, kami telah melihat bahwa model yang sesuai untuk tujuan telah menyebabkan pengurangan biaya inferensi AI hingga 30 kali lipat, membuat pelatihan lebih efisien dan dapat diakses.”

Dalam banyak pengaturan perusahaan, ada “batasan waktu dan akurasi yang lebih ketat,” kata El Magrahoui. Penundaan atau kesalahan apa pun dapat menghasilkan kehilangan sejumlah besar uang atau membahayakan keamanan data atau lebih.

“Anda tidak mampu membuat kesalahan di lingkungan itu karena itu memiliki implikasi yang jauh lebih serius daripada hanya memiliki kesalahan dalam menjadwalkan penerbangan atau sesuatu seperti itu,” katanya.

Ketika pengguna terus bereksperimen dengan ponsel yang berfokus pada AI yang didukung SLM, mereka yang berada di arena lain akan terus mengawasi apa yang dipelajari dari perangkat edge ini.