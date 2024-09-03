Tidak ada teknologi dalam sejarah manusia yang menarik perhatian sebesar AI generatif (gen AI) dalam waktu sesingkat ini. Banyak perusahaan teknologi terkemuka menginvestasikan miliaran dolar untuk melatih model bahasa besar (LLM). Namun, apakah teknologi ini dapat membenarkan investasi tersebut? Apakah hal itu benar-benar memenuhi dengan hype?
Pada musim semi 2023—Goldman Sachs perusahaan yang cukup lama di dunia kecerdasan buatan (AI) merilis laporan yang memperkirakan bahwa kemunculan AI generatif dapat meningkatkan PDB global sebesar 7% per tahun, setara lebih dari USD 7 triliun tambahan setiap tahun.
Bagaimana AI generatif dapat mencapai hal ini? Aplikasi teknologi ini beragam, tetapi umumnya berfokus pada peningkatan efisiensi komunikasi antara manusia dan mesin. Peningkatan ini akan mendorong otomatisasi tugas tingkat rendah dan peningkatan kemampuan manusia, memungkinkan pekerja mencapai lebih banyak dengan kecakapan yang lebih tinggi.
Karena luasnya aplikasi dan kompleksitas AI generatif, banyak laporan media dapat membuat pembaca percaya bahwa teknologi ini hampir seperti obat ajaib. Memang, perspektif ini mencerminkan banyak liputan tentang AI generatif sejak rilis ChatGPT dan alat lain yang menyoroti teknologi pada 2022, dengan beberapa analis memprediksi kami berada di ambang revolusi yang akan membentuk masa depan pekerjaan.
Kurang dari dua tahun kemudian, antusiasme media terhadap AI generatif mulai mereda. Pada bulan Juni, Goldman Sachs merilis laporan lain dengan penilaian yang lebih terukur, mempertanyakan apakah manfaat AI generatif dapat membenarkan investasi triliunan dolar untuk pengembangannya. Financial Times, bersama media lainnya, menerbitkan opini dengan pandangan yang sama skeptisnya. Tim buletin IBM® Think telah merangkum dan menanggapi beberapa ketidakpastian ini dalam tulisan sebelumnya.
Fluktuasi pasar saham berikutnya membuat beberapa analis menyatakan bahwa “gelembung AI” akan segera meledak dan bahwa koreksi pasar berskala keruntuhan dot-com tahun 90-an mungkin menyusul.
Skeptisisme media terhadap AI generatif secara garis besar terbagi menjadi empat krisis yang dihadapi para pengembang
Ini merupakan rintangan besar, tetapi banyak yang tetap optimis bahwa menyelesaikan masalah terakhir (contoh penggunaan) akan membantu mengatasi tiga masalah lainnya. Kabar baiknya, mereka sudah mengidentifikasi dan mengerjakan contoh penggunaan yang berarti.
“AI generatif memiliki dampak nyata dan terukur pada diri kami dan klien kami, secara fundamental mengubah cara kami bekerja,” kata insinyur utama IBM®, Chris Hay. “Ini terjadi di seluruh industri dan disiplin, mulai dari transformasi proses SDM dan pemasaran melalui konten bermerek hingga pusat kontak dan pengembangan perangkat lunak.” Hay meyakini bahwa kita sedang berada dalam fase korektif yang biasanya muncul setelah periode antusiasme berlebihan, dan pesimisme media belakangan ini mungkin merupakan upaya menyeimbangkan pernyataan sebelumnya yang, jika dilihat sekarang, tampak seperti hype.
“Saya tidak ingin menjadi analis itu,” kata Hay, merujuk salah satu perkiraan terbaru yang lebih suram tentang masa depan AI. “Saya tidak ingin menjadi orang yang mengatakan, 'AI tidak akan melakukan sesuatu yang berguna dalam 10 tahun ke depan', karena Anda akan dikutip tentang itu selama sisa hidup Anda.”
Pernyataan seperti itu mungkin tampak benar jika dibandingkan dengan klaim bahwa internet awal tidak akan signifikan atau dugaan Thomas Watson, pendiri IBM®, pada 1943 bahwa dunia tidak akan membutuhkan lebih dari lima komputer. Hay berpendapat bahwa salah satu masalahnya adalah media sering menggabungkan gen AI dengan aplikasi yang lebih sempit, seperti chatbot bertenaga LLM seperti ChatGPT, yang mungkin tidak dirancang untuk menyelesaikan semua masalah perusahaan.
Jika kita mulai menghadapi hambatan pasokan—baik pada data, komputasi, maupun daya—Hay meyakini para insinyur melakukan hal yang kreatif untuk mengatasinya.
“Ketika sesuatu berlimpah, Anda akan mengonsumsinya,” kata Hay. “Jika Anda memiliki ratusan ribu GPU, Anda akan menggunakannya.” Namun ketika ada kendala, Anda menjadi lebih kreatif.”
Sebagai contoh, data sintetis adalah cara menjanjikan untuk mengatasi krisis data. Data ini dibuat secara algoritmik untuk meniru karakteristik data dunia nyata dan dapat digunakan sebagai alternatif atau pelengkapnya. Meskipun insinyur machine learning harus berhati-hati agar tidak terlalu mengandalkan data sintetis, pendekatan hybrid dapat membantu mengatasi kelangkaan data dunia nyata dalam jangka pendek. Misalnya, model Microsoft PHI-3.5 terbaru atau model Hugging Face SMOL dilatih dengan banyak data sintetis, menghasilkan model kecil yang sangat mumpuni.
LLM saat ini memang membutuhkan banyak daya, tetapi tidak ada banyak alasan untuk percaya bahwa transformator adalah arsitektur final. Model berbasis SSM, seperti Mistral Codestral Mamba, Jamba 1.5, atau Falcon Mamba 1.5, semakin populer berkat kemampuan konteks panjang yang lebih baik. Arsitektur hybrid yang menggabungkan beberapa jenis model juga semakin diminati. Di luar arsitektur, para insinyur juga melihat manfaat dari metode lain, seperti kuantisasi, chip khusus untuk inferensi, dan fine-tuning, yaitu teknik pembelajaran mendalam untuk menyesuaikan model pra-terlatih pada contoh penggunaan tertentu.
“Saya ingin melihat lebih banyak komunitas yang berfokus pada penyempurnaan di tingkat industri, bukan pada pra-pelatihan,” kata Hay. “Pra-pelatihan adalah bagian paling mahal dari proses ini.” Fine-tuning jauh lebih murah, dan Anda berpotensi memperoleh lebih banyak nilai darinya.”
Hay menyarankan bahwa di masa depan, kita mungkin memiliki lebih banyak GPU daripada yang kita butuhkan karena teknik kita menjadi jauh lebih efisien. Dia baru-baru ini bereksperimen mengubah laptop pribadinya menjadi mesin yang mampu melatih model. Dengan membangun ulang pipelines data yang lebih efisien dan menyesuaikan batching, ia mencari cara untuk bekerja dalam batasan tersebut. Ia tentu bisa melakukan semua itu pada GPU H100 Tensor Core yang mahal, tetapi pola pikir kelangkaan membantunya menemukan cara yang lebih efisien untuk mencapai hasil yang diinginkan. Kebutuhan adalah ibu dari penemuan.
Model menjadi lebih kecil dan lebih kuat.
“Jika Anda melihat model kecil saat ini, model tersebut dilatih dengan lebih banyak token dibandingkan model besar tahun lalu,” kata Hay. “Orang-orang memasukkan lebih banyak token ke model kecil, dan model-model itu menjadi lebih efisien dan lebih cepat.”
“Ketika kita memikirkan aplikasi AI untuk menyelesaikan masalah bisnis nyata, kita menemukan bahwa model khusus menjadi semakin penting,” kata Brent Smolinski, Kepala Global Teknologi, Data, dan Strategi AI IBM®. Ini termasuk model bahasa kecil dan model non-generatif, seperti model forecasting, yang membutuhkan kumpulan data lebih terbatas. Dalam konteks ini, kualitas data sering lebih penting daripada kuantitas. Selain itu, model khusus ini mengonsumsi lebih sedikit daya dan lebih mudah dikendalikan.
“Banyak riset dilakukan untuk mengembangkan algoritma yang lebih efisien secara komputasi,” tambah Smolinksi. Model yang lebih efisien mengatasi keempat krisis tersebut: mereka mengonsumsi lebih sedikit data, daya, dan komputasi, serta karena lebih cepat, mereka membuka contoh penggunaan baru.
"LLM sangat luar biasa karena memiliki antarmuka percakapan yang alami, dan semakin banyak data yang dimasukkan, percakapannya terasa semakin alami," kata Smolinski. "Tetapi LLM ini, dalam konteks domain atau masalah yang sempit, rentan terhadap halusinasi, yang merupakan masalah nyata." "Karena itu, banyak klien kami memilih model bahasa kecil, dan meskipun antarmukanya tidak sepenuhnya alami, hal itu tidak masalah—untuk masalah tertentu, antarmuka alami tidak diperlukan."
AI generatif mungkin bukan solusi untuk segala hal, tetapi ini adalah alat yang sangat kuat dalam perangkat kita. Pertimbangkan alur kerja agen, yaitu pendekatan multi-langkah untuk memanfaatkan LLM dan agen AI dalam menyelesaikan tugas. Agen-agen ini bertindak dengan tingkat kemandirian dan kemampuan pengambilan keputusan, berinteraksi dengan data, sistem, dan kadang juga manusia untuk menyelesaikan tugas yang diberikan. Agen khusus dapat dirancang untuk menangani tugas atau bidang keahlian tertentu, menghadirkan pengetahuan dan pengalaman mendalam yang mungkin tidak dimiliki LLM. Agen-agen ini dapat memanfaatkan data yang lebih spesifik atau mengintegrasikan algoritma dan model yang sesuai dengan domain.
Bayangkan sebuah perusahaan telekomunikasi di mana alur kerja agen yang didukung LLM secara efisien menangani pertanyaan dukungan pelanggan. Ketika pelanggan mengirim permintaan, LLM memproses pertanyaan, mengkategorikan masalah, dan memicu agen tertentu untuk menangani tiap tugas. Misalnya, satu agen mengambil detail akun pelanggan dan memverifikasi informasi yang diberikan, sementara agen lain mendiagnosis masalah, seperti menjalankan pemeriksaan jaringan atau memeriksa perbedaan pada penagihan.
Ketika masalah teridentifikasi, agen ketiga merumuskan solusi, baik itu mengatur ulang peralatan, menawarkan pengembalian uang, atau menjadwalkan kunjungan teknisi. LLM kemudian membantu agen komunikasi menghasilkan respons yang dipersonalisasi untuk pelanggan, memastikan pesan tetap jelas dan konsisten dengan nuansa merek perusahaan. Setelah masalah terselesaikan, siklus masukan dimulai, di mana agen mengumpulkan masukan pelanggan untuk menilai tingkat kepuasan. Jika pelanggan belum puas, LLM meninjau masukan tersebut dan dapat memicu tindakan lanjutan lainnya, seperti panggilan dari agen manusia.
LLM, meskipun serbaguna, dapat kesulitan dengan tugas yang memerlukan keahlian domain mendalam atau pengetahuan khusus, terutama ketika tugas tersebut berada di luar data pelatihan LLM. Mereka juga lambat dan tidak cocok untuk pengambilan keputusan secara real-time di lingkungan yang dinamis. Sebaliknya, agen dapat beroperasi secara otonom dan proaktif, secara real-time, dengan memanfaatkan algoritma pengambilan keputusan yang lebih sederhana.
Agen, berbeda dengan LLM besar yang monolitik, dapat dirancang untuk belajar dari dan beradaptasi dengan lingkungan mereka. Mereka dapat menggunakan pembelajaran penguatan atau siklus masukan untuk meningkatkan kinerja dari waktu ke waktu, menyesuaikan strategi berdasarkan keberhasilan atau kegagalan tugas sebelumnya. Alur kerja agen itu sendiri menghasilkan data baru, yang kemudian dapat digunakan untuk pelatihan lebih lanjut.
Skenario ini menunjukkan bahwa LLM merupakan komponen yang berguna untuk memecahkan masalah bisnis, tetapi bukan keseluruhan solusi. Ini kabar baik karena LLM sering menjadi komponen paling mahal dalam rantai nilai.
Smolinksi berpendapat bahwa orang sering bersikap ekstrem ketika bersemangat tentang teknologi baru. Kita mungkin menganggap teknologi baru akan mengubah dunia, dan ketika itu tidak terjadi, kita cenderung menjadi terlalu pesimis.
“Saya rasa jawabannya ada di tengah,” katanya, menekankan bahwa AI harus menjadi bagian dari strategi yang lebih luas untuk menyelesaikan masalah bisnis. “Biasanya bukan hanya AI saja, dan kalaupun iya, biasanya ada beberapa jenis model AI yang diterapkan bersama untuk menyelesaikan masalah.” Tapi Anda harus mulai dari masalahnya. Jika ada aplikasi AI yang dapat berdampak signifikan pada kemampuan pengambilan keputusan Anda yang kemudian memengaruhi hasil keuangan, fokuslah pada area tersebut terlebih dahulu, lalu tentukan cara menerapkan kombinasi teknologi dan AI yang tepat. Manfaatkan seluruh toolkit, bukan hanya LLM, tetapi semua alat yang tersedia.
Terkait “krisis contoh penggunaan”, Hay yakin contoh penggunaan yang lebih kuat yang membenarkan biaya model ini akan muncul.
“Jika Anda menunggu hingga teknologi sempurna dan baru masuk pasar setelah semuanya stabil, itu justru cara mudah untuk terganggu,” katanya. “Aku tidak yakin akan mengambil kesempatan itu.”