Tag

Model difusi menantang GPT saat AI generasi berikutnya muncul

diterbitkan 10 Maret 2025

Bagian belakang kepala orang melihat layar komputer saat mereka memprogram

Penulis

Staff Writer

IBM

Kelas baru model AI menantang dominasi sistem gaya GPT, menjanjikan alternatif yang lebih cepat, lebih murah, dan berpotensi lebih kuat.

Inception Labs, sebuah startup yang didirikan oleh para peneliti dari Stanford, baru-baru ini merilis Mercury, model bahasa berbasis difusi (dLLM) yang menyempurnakan seluruh frasa sekaligus, daripada memprediksi kata-kata satu per satu. Tidak seperti model bahasa besar tradisional (LLM), yang menggunakan pendekatan autoregresif—menghasilkan satu kata pada satu waktu, berdasarkan teks sebelumnya—model difusi meningkatkan teks secara berulang, melalui penyempurnaan.

"dLLM memperluas batas kemungkinan," kata Stefano Ermon, seorang profesor ilmu komputer Universitas Stanford dan salah satu pendiri Inception Labs, kepada IBM® Think. “Mercury memberikan kecepatan dan efisiensi yang tak tertandingi, dan—dengan memanfaatkan lebih banyak komputasi waktu uji—DLLMS juga akan menetapkan standar untuk kualitas dan meningkatkan kepuasan pelanggan secara keseluruhan untuk aplikasi edge dan enterprise.”

Insinyur IBM® Research , Benjamin Hoover, melihat tulisan di dinding: "Hanya tinggal menunggu dua atau tiga tahun lagi sebelum kebanyakan orang mulai beralih menggunakan model difusi," katanya. “Ketika saya melihat model dari Inception Labs, saya menyadari, ‘Ini akan terjadi lebih cepat daripada yang saya bayangkan.’”

Keuntungan model difusi

Model difusi tidak bermain dengan aturan yang sama dengan AI tradisional. Model autoregresif seperti GPT membangun kalimat kata demi kata, memprediksi satu token pada satu waktu. Jika sebuah model menghasilkan frasa “Kepada siapa itu mungkin menjadi perhatian,” ia memprediksi “Kepada,” lalu “siapa,” lalu “itu,” dan seterusnya—satu langkah pada satu waktu. Model difusi membalik skrip. Alih-alih menyatukan teks secara berurutan, model ini mulai dengan versi kasar dan berisik dari seluruh bagian dan menyempurnakannya dalam beberapa langkah. Pikirkanlah hal itu seperti seorang seniman yang membuat sketsa garis besar terlebih dahulu sebelum memperjelas detailnya, alih-alih menggambar setiap elemen secara berurutan. Dengan mempertimbangkan seluruh kalimat sekaligus, model difusi dapat menghasilkan respons lebih cepat, seringkali dengan lebih banyak koherensi dan akurasi daripada LLM tradisional.

Hoover melihat teknologi sebagai sentuhan modern pada konsep yang lebih tua. “Model difusi pada dasarnya adalah mekanisme koreksi kesalahan,” katanya. “Mereka bekerja dengan memulai dengan input yang bising, dan secara bertahap menghilangkan kebisingan sampai mereka sampai pada output yang diinginkan.”

Desain 3D bola yang menggelinding di lintasan

Berita + Insight AI terbaru  

Temukan insight dan berita yang dikurasi oleh para pakar tentang AI, cloud, dan lainnya di Buletin Think mingguan.

Menerobos hambatan bahasa

Model difusi telah banyak digunakan dalam pembuatan gambar, dengan model seperti DALL · E, Stable Diffusion dan Midvoyage menyempurnakan gambar bising menjadi visual berkualitas tinggi. Namun, menerapkan pendekatan ini pada teks lebih sulit karena bahasa membutuhkan kepatuhan yang ketat terhadap tata bahasa dan sintaks.

“Banyak upaya untuk menerapkan model difusi pada pembuatan teks telah mengalami kesulitan di masa lalu”, kata Ermon. “Yang memungkinkan Merkurius berhasil ketika yang lain gagal adalah inovasi eksklusif dalam algoritma pelatihan dan inferensi”. Tidak seperti gambar, yang secara bertahap dapat dibersihkan menjadi bentuk yang dapat dikenali, bahasa mengikuti aturan tata bahasa yang kaku yang membuat penyempurnaan berulang lebih rumit.

Hoover menunjuk ke Merkurius Inception Labs sebagai contoh utama tentang bagaimana model difusi menutup celah. “Model itu membuktikan difusi dapat bertahan dan sebenarnya lebih cepat dan lebih efisien daripada model autoregresif yang sebanding”.

Masa depan difusi

Efisiensi LLM berbasis difusi dapat mengguncang penerapan AI, terutama dalam penerapan di perusahaan di mana biaya dan kecepatan adalah hal penting. LLM tradisional membutuhkan daya komputasi yang besar, membuatnya mahal untuk dijalankan. Model difusi menjanjikan untuk memberikan kinerja yang serupa atau lebih baik dengan biaya yang lebih murah. Model difusi seringkali lebih efisien karena model tersebut menyempurnakan seluruh urutan secara paralel, bukan menghasilkan setiap kata langkah demi langkah seperti LLM tradisional, sehingga mengurangi overhead komputasi.

“Pelanggan kami dan pengadopsi awal mengembangkan aplikasi yang didukung oleh DLLM di berbagai bidang termasuk dukungan pelanggan, penjualan, dan permainan,” kata Ermon. “Mereka membuat aplikasi mereka lebih responsif, lebih cerdas, dan lebih murah.”

Hoover melihat dampak yang lebih luas. “Saat ini, AI dibatasi oleh konsumsi energi”, katanya. “Model besar menggunakan daya dalam jumlah besar. Namun, model difusi beroperasi secara berbeda, memungkinkan efisiensi yang jauh lebih besar. Dalam jangka panjang, kita bisa melihat sistem AI berbasis difusi berjalan pada perangkat keras analog, mengurangi biaya energi secara dramatis”.

Komputasi analog, yang memproses informasi menggunakan sinyal listrik kontinu dan bukan operasi biner, telah lama disebut-sebut sebagai solusi potensial untuk masalah energi AI. Hoover percaya model difusi sangat cocok untuk pendekatan ini.

“Model-model ini secara inheren dapat ditafsirkan,” katanya. "Itu berarti kami dapat memetakan komputasi internal mereka secara langsung ke sirkuit analog, sesuatu yang jauh lebih sulit dilakukan dengan arsitektur pembelajaran mendalam tradisional."

Akademi AI

Menjadi pakar AI

Raih pengetahuan demi memprioritaskan investasi AI yang mendorong pertumbuhan bisnis. Mulai dengan Akademi AI gratis kami hari ini dan pimpin masa depan AI di organisasi Anda.

Tonton serialnya

Mulai mewujudkan ROI: Panduan praktis untuk AI agen

Pelajari cara untuk menskalakan AI agentik untuk ROI terukur di seluruh perusahaan Anda. Pedoman ini menguraikan hambatan utama yang membatasi dampak, cara mengukur ROI secara efektif dan kerangka kerja praktis untuk mendorong adopsi yang sukses di seluruh perusahaan.

Sumber daya

Perusahaan di tahun 2030: Direkayasa untuk inovasi berkelanjutan

Temukan lima prediksi kami tentang apa yang akan menentukan perusahaan paling sukses di tahun 2030 dan langkah-langkah yang dapat diambil para pemimpin untuk mendapatkan keuntungan yang mengutamakan AI.

Tingkatkan keterampilan Anda dalam AI generatif

Belajar konsep dasar dan bangun keterampilan Anda dengan laboratorium praktis, kursus, proyek terpandu, uji coba, dan lainnya.

Manfaatkan AI : Meningkatkan ROI dengan gen AI

Ingin mendapatkan hasil yang lebih baik dari investasi AI Anda? Pelajari bagaimana meningkatkan AI gen di berbagai bidang utama mendorong perubahan dengan membantu para pemikir terbaik Anda membangun dan memberikan solusi baru yang inovatif.

Dari proyek AI hingga keuntungan: Bagaimana AI agen dapat mempertahankan pengembalian keuangan

Pelajari bagaimana organisasi beralih dari meluncurkan AI dalam pilot yang berbeda ke menerapkan AI untuk mendorong transformasi pada intinya.

Penjelasan tentang AI generatif

Techsplainers oleh IBM® menguraikan dasar-dasar gen AI, dari konsep kunci hingga contoh penggunaan dunia nyata. Episode yang jelas dan cepat membantu Anda mempelajari dasar-dasarnya dengan cepat.

Panduan AI Generatif untuk CEO

Pelajari bagaimana CEO dapat menyeimbangkan nilai generatif AI yang dapat diciptakan dengan investasi yang dibutuhkan dan risiko yang ditimbulkannya.

Pusat Pengembang watsonx

Jelajahi alat dan sumber daya penting untuk mempercepat proyek Anda berikutnya. Mulailah dan temukan berbagai model yang didukung yang tersedia dari IBM®.

Kebenaran tentang AI generatif yang sukses

Temukan manfaat platform AI yang memungkinkan penyesuaian model dasar melalui teknologi, proses, dan praktik terbaik untuk membantu Anda mengoperasikan siklus hidup gen AI dengan mudah.

Jelajahi IBM Granite

IBM® Granite adalah rangkaian model AI terbuka, berkinerja, dan tepercaya kami yang dirancang untuk bisnis dan dioptimalkan untuk menskalakan aplikasi AI Anda. Jelajahi model untuk bahasa, kode, deret waktu, dan batasan.

Cara memilih model dasar yang tepat

Pelajari cara memilih model dasar AI yang paling sesuai untuk contoh penggunaan Anda.

Cara berkembang di era baru AI ini dengan kepercayaan dan keyakinan

Pelajari 3 elemen penting dari strategi AI yang kuat: menciptakan keunggulan kompetitif, meningkatkan skala AI di seluruh bisnis, dan mengembangkan AI tepercaya.

Solusi terkait

IBM watsonx.ai

Latih, validasi, lakukan tuning, dan terapkan AI generatif, model dasar, dan kemampuan machine learning dengan IBM watsonx.ai, studio perusahaan generasi berikutnya untuk pembangun AI. Bangun aplikasi AI dalam waktu singkat, dengan sedikit data.

Temukan watsonx.ai

Solusi kecerdasan buatan (AI)

Gunakan AI di bisnis Anda dalam perpaduan antara keahlian AI terdepan di industri dari IBM dan portofolio solusi Anda.

Jelajahi solusi AI

Layanan AI

Temukan kembali alur kerja dan operasi yang penting dengan menambahkan AI untuk memaksimalkan pengalaman, pengambilan keputusan secara real-time, dan nilai bisnis.

Jelajahi layanan AI

Ambil langkah selanjutnya

Dapatkan akses satu atap ke kemampuan yang mencakup siklus hidup pengembangan AI. Hasilkan solusi AI yang kuat dengan antarmuka ramah pengguna, alur kerja yang efisien, serta akses ke API dan SDK berstandar industri.

Model difusi menantang GPT saat AI generasi berikutnya muncul

Keuntungan model difusi

Berita + Insight AI terbaru

Menerobos hambatan bahasa

Masa depan difusi

Menjadi pakar AI

Share

Sumber daya

Berita + Insight AI terbaru