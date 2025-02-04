Perlombaan senjata AI tidak lagi hanya untuk perusahaan-perusahaan raksasa bernilai miliaran dolar.
Perusahaan seperti OpenAI, Google, dan Microsoft telah lama mendominasi berita utama dalam percakapan seputar kecerdasan buatan. Namun, gelombang baru inovasi sumber terbuka—yang dicontohkan oleh model DeepSeek terbaru—mulai meratakan medan persaingan. Keberhasilan model tersebut menegaskan tren yang kian menguat: perusahaan kecil kini semakin mampu menantang para pemain AI terbesar.
“Ini hanya menegaskan apa yang sebenarnya sudah kita ketahui,” ujar David D. Cox, Vice President of AI Models di IBM® Research. “Kami tidak percaya Anda membutuhkan miliaran dolar untuk membangun model yang hebat. DeepSeek adalah bukti bahwa pendekatan sumber terbuka mulai menyusul—dan itu perkembangan yang positif.”
Para peneliti AI terus berlomba untuk membuat model yang lebih kuat, tanpa menaikkan biaya komputasi. Dengan meningkatnya kekhawatiran akan keterbatasan perangkat keras dan konsumsi energi, inovasi yang meningkatkan efisiensi menjadi sama pentingnya dengan peningkatan kinerja mentah.
“Sudah terlalu lama, perlombaan AI menjadi permainan skala di mana model yang lebih besar dianggap menghasilkan hasil yang lebih baik,” tulis CEO IBM® Arvind Krishna di LinkedIn. “Namun, tidak ada hukum fisika yang menyatakan bahwa model AI harus tetap besar dan mahal. Biaya pelatihan dan inferensi hanyalah tantangan teknologi lain yang menunggu untuk dipecahkan.”
Terobosan DeepSeek dalam efisiensi AI lahir dari teknik baru bernama Multi-Head Latent Attention (MLA). Metode ini mengubah cara model AI memproses dan menyimpan informasi. Salah satu peningkatan kuncinya adalah kemampuan MLA untuk mengurangi ukuran cache KV, komponen yang sangat penting bagi efisiensi sistem AI. Menurut Cox, pendekatan ini membuat sistem AI menggunakan lebih sedikit memori dan memungkinkan model berkembang lebih besar dengan lebih mudah.
“Mereka melakukan pekerjaan yang sangat baik di sini,” kata Cox. “Mengurangi ukuran cache KV itu sangat penting, karena membuat model berjalan lebih cepat dan memakai jauh lebih sedikit sumber daya.”
Di bawah naungan DeepSeek, terobosan muncul bertubi-tubi. Prasanna Sattigeri, seorang Ilmuwan Riset Utama di IBM® Research, menekankan bahwa inovasi perusahaan ini berfokus pada efisiensi dan penyempurnaan arsitektur.
"Mereka mengoptimalkan komunikasi antar GPU, yang sering menjadi hambatan dalam pelatihan AI berskala besar," kata Sattigeri. "Hal ini memungkinkan mereka untuk berlatih secara efektif dengan menggunakan perangkat keras yang lebih tua, sebuah prestasi teknik yang luar biasa."
Tetapi, seperti proyek rekayasa ambisius lainnya, lompatan ini datang dengan harga tertentu. DeepSeek juga memanfaatkan teknik pembelajaran penguatan (RL), serupa dengan yang digunakan dalam pendekatan penskalaan inferensi o1 milik OpenAI. Metode tersebut menyempurnakan kinerja model dengan memperkuat output yang berhasil melalui beberapa iterasi. Namun, Cox menekankan bahwa penerapan DeepSeek memunculkan sejumlah trade-off, termasuk kemampuan pemanggilan fungsi yang lebih lemah dan masalah penyelarasan keamanan.
“Ini merupakan langkah maju yang menggembirakan, tetapi masih ada sisi yang kurang mulus,” katanya. “Model ini luar biasa dalam tugas penalaran, namun beberapa area lainnya ikut terdampak.”
Bahkan ketika kemajuan teknologi mempermudah pembangunan model AI berukuran besar, tantangan yang jauh lebih besar tetap menghantui: kebutuhan daya komputasi masif agar tetap kompetitif. Xia “Ben” Hu, Associate Professor Ilmu Komputer di Rice University, mengakui bahwa DeepSeek merupakan langkah maju yang lebih efisien dalam pengembangan AI. Namun, ia menekankan bahwa terobosan tersebut belum secara fundamental mengubah dinamika kekuatan dalam infrastruktur AI, di mana akses terhadap sumber daya besar masih menjadi penentu siapa yang memimpin perlombaan.
“DeepSeek mendapat dukungan dari modal ventura besar di Tiongkok dan memiliki akses ke puluhan ribu GPU,” kata Hu. “Itu masih menjadi hambatan utama bagi banyak perusahaan rintisan yang lebih kecil.”
Namun, Hu memprediksi bahwa perubahan paling signifikan kemungkinan besar akan terjadi pada adopsi AI di tingkat perusahaan. “Industri tradisional— minyak dan gas, manufaktur—sebelumnya ragu untuk mengembangkan solusi AI mereka sendiri,” ujarnya. “Tapi dengan biaya yang menurun dan model sumber terbuka yang makin matang, perusahaan yang dulu bergantung pada layanan AI eksternal kini mulai mempertimbangkan pembangunan model in-house yang disesuaikan dengan kebutuhan mereka.”
Implikasinya melampaui satu model. Dengan semakin banyaknya proyek AI sumber terbuka, startup kecil kini dapat mengakses alat yang dulu memerlukan pusat data raksasa dan anggaran luar biasa besar. Cox mengatakan bahwa OpenAI dan para pesaingnya telah lama memancarkan “suasana tak terelakkan”—seolah hanya mereka yang berkantong tebal yang bisa memimpin AI. Namun, dengan munculnya DeepSeek dan model-model lain, gagasan itu mulai runtuh.
"Kami melihat adanya pergeseran di mana lebih banyak pemain yang dapat bersaing di ruang ini," kata Cox. "Bukan berarti setiap orang dengan uang USD 5 juta dapat membuat model papan atas dalam semalam. Tetapi startup dan perusahaan menengah yang didanai dengan baik? Tentu saja."
Para peneliti juga semakin menitikberatkan efisiensi dibandingkan sekadar kekuatan komputasi mentah. Cox dan tim risetnya telah memusatkan perhatian pada pendekatan Mixture of Experts, yang memungkinkan AI untuk lebih selektif dalam menggunakan sumber daya pemrosesan.
"Mixture of Experts hanyalah salah satu bagian dari teka-teki—ada lebih banyak lagi yang akan datang," katanya, menunjukkan bahwa masa depan AI mungkin tidak terlalu bergantung pada akses ke chip canggih dan lebih banyak pada cara yang lebih cerdas dalam menggunakan perangkat keras yang ada.
Sattigeri menyoroti salah satu inovasi penting: munculnya data sintetis, yakni informasi yang dihasilkan secara artifisial untuk meniru data dunia nyata. “Dengan model seperti DeepSeek, kita melihat pergeseran menuju penggunaan data sintetis yang dihasilkan AI untuk menyempurnakan dan melatih model dengan lebih efisien,” ujarnya. “Pendekatan ini dapat memangkas biaya secara signifikan dan membuat AI berkualitas tinggi lebih mudah diakses oleh lebih banyak pihak.”
Meningkatnya aksesibilitas pengembangan AI memunculkan pertanyaan baru tentang masa depan persaingan. Akankah infrastruktur dan Power masih menentukan pemenang, atau akankah kemampuan berinovasi dengan cepat menjadi aset yang paling berharga? Menurut Cox, ini adalah campuran dari keduanya.
“Anda tetap membutuhkan infrastruktur yang kuat, Anda tetap membutuhkan talenta terbaik, tetapi parit yang dimiliki OpenAI dan Google tidak sedalam yang mereka bayangkan,” ujarnya. “Rahasia tidak selamanya rahasia di bidang ini. Ide menyebar, dan orang berpindah-pindah. Kami melihat konvergensi yang cepat."
Hu menambahkan bahwa pengembangan AI masih bergantung pada empat komponen penting: “Saya menyebutnya model ABCD—Algoritma, Big Data, Komputasi, dan Distribusi,” ujarnya. “Perusahaan AI terbaik menguasai keempatnya. DeepSeek memberi tekanan pada dua komponen pertama, tetapi komputasi dan distribusi tetap menjadi keunggulan utama para pemain besar.”
Semakin banyak perusahaan yang dapat membangun AI berkat teknik yang lebih efisien, dampaknya bukan sekadar persaingan—melainkan dapat memicu revolusi kreatif. Jika lebih banyak pihak mampu mengembangkan AI tanpa anggaran miliaran dolar, inovasi akan lahir dari beragam perspektif, bukan hanya dari segelintir agenda korporasi, ujar Cox. Hal ini berarti solusi AI yang lebih tersesuaikan, model-model yang lebih spesifik, dan pasar yang jauh lebih dinamis.
“Inovasi akan bergerak lebih cepat, dengan cara yang lebih aman dan lebih inklusif,” ujar Cox. “Begitu kita keluar dari budaya tunggal yang membuat segelintir pemain menentukan aturan main, kita akan mulai melihat beragam pendekatan tumbuh dan berkembang.”
Cox mengatakan bahwa bagi IBM®, yang telah berkomitmen pada AI sumber terbuka, kebangkitan DeepSeek memvalidasi pendekatannya. “Ini justru hal yang baik bagi kita,” ujarnya. “Ini membuktikan bahwa model terbuka bisa bekerja dan memang dibutuhkan. Semakin banyak orang berkontribusi, semakin besar manfaat yang kita rasakan bersama.”
Hu menekankan bahwa meski perusahaan kecil diuntungkan, para pemain besar juga ikut beradaptasi. “Amazon, Meta, dan Microsoft tidak akan diam saja dan membiarkan sumber terbuka merebut pangsa mereka,” ujarnya. “Mereka bekerja keras mencari cara untuk mengintegrasikan model sumber terbuka sambil tetap mempertahankan kendali atas infrastruktur dan data.”
Apa yang akan terjadi selanjutnya? Cox dan para pakar lainnya mengatakan bahwa pengembangan AI tidak akan menjadi gratis untuk semua, tetapi jelas bahwa perusahaan yang lebih kecil tidak lagi bergantung pada raksasa teknologi. Alat sumber terbuka mempercepat laju inovasi, dan mereka yang berani merangkul perubahan inilah yang akan menikmati manfaat terbesar.
“Ini bagian dari tren yang sudah berlangsung lama,” kata Cox. “Tren itu bukan dimulai oleh DeepSeek, dan tidak akan berakhir di sana. Tapi yang jelas, kehadirannya membuat banyak orang tersentak.”
