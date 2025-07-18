Ketika DeepSeek-R1 dirilis pada 20 Januari, model penalaran AI yang kuat namun hemat biaya itu langsung mengguncang Silicon Valley dan Wall Street. Alasannya? Model ini menawarkan kemampuan sekelas model papan atas dari OpenAI dan Anthropic, tetapi dikabarkan membutuhkan komputasi yang jauh lebih ringan serta biaya pelatihan dan penggunaan yang sangat rendah. Hanya dalam sebulan terakhir, model tersebut telah diunduh lebih dari 800.000 kali di Hugging Face.
"Itu adalah sebuah panggilan untuk bangun," kenang Larry Li, Pendiri dan Mitra Pelaksana di AMINO Capital, perusahaan investasi berbasis Palo Alto, dalam wawancara terbaru dengan IBM® Think. Teknologi baru sering kali “direkayasa terbalik,” ujarnya. “Tapi tidak ada yang membayangkan bahwa hal itu bisa dilakukan dengan begitu baik.”
“Itu mengubah narasi bahwa AS adalah satu-satunya tempat di dunia di mana inovasi bisa terjadi,” ujar Matthieu Soulé, Kepala C.Lab Cathay Innovation, pengelola dana yang berinvestasi dalam inovasi AI di seluruh UE dan Asia, termasuk Tiongkok.
Banyak yang memprediksi kesuksesan DeepSeek akan mengguncang industri dan mengubah dinamika perlombaan AI global. Enam bulan berlalu, dan kini kami ingin menengok kembali: benarkah perubahan itu terjadi?
Kami berbicara dengan beberapa pakar yang sama yang kami wawancarai beberapa jam setelah Deepseek-R1 dirilis, serta beberapa pakar lain untuk mendapatkan gambaran holistik.
Pada hari-hari setelah rilis DeepSeek-R1, banyak pihak mempertanyakan apakah perusahaan telah menghitung dan melaporkan biaya lengkap—bukan hanya biaya pelatihan model mendekati final—serta komponen apa saja yang mereka gunakan dan berasal dari perusahaan mana. Dengan kata lain, apakah mereka benar-benar melakukan sesuatu yang revolusioner, ataukah ini hanyalah kemajuan yang bersifat inkremental?
Beberapa tokoh, seperti Kaoutar El Maghraoui, IBM® Principal Research Scientist, berpendapat bahwa inovasi sebenarnya mungkin terletak pada apa yang ia sebut sebagai “efisiensi arsitektur”, yakni penggabungan berbagai teknik seperti “mixture of experts, strategi pembelajaran penguatan, desain perangkat keras-perangkat lunak, serta beragam trik pengoptimalan lainnya. Ini pada dasarnya implementasi cerdas dan efektif dari teknik yang sudah ada,” ujarnya dalam wawancara IIBM® Think baru-baru ini.
Meski begitu, para pakar di berbagai bidang sepakat bahwa DeepSeek-R1 mengubah lingkungan AI global dalam sejumlah cara penting. Selama ini, banyak yang menganggap perusahaan AI Amerika memiliki “parit” atau keunggulan hampir yang mustahil untuk ditandingi. DeepSeek membantah asumsi tersebut dengan menurunkan hambatan bagi para pengembang dan perusahaan kecil untuk mengakses alat yang memungkinkan mereka membangun LLM mereka sendiri.
“Para pengembang dan pengguna kini dapat mengakses kemampuan sekelas OpenAI o1 dengan biaya yang jauh lebih terjangkau,” ujar Abraham Daniels, Senior Technical Product Manager di IBM®, dalam sebuah wawancara.
Fakta bahwa DeepSeek membuka sumber model-modelnya berperan besar dalam meningkatkan aksesibilitas. “Kami melihat lonjakan minat terhadap sumber terbuka sejak kemunculan DeepSeek dan kontribusinya pada Aliansi AI,” ujar Anthony Annunziata, Direktur Strategi Terbuka AI di IBM® dan AI Alliance. AI Alliance sendiri merupakan jaringan internasional perusahaan dan organisasi yang berupaya membangun ekosistem AI yang terbuka dan aman, didirikan oleh IBM® dan Meta.
“Di seluruh Eropa, Vietnam, India, dan Jepang, ada banyak perusahaan AI regional yang ingin memastikan mereka memiliki kendali penuh atas kecerdasan buatan mereka—bahwa mereka dapat membentuknya sesuai kebutuhan budaya, sosial, dan ekonomi masing-masing, yang berbeda dari AS dan negara lain,” ujar Annunziata.
Melindungi riset AI yang berkembang di dalam negeri menjadi prioritas utama. “Ada dorongan kuat menuju kedaulatan digital, di mana pemerintah berupaya mencari cara untuk menghindari pengaruh teknologi AI asing,” ujar El Maghroui.
Pembuatan LLM berdasarkan bahasa lokal memotivasi banyak wirausahawan. "AI sedang menuju ke arah itu, di mana, sebagai sebuah utilitas, setiap negara atau wilayah ingin memiliki model bahasa mereka sendiri untuk setidaknya memiliki suara dalam hal mempengaruhi perilaku," kata Li.
Jepang, misalnya, baru-baru ini memberlakukan Undang-Undang Promosi AI untuk mendorong pengembangan teknologi tersebut. Pada akhir Juni, AI Alliance meluncurkan babak baru di Jepang dengan fokus pada dua bidang yang paling diminati para pelaku usaha lokal: kedaulatan AI dan penerapan AI dalam manufaktur. Bahasa memegang peran penting dalam mengendalikan sistem AI, sehingga pada akhir 2024, misalnya, lebih dari 1.500 peneliti dari kalangan akademisi dan industri bergabung untuk mengembangkan model bahasa Jepang yang kuat dan bersifat terbuka.
Banyak model AI dan pelaku usaha lokal juga memprioritaskan kepentingan ekonomi domestik. Di Jepang, misalnya, sejumlah perusahaan yang bergabung dengan Aliansi AI, termasuk Mitsubishi Electric dan Panasonic, tengah mengembangkan model AI yang ditujukan untuk aplikasi manufaktur dan industri, dua segmen yang memegang peranan besar dalam perekonomian negara tersebut.
Di sisi lain, minat terhadap model lokal juga terus meningkat, ujar Daisuke Okanohara, CTO sekaligus Co-Founder Preferred Networks, sebuah perusahaan perangkat keras dan perangkat lunak asal Jepang yang mengembangkan teknologi canggih berbasis pembelajaran mendalam dan AI. Pada bulan Mei, Preferred Networks merilis PLamo versi kedua, model ringkas yang dapat dijalankan secara lokal dan dilatih dalam bahasa Jepang serta Inggris.
“Kinerjanya memang tidak setara dengan model frontier secara keseluruhan, tetapi sangat unggul dalam tugas-tugas tertentu,” ujar Okanohara dalam wawancara dengan IBM® Think. “Untuk contoh penggunaan model kecil—seperti model dengan delapan hingga 30 miliar parameter—model ini mengungguli CLANG, GPT-4o mini, dan model serupa dalam sejumlah tugas berbahasa Jepang.”
Vietnam juga mengalami lonjakan aktivitas kewirausahaan di bidang LLM, dan AI Alliance membuka bab baru di sana pada Juni tahun ini. Selain mengembangkan model bahasa Vietnam, para pengusaha kini berfokus memanfaatkan model AI untuk merancang jenis chip baru yang mampu memasok daya bagi teknologi AI, ujar Annunziata.
Alasan lain mengapa DeepSeek menginspirasi begitu banyak pengusaha lokal adalah fakta bahwa sejumlah negara melarang atau membatasi penggunaan DeepSeek-R1 dengan alasan keamanan dan privasi. Italia, Australia, Korea Selatan, dan Kanada telah melarang DeepSeek, dan penggunaannya juga dibatasi di beberapa negara bagian AS, terutama pada situs pemerintah. Situasi ini menimbulkan efek riak yang menarik: para wirausahawan lokal terdorong memanfaatkan alat sumber terbuka untuk mengembangkan model yang lebih aman dan dapat digunakan secara sah di wilayah geografis masing-masing.
Pengusaha teknologi sekaligus pendiri perusahaan VC terbaru, Kai-Fu Lee, melalui 01.AI, ingin merambah pasar B2B untuk AI perusahaan—sebuah sektor yang terkenal menantang di Tiongkok, di mana separuh perusahaan merupakan badan usaha milik negara dan banyak perusahaan swasta besar dapat berada di bawah pengaruh pemerintah ketika mereka berkembang. Lee sebelumnya meluncurkan Rhymes AI, perusahaan yang merilis sejumlah produk pada musim gugur lalu, termasuk sebuah mesin pencari dan Allegro, model pembuat video berbasis sumber terbuka.
“Kami melihatnya secara pragmatis: modelnya memang sudah cukup bagus. Namun, masih belum mudah digunakan banyak bisnis dan perusahaan dan itulah masalah yang ingin kami selesaikan,” ujar Anita Huang, Co-Founder 01.AI, dalam wawancaranya dengan IBM® Think. “Menurut kami, elemen yang hilang, terutama bagi pasar perusahaan di Tiongkok, adalah lapisan middleware yang menjadi jendela menuju model bahasa besar.” Saat ini, platform perusahaan mereka memanfaatkan model seperti DeepSeek dan Qwen dari Alibaba.
Segera setelah kemunculan DeepSeek, banyak yang memprediksi bahwa hal itu akan membuka jalan bagi penalaran rantai pemikiran untuk mendominasi. Namun, sejak saat itu, arah industri berubah. Riset terbaru menunjukkan bahwa model dengan penalaran intensif biaya dan sumber daya tidak selalu diperlukan untuk banyak tugas ketika tujuan utamanya adalah mendapatkan utilitas dari model tersebut.
Mungkin area yang paling dilebih-lebihkan adalah tingkat adopsi DeepSeek di lingkungan perusahaan, terutama karena biaya lisensinya yang sangat rendah (dilisensikan melalui lisensi MIT yang permisif).
“Faktanya, adopsi di lingkungan perusahaan masih sangat terbatas, terutama karena kurangnya jaminan privasi data, kepatuhan, tata kelola, dan keamanan,” ujar El Maghraoui.
Sebagian besar perusahaan, setidaknya di Amerika Serikat, terjebak dengan vendor yang menawarkan solusi terkelola atau dapat diaudit.
Jadi, meskipun “orang mulai melihat bahwa inovasi bisa datang dari tempat yang tak terduga,” kata Annunziata, industri AI secara keseluruhan maupun pasar yang lebih luas tidak berubah sedramatis yang dibayangkan sebagian orang. Justru sebaliknya, “perusahaan sumber terbuka semakin menggandakan komitmen mereka pada sumber terbuka, sementara para pemain besar yang berpemilik fokus mengejar talenta, makin gencar mengakuisisi atau membungkam pesaing, dan menyalurkan lebih banyak dana ke dalam pengembangan model mereka.”
Pada akhirnya, sistem lama terbesar DeepSeek mungkin adalah membuat casing untuk model kecil yang sesuai dengan kebutuhan, kata Daniels.
"DeepSeek membuka perlombaan AI dan menjadikan model bahasa kecil sebagai medan pertempuran baru," katanya. "Model bahasa kecil yang berkemampuan tinggi dapat dilatih dengan lebih efisien daripada model yang lebih besar dan dapat menangani contoh penggunaan perusahaan dengan lebih baik."
Agen AI—sistem AI otonom yang dapat bernalar, merencanakan, dan menjalankan tugas—telah berkembang pesat di berbagai perusahaan pada tahun 2025 dan menjadi salah satu contoh penggunaan. Model yang lebih kecil sering kali lebih cocok untuk sistem AI agentic karena lebih efisien, membutuhkan sumber daya lebih sedikit, dan dapat disesuaikan untuk tugas-tugas khusus.
Seperti yang dikatakan oleh Insinyur Terhormat IBM®, Chris Hay, dalam episode Mixture of Experts baru-baru ini: "Ketika Anda ingin menjalankan agen, Anda ingin model Anda berukuran kecil, cepat, dan ramping."
