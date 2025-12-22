Pada tahun 2026, model AI paling cerdas mungkin bukan yang terbesar.
Itulah taruhan yang kini dipasang oleh para laboratorium, investor, dan peneliti yang telah menghabiskan setahun terakhir menyaksikan asumsi-asumsi mereka runtuh. 12 bulan ke depan akan ditentukan bukan oleh perlombaan membangun sistem yang lebih besar, melainkan oleh perebutan untuk mengembangkan model yang lebih bijaksana model yang berpikir sebelum berbicara, dan mampu melakukan lebih banyak dengan sumber daya yang lebih sedikit.
“Anda dapat memiliki model bahasa kecil yang berkinerja setara, atau bahkan lebih baik, dibandingkan model yang jauh lebih besar,” kata Kush Varshney, seorang IBM® Fellow, kepada IBM® Think dalam sebuah wawancara.
Setahun yang lalu, pernyataan itu akan terdengar seperti bidah. Selama satu dekade, AI beroperasi berdasarkan katekismus yang sangat sederhana: lebih banyak data, lebih banyak parameter, lebih banyak daya komputasi, berarti lebih banyak kecerdasan. Laboratorium saling berlomba mengumumkan jumlah parameter layaknya binaragawan memamerkan otot di depan cermin. Proses pelatihan menghabiskan listrik setara dengan kebutuhan kota-kota kecil. Seluruh aktivitas tersebut terasa seperti perebutan wilayah hanya saja, lahan yang diperebutkan diukur dalam teraflops.
Kemudian datang Januari 2025. Sebuah perusahaan berbasis di Tiongkok bernama DeepSeek merilis model yang membuat saham Nvidia turun 17% dalam satu hari. Kecerdikan algoritmik terbukti dapat menggantikan kekuatan komputasi yang kasar. Anda tidak membutuhkan katedral. Anda membutuhkan cetak biru yang lebih baik.
Laboratorium utama Amerika berputar dengan cepat. Dalam beberapa bulan, fokus pun bergeser dari membangun sistem yang semakin besar menjadi membangun sistem yang mampu berhenti sejenak dan bernalar sebelum menjawab. Seyed Emadi, Associate Professor of Operations di University of North Carolina Kenan-Flagler, menyampaikannya secara lugas saat berbicara dengan IBM® Think: “Jika saya harus merangkum AI pada 2025, kami berhenti membuat model yang lebih besar dan mulai membuatnya lebih bijaksana.”
Pivot tersebut kini membentuk arah selanjutnya. Konsensus di antara para peneliti terasa sangat mencolok hampir menakutkan. Ketika diminta mengidentifikasi perkembangan paling signifikan dalam setahun terakhir, Misha Belkin, Profesor Machine learning di UC San Diego, menunjuk pada “kebangkitan model yang mampu berpikir dan penskalaan waktu inferensi”—dan dalam sebuah wawancara menyebutnya sebagai fondasi untuk 2026. Rada Mihalcea, yang memimpin Laboratorium AI di University of Michigan, menawarkan pandangan pelengkap: “kemajuan dalam sistem multi-agen, serta pemahaman yang lebih dalam tentang… kelemahan,” akan menentukan arah ke depan, katanya kepada IBM® Think.
Pergeseran ini merepresentasikan peninjauan ulang tentang apa arti kecerdasan dalam silikon. Pendekatan lama memperlakukannya sebagai sesuatu yang “dipanggang” selama pelatihan, seperti bumbu dalam sebuah rebusan. Setelah selesai, model tersebut dibekukan. Pendekatan baru memperlakukan kecerdasan sebagai sesuatu yang dapat muncul pada saat waktu proses, dengan memberikan lebih banyak waktu bagi model untuk bernalar yang dikenal sebagai inference time compute.
Implikasinya masih sedang dieksplorasi. Gabriel Poesia, seorang peneliti yang mempelajari penalaran AI di Universitas Stanford, mencatat bahwa model kini semakin baik dalam “berpikir untuk jangka waktu yang lebih lama” dan “menggunakan alat dengan lancar selama periode berpikir yang panjang.” Versi bahasa Inggris polos: mesin belajar Think sebelum mereka berbicara.
Model-model lama bekerja seperti refleks: input masuk, prediksi keluar, tanpa jeda untuk berpikir. Model-model terbaru mempertimbangkan dengan lebih matang. Ajukan pertanyaan sulit, dan model akan “duduk” dengannya, kadang-kadang selama beberapa menit, memeriksa logikanya, dan mundur dari jalan buntu. Proses ini sangat mirip dengan cara manusia berpikir. Apakah ini benar-benar berpikir, dalam arti yang sebenarnya, tetap menjadi salah satu pertanyaan besar yang belum terjawab.
Jika model berpikir adalah kisah intelektual tahun 2025, maka berita komersialnya jauh lebih mengejutkan: frontier AI ternyata jauh lebih murah daripada yang diperkirakan banyak orang. Ekonomi yang tampaknya sekuat gravitasi justru lebih mirip mode. Penemuan ini diperkirakan akan mengubah lanskap persaingan pada tahun 2026.
Rilis DeepSeek pada bulan Januari meledak bak bom. Model ini mampu menyamai sistem Barat dengan hanya menggunakan sekitar sepersepuluh dari daya komputasi pelatihan. “Hal itu mendorong banyak perubahan,” kata Varshney. “Sekarang ada pesaing baru, dan semua orang perlu meningkatkan permainan mereka.”
Arsitektur model juga mengalami perubahan signifikan yang tenang. Pola baru yang populer adalah campuran pakar, yang merutekan input ke subnetwork khusus alih-alih mengaktifkan setiap parameter untuk setiap kueri. Anggap saja seperti berkonsultasi dengan spesialis yang tepat daripada meminta satu dokter mengetahui segalanya. Andrew Chin, Profesor Hukum di UNC yang meneliti kebijakan teknologi, menjelaskan dampaknya kepada IBM® Think: “Model padat mengeluarkan biaya komputasi yang kira-kira sama untuk setiap token,” katanya. “Sistem yang jarang merutekan token hanya melalui subset parameter.” Implikasinya bagi perusahaan sangat signifikan: “Skala menjadi sesuatu yang dapat dikelola, bukan sekadar untuk dimaksimalkan.”
Demokratisasi tidak hanya terjadi pada arsitektur, tetapi juga pada penyempurnaan. Christelle Scharff, seorang Profesor Ilmu Komputer di Pace University, mengatakan kepada IBM® Think bahwa dia menyaksikan “pergeseran yang jelas menuju LoRa dan penyempurnaan ringan, yang memungkinkan model-model kuat diadaptasi dengan komputasi terbatas.” Para peneliti dengan anggaran sederhana kini dapat menyesuaikan model-model yang sebelumnya tidak terjangkau setahun yang lalu. Gerbang-gerbang pun mulai terbuka.
Keuntungan efisiensi juga terlihat dalam desain sistem. Kandyce Brennan, Asisten Profesor di UNC School of Nursing yang meneliti AI dalam perawatan kesehatan, mengatakan kepada IBM® Think bahwa pendekatan seperti perencana DisciPL MIT—di mana “model besar merencanakan dan mengkoordinasikan... banyak model kecil”—mampu mencapai hasil dengan “biaya komputasi yang jauh lebih rendah.” Efisiensi ini juga mengurangi konsumsi energi dan dampak lingkungan.
“Keterbatasan data dan masalah energi kini menjadi tantangan nyata,” kata Mihalcea. “Hal ini telah mendorong riset ke arah pengembangan model yang lebih kecil.” Batasan-batasan tersebut diperkirakan hanya akan semakin ketat.
Yang sebenarnya dibutuhkan perusahaan, ternyata, bukan kemampuan untuk melakukan segalanya, kata Varshney. Ia memberikan contoh yang menarik: Anda bisa meminta model untuk mengomentari hak-hak sipil di bulan, dan model itu akan menghasilkan sesuatu yang lancar. “Namun, sebagian besar tugas perusahaan bukanlah hal seperti itu,” katanya. “Pendekatan mereka lebih tepat sasaran.” Teologi skala pun memberi jalan bagi pragmatisme yang sesuai dengan tujuan.
Kemajuan yang dicapai memang nyata. Begitu pula dengan batasannya. Meskipun memiliki kapasitas penalaran yang baru ditemukan, model AI tetap rentan melakukan jenis kesalahan tertentu: kesalahan yang disertai rasa percaya diri, disampaikan dengan keyakinan tenang layaknya pemandu wisata yang tersesat di museum yang salah.
Poesia mengidentifikasi masalah inti: “Dua tantangan utama tetaplah keandalan dan kreativitas. Bahkan berhasil 99,9% dari waktu saja tidaklah cukup,” katanya. Matematika tidak kenal ampun. Sistem yang gagal sekali dalam seribu upaya akan gagal seribu kali saat memproses sejuta kueri. Dalam bidang kedokteran, hukum, atau keuangan, hal itu merupakan risiko yang tidak dapat diterima.
Kreativitas menjadi tantangan lain. “Untuk tugas-tugas terbuka… bahkan model dari perusahaan yang berbeda cenderung menghasilkan output yang sama,” ujar Poesia. Model-model tersebut telah menjadi sangat mahir dalam menemukan jawaban yang benar. Namun, mereka tetap terasa anehnya seragam ketika diminta untuk bersikap orisinal.
Model-model penalaran tersebut juga memiliki titik buta tersendiri. Varshney mencatat bahwa “pada tugas-tugas di mana terdapat kemampuan untuk memverifikasi langkah-langkah perantara... alur yang lebih panjang ini membantu. Namun, ada banyak kasus di mana tidak terdapat langkah menengah yang dapat diverifikasi.”
Sebuah tolok ukur bernama ARC-AGI-2 mengilustrasikan kesenjangan tersebut. Tes ini menyajikan masalah yang bagi manusia tergolong mudah, namun sangat sulit bagi AI. “Bahkan model penalaran mutakhir memperoleh skor yang jauh di bawah kinerja manusia,” kata Emadi. “Model memang dapat bernalar lebih baik daripada sebelumnya, tetapi mereka tetap bisa salah dengan penuh percaya diri.”
Halusinasi, istilah sopan di bidang ini untuk mengarang sesuatu, telah berubah dalam cara kemunculannya, tetapi masih tetap ada. Mohammad Hossein Jarrahi, seorang profesor di UNC yang meneliti interaksi manusia–AI, mengatakan kepada IBM® Think bahwa “halusinasi telah berubah karakter, tetapi tidak sepenuhnya menghilang.” Kecenderungan untuk menghasilkan informasi yang terdengar masuk akal namun secara faktual keliru tetap bertahan.
Beberapa peneliti mengkhawatirkan lintasan yang lebih luas. Todd Cherner, yang memimpin program teknologi pendidikan di University of North Carolina, mengatakan kepada IBM® Think bahwa “kemajuan kemampuan agen AI sangat provokatif. Saya pikir masa depan menuju AGI akan datang lebih cepat daripada yang disadari banyak orang. Kita harus memanfaatkan apa yang kita miliki sekarang sebelum benar-benar mendorong ke arah AGI.”
Prinsip dasar komputasi tetap berlaku. “Sampah masuk, sampah keluar,” kata Nathalie Volkheimer, Spesialis Keterlibatan Pengguna di RENCI, kepada IBM® Think. “Kami terlalu fokus pada mesin yang membuat sosis, bukan pada sosis itu sendiri. Namun pada akhirnya, kita memakan apa yang kita buat.”
Satu kemajuan yang kurang banyak disorot adalah perluasan jendela konteks, yaitu jumlah informasi yang dapat disimpan model dalam memori kerjanya. “Kami melihat konteks berskala repositori yang jauh lebih baik, hingga sekitar satu juta token,” kata Jarrahi. Satu juta token kira-kira setara dengan beberapa novel. Model kini mampu mempertahankan pemahaman yang koheren sepanjang interaksi yang lebih panjang, yang sangat penting untuk peninjauan dokumen hukum, pengembangan perangkat lunak, dan sintesis riset, katanya.
Fitur sitasi juga telah ditingkatkan, dengan “fitur dasar bawaan yang dapat menunjuk ke bagian tertentu,” tambah Jarrahi. Ketika model mampu menunjukkan bagaimana ia sampai pada hasilnya, pengguna dapat memverifikasi alih-alih menerima begitu saja. Percaya, tetapi verifikasi. Atau, lebih tepatnya: jangan percaya, dan pastikan untuk memverifikasi.
Namun, verifikasi hanya membawa Anda sejauh ini. Aude Oliva, Direktur MIT-IBM® Watson AI Lab di MIT, mengatakan kepada IBM® Think bahwa “masa depan kolaborasi manusia dan AI adalah dialog. Sistem agen buatan harus memiliki tingkat tertentu dari teori pikiran. Memahami cara kerja internal sistem AI membentuk fondasi kepercayaan. Teori pikiran—kemampuan untuk memahami bahwa pihak lain memiliki perspektif yang berbeda—merupakan dasar interaksi manusia. Ketidakhadirannya dalam AI menciptakan gesekan yang tidak dapat diatasi oleh kemampuan apa pun.”
Metrik keberhasilan pun berubah seiring dengan itu. “Bidang ini tak terhindarkan bergerak menuju model yang dinilai lebih sedikit berdasarkan kelancaran mentah, dan lebih berdasarkan keterlacakan, kalibrasi, serta ketahanan interaksional,” kata Jarrahi. Metrik yang bersifat glamor memberi jalan bagi metrik keandalan. Kilau telah memudar. Prediktabilitas kini menjadi kunci.
“Tema dominan adalah kemampuan melalui kendala,” kata Chin. “Alih-alih memperlakukan skala sebagai tujuan itu sendiri, upaya utama kini berfokus pada membuat sistem bekerja secara dapat diprediksi di bawah batasan nyata.” Kemajuan pun terlihat kurang seperti moonshot dan lebih menyerupai tantangan rekayasa.
Tiga kendala akan membentuk apa yang dapat dilakukan organisasi dengan AI pada tahun 2026, menurut berbagai pakar yang berbicara kepada IBM® Think. Yang pertama adalah ekonomi, yang kedua adalah fisik, dan yang ketiga adalah regulasi.
Mulailah dengan uang. “Ekonomi inferensi akan semakin berfungsi sebagai batas keras,” kata Chin. “Banyak peningkatan kemampuan penalaran terkini bergantung pada daya komputasi yang jauh lebih besar per kueri.” Model yang membutuhkan waktu beberapa menit untuk berpikir tidak dapat diterapkan dalam skala besar di lingkungan yang menuntut respons waktu nyata, katanya.
Kendala fisik yang dihadapi juga sama seriusnya. “Konsumsi listrik pusat data global diproyeksikan akan meningkat lebih dari dua kali lipat pada tahun 2030,” kata Emadi. “Kendala tahun depan bagi banyak organisasi bukan lagi ketersediaan chip, melainkan gigawatt daya untuk menyalakannya.” Industri ini telah menghabiskan waktu bertahun-tahun terobsesi pada chip. Kini, kemacetannya berpindah ke pembangkit listrik.
“Tuntutan komputasi—dan, oleh karena itu, biaya lingkungan—tetap tinggi,” tambah Brennan, “sehingga memunculkan pertanyaan etis penting tentang keberlanjutan.” Jejak karbon AI kini menjadi hal yang mustahil untuk diabaikan.
Lalu ada regulasi. “Tekanan tata kelola sejak tahap desain akan semakin langsung membentuk pengembangan model,” kata Chin. “Untuk banyak penerapan, kebutuhannya bukan sekadar kinerja tinggi, tetapi perilaku yang dapat diaudit dan dibatasi.” Era kotak hitam mungkin akan segera berakhir.
Kesenjangan yang semakin melebar antara industri dan akademisi mengkhawatirkan sebagian pengamat. “Universitas perlu kembali berfokus pada AI fundamental,” kata Scharff, “dan berinvestasi pada ide-ide yang akan membentuk bidang ini 10 hingga 20 tahun ke depan.” Model-model terbesar kian berada di luar jangkauan akademisi, memunculkan pertanyaan yang tidak nyaman tentang dari mana generasi gagasan berikutnya akan berasal.
Satu perkembangan yang jarang dilaporkan adalah kebangkitan AI berdaulat. “Di banyak negara, orang-orang telah mengembangkan model mereka sendiri,” kata Varshney. Hal ini penting karena data pelatihan menjadi lebih responsif secara budaya, sekaligus menggeser kontrol ekonomi lebih dekat ke dalam negeri, ujarnya.
Untuk tahun 2026, Varshney memperkirakan kelanjutan eksperimen alih-alih terobosan dramatis. “Tidak semuanya harus benar-benar berbasis transformer,” katanya. Mihalcea menawarkan perkiraan serupa: “campuran pakar khusus yang lebih kecil, dengan memanfaatkan sistem multi-agen.” Ketika ditanya apakah lompatan besar akan terjadi, Varshney bersikap hati-hati. “Selalu ada kemungkinan… momen ChatGPT lainnya,” katanya. “Namun, saya tidak mengharapkannya.” Jawaban yang jujur adalah bahwa tidak ada yang benar-benar tahu.
Para praktisi telah mulai beradaptasi dengan lingkungan baru ini. Jayashankar Swaminathan, Profesor Operasi Global di UNC Kenan-Flagler, mengatakan kepada IBM® Think bahwa “kemajuan terbesar terjadi di sekitar kemampuan otonom, di mana AI kini dapat melakukan banyak tugas dalam urutan sederhana. Yang kedua berkaitan dengan penalaran logis di balik pengambilan keputusan.”
Dalam perawatan kesehatan, transformasi sudah berlangsung. Maureen Baker, Associate Clinical Professor di UNC School of Nursing, mengatakan kepada IBM® Think bahwa “model AI berkembang dengan kecepatan yang luar biasa.” Namun, ia membedakan antara kemampuan dan penerapan: “Pemikiran kritis, penalaran klinis, dan penilaian harus tetap berada di garis depan.” Pendekatannya bersifat pragmatis: “Saya mencari kemenangan yang mudah dengan risiko minimal.”
Ekosistem pun terbelah. David Sachs, Profesor Teknologi Informasi di Pace University, mengatakan kepada IBM® Think bahwa “tampaknya ada dua jenis model yang muncul: model besar yang mengklaim dapat melakukan segalanya, dan model yang lebih terfokus seperti Julius atau Perplexity.” Seiring perangkat lunak berevolusi dari aplikasi monolitik menjadi alat-alat khusus, AI pun terfragmentasi ke dalam ceruk-ceruk yang lebih spesifik.
“Pemanfaatan nyata dari sistem-sistem ini dibentuk melalui perancangan alur kerja yang bersifat simbiosis,” kata Jarrahi. Manusia menghadirkan penilaian, kreativitas, dan akuntabilitas. AI menghadirkan kecepatan, konsistensi, serta kapasitas untuk memproses sejumlah besar informasi. Organisasi yang mampu menemukan cara untuk menggabungkan keduanya akan memiliki keunggulan.
“Frontier AI bergerak menjauh dari era yang ditentukan oleh skala mentah,” kata Chin, “menuju era yang ditentukan oleh prosedur, kendala, dan pertukaran operasional.” Teknologi menjadi matang ketika para insinyur mulai mengoptimalkan batas-batas dunia nyata. Dengan ukuran itulah, AI akhirnya benar-benar tumbuh.
Namun, Varshney memikirkan sesuatu yang lebih dalam daripada sekadar teknologi. “Tugas apa yang akan didelegasikan kepada sistem AI, dan mana yang akan tetap dilakukan oleh manusia?” tanyanya. “Apakah itu karena manusia menemukan makna dari melakukan hal-hal tertentu? Dalam banyak hal, apa arti menjadi manusia?”
