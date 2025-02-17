Kucing rumah Anda mungkin lebih pintar dari ChatGPT. Sementara kecerdasan buatan sekarang dapat menulis puisi dan lulus ujian sekolah hukum, itu masih tidak dapat menandingi kemampuan penalaran dasar yang memungkinkan tabby Anda menavigasi tepian jendela dan menerkam mangsa.
Kesenjangan itu—antara penguasaan AI atas pengetahuan manusia dan ketidakmampuannya untuk mencocokkan pemahaman hewan tentang dunia fisik—telah muncul sebagai tantangan penting dalam pencarian mesin yang lebih cerdas. Kepala ilmuwan AI Meta, Yann LeCun, menyoroti masalah ini minggu lalu di KTT keamanan AI Paris, dengan alasan bahwa “model dunia” —sistem AI yang membentuk representasi internal struktur, dinamika, dan hubungan sebab—bisa menjadi kunci untuk memajukan kecerdasan buatan.
Namun, beberapa peneliti terkemuka mempertanyakan apakah pendekatan ini benar-benar inovatif.
“AI telah menggunakan model dunia sejak 1950-an, dan beberapa subbidang AI bergantung sepenuhnya pada model dunia,” Stuart J. Russell, Profesor Ilmu Komputer di University of California Berkeley, mengatakan kepada IBM® Think. “Ini sama baru dan cerdiknya dengan menyarankan bahwa matematika bisa berguna untuk fisika.”
Perdebatan ini menyoroti upaya yang makin intensif untuk mencapai kecerdasan umum buatan (artificial general intelligence/AGI ), atau sistem AI yang dapat menyamai atau melampaui pembelajaran dan penalaran tingkat manusia di hampir semua domain. Tidak seperti sistem AI khusus saat ini, yang unggul dalam tugas-tugas spesifik seperti catur atau pemrosesan bahasa, AGI perlu memahami dunia secara lebih mendasar, menggabungkan kemampuan penalaran, pemahaman fisik, dan kemampuan beradaptasi.
Perusahaan teknologi besar telah mengambil pendekatan yang berbeda untuk tantangan ini. OpenAI, melalui seri GPT-nya, telah berfokus pada peningkatan model bahasa untuk mencapai penalaran yang semakin canggih. Google DeepMind, dengan sistem seperti AlphaFold dan AlphaGo, telah menargetkan domain tertentu sambil bekerja menuju kemampuan yang lebih umum. Sementara itu, Meta telah menekankan pentingnya belajar dari interaksi dunia nyata daripada teks saja.
“Tidak masalah mencoba mereproduksi kecerdasan manusia”, kata LeCun dalam konferensi. “Kita bahkan tidak bisa mereproduksi kecerdasan kucing atau kecerdasan tikus. Setiap kucing rumahan dapat merencanakan tindakan yang sangat kompleks”.
Dalam beberapa tahun terakhir, sistem AI telah dengan cepat meningkatkan skor mereka pada tolok ukur di domain tertentu. Namun, LeCun menunjukkan apa yang disebut oleh para peneliti sebagai paradoks Moravec: pengamatan bahwa keterampilan yang dianggap mudah oleh manusia sering kali terbukti paling sulit dikuasai oleh mesin.
“Hal-hal yang kami anggap remeh karena manusia dan hewan dapat melakukannya, kami Think itu tidak rumit — sebenarnya sangat rumit,” kata LeCun. “Dan hal-hal yang kami Think unik manusia, seperti memanipulasi dan menghasilkan bahasa, bermain catur, bermain go... ternyata mudah, relatif.”
Paradoks ini—bahwa AI unggul dalam tugas-tugas yang kita anggap sulit secara intelektual sekaligus kesulitan dengan kemampuan fisik dan persepsi yang tampaknya mendasar—memantik skeptisisme dari beberapa pakar.
“Proses beralih dari urutan gambar retina ke, katakanlah, persamaan Maxwell untuk elektromagnetisme memakan waktu puluhan ribu tahun bagi umat manusia dan membutuhkan proses kumulatif pembentukan konsep dan matematisasi,” kata Russell. "Saya belum pernah melihat sesuatu yang menyerupai ini dalam sistem pembelajaran mendalam saat ini."
Untuk menggambarkan keterbatasan saat ini, LeCun menunjukkan sebuah perbandingan yang mencolok: LLM modern dilatih dengan triliunan token—jumlah teks yang akan membutuhkan waktu setengah juta tahun bagi manusia untuk membacanya. Namun seorang anak berusia empat tahun, terjaga hanya sekitar 16.000 jam, memproses jumlah data yang sebanding melalui persepsi visual saja.
“Seorang anak berusia empat tahun telah melihat data sebanyak LLM terbesar dalam bentuk persepsi visual, dan untuk anak-anak tunanetra, bentuknya adalah sentuhan”, kata LeCun. “Fakta itu memberi tahu Anda sejumlah hal. Kita tidak akan pernah mencapai kecerdasan tingkat manusia hanya dengan melatih menggunakan teks”.
Pengamatan ini telah mendorong para peneliti untuk Jelajahi pendekatan baru. Di Meta, tim LeCun telah pindah dari istilah “kecerdasan umum buatan” sama sekali, lebih memilih “kecerdasan mesin canggih” (AMI). “Alasannya karena kecerdasan manusia sebenarnya cukup terspesialisasi, dan menyebutnya AGI adalah semacam istilah yang salah,” kata LeCun.
Menurut LeCun, kita perlu memikirkan kembali bagaimana AI akan berkembang. Alih-alih mencoba menyalin otak manusia, dia ingin mengubah cara AI belajar dan memahami dunia. Dia berpendapat bahwa AI perlu membangun gambaran mentalnya sendiri tentang realitas dengan mengambil informasi melalui “indera” nya, seperti mempelajari bagaimana objek fisik berperilaku hanya dengan menonton video. Sistem AI ini perlu mengingat hal-hal secara konsisten dan tahu bagaimana merencanakan tindakan mereka selangkah demi selangkah untuk menyelesaikan sesuatu.
Ilmuwan komputer berbeda tentang bagaimana sistem AI dapat mengembangkan pemahaman mereka sendiri tentang dunia. Profesor Emeritus Universitas Washington Pedro Domingos melihat kemajuan sebagai sesuatu yang mungkin terjadi tetapi tidak segera. “Ini sepenuhnya realistis untuk membangun AI yang mengembangkan model dunia mereka sendiri,” katanya kepada IBM® Think, “tetapi kami belum tahu caranya, dan lebih banyak riset diperlukan.”
Kemampuan AI saat ini tidak sesuai dengan penalaran tingkat manusia, terutama dalam menangani tugas-tugas yang kompleks. Seperti yang dikatakan Russell: “Sejak 1960-an, kami telah memahami bahwa menggunakan model dunia yang sederhana dan seragam mengarah pada masalah penalaran dan perencanaan yang benar-benar sulit diselesaikan. (Bayangkan mencoba merencanakan liburan dengan mencari tahu terlebih dahulu urutan pasti dari 800 juta aktivasi otot yang akan dibutuhkan.) Manusia, katanya, memproses informasi secara berbeda: “Alat utama yang digunakan manusia untuk mengatasi ini adalah hierarki—kami beroperasi dengan banyak model di berbagai tingkat abstraksi, mulai dari tindakan besar tingkat tinggi... hingga tindakan kecil tingkat rendah, seperti menggerakkan jari untuk mengetik huruf berikutnya 'i' di email ini.”
