Gagasan ecerdasan umum buatan (AGI) —AI yang dapat berpikir, bernalar, dan belajar di berbagai tugas setara dengan manusia—telah lama menjadi topik yang kontroversial. Beberapa pakar berpendapat bahwa AGI masih membutuhkan waktu bertahun-tahun untuk terwujud, sedangkan sebagian lainnya meragukan kemungkinan AGI dapat diwujudkan sama sekali. Di kubu lain, beberapa ahli menyatakan bahwa AGI bukanlah tujuan yang tepat untuk diprioritaskan. “Kita tidak boleh melupakan kekuatan model-model ini di domain non-bahasa lainnya,” kata Marina Danilevsky, Ilmuwan Riset Senior di IBM®, pada sebuah episode podcast Mixture of Experts. “Jika kita benar-benar memperluas di mana teknologi ini dapat digunakan... kita bisa pergi ke tempat-tempat yang jauh lebih menarik, jauh lebih pragmatis, jauh lebih praktis... [alih-alih] mengejar AGI.”

Sutton mengambil sikap yang terukur. Dia memperkirakan satu dari empat kemungkinan bahwa AI dapat mencapai kecerdasan tingkat manusia dalam lima tahun dan peluang 50% dalam 15 tahun. Itu perkiraan yang sangat optimis dibandingkan dengan banyak rekan-rekannya, yang sering memprediksi AGI masih beberapa dekade lagi.

“Masih ada terobosan yang dibutuhkan,” akunya. "Tapi kami semakin dekat. Bagian terbesar yang hilang adalah bagaimana membuat sistem AI belajar dari pengalaman dengan cara yang lebih alami, daripada kumpulan data berlabel yang diberi makan sendok.

Seperti yang dijelaskan Sutton, salah satu tantangan terbesar adalah mengajarkan AI untuk memahami perencanaan dan abstraksi jangka panjang—kemampuan untuk memecah masalah kompleks menjadi bagian-bagian yang lebih kecil dan dapat dikelola, seperti yang dilakukan manusia.

“Jika saya menyuruh Anda menyeberang jalan, Anda tidak memikirkan setiap gerakan otot kecil.” Anda memikirkan tujuannya: menyeberang jalan. AI perlu belajar seperti itu, pada tingkat abstraksi yang lebih tinggi,” jelas Sutton.

Salah satu kontribusi utamanya untuk pembelajaran penguatan adalah konsep abstraksi temporal, yang memungkinkan AI untuk belajar dalam langkah-langkah daripada terjebak dalam manajemen mikro. Ini bisa sangat penting untuk sistem AI yang perlu bernalar di cakrawala waktu yang panjang—sesuatu yang diperjuangkan oleh model saat ini.

Sebagai contoh, asisten AI mungkin mampu memberikan jawaban yang baik untuk satu pertanyaan, tetapi kesulitan mempertahankan percakapan yang logis dalam beberapa interaksi atau merencanakan tugas kompleks yang berlangsung dalam rentang waktu—seperti memesan liburan yang melibatkan koordinasi penerbangan, hotel, dan aktivitas. Sutton percaya bahwa pembelajaran penguatan dan algoritma penalaran jangka panjang yang lebih baik akan menjadi kunci untuk mengatasi keterbatasan ini.