Sejarah AI

Puncak gedung pencakar langit menembus awan

Penyusun

Tim Mucci

IBM Writer

Gather

Sejarah kecerdasan buatan

Manusia telah bermimpi menciptakan mesin berpikir sejak zaman kuno. Cerita rakyat dan upaya historis untuk membangun perangkat yang dapat diprogram mencerminkan ambisi yang telah lama ada ini dan fiksi yang berlimpah dengan kemungkinan mesin cerdas, membayangkan manfaat dan bahayanya. Tidak heran jika ketika OpenAI merilis versi pertama GPT (Generative Pretrained Transformer), teknologi ini dengan cepat mendapat perhatian yang luas, menandai sebuah langkah signifikan untuk mewujudkan impian kuno ini.

GPT-3 adalah momen penting dalam dunia AI karena ukurannya yang belum pernah terjadi sebelumnya, dengan menampilkan 175 miliar parameter, yang memungkinkannya melakukan berbagai tugas bahasa alami tanpa penyetelan yang ekstensif. Model ini dilatih menggunakan big data, memungkinkannya menghasilkan teks seperti manusia dan terlibat dalam percakapan. Model ini juga memiliki kemampuan untuk melakukan pembelajaran beberapa kali, yang secara signifikan meningkatkan manfaatnya dan menunjukkan kegunaannya dalam aplikasi AI komersial seperti chatbot dan asisten virtual.

Saat ini, AI semakin tertanam dalam berbagai aspek kehidupan sehari-hari, mulai dari media sosial hingga proses kerja, dan seiring dengan perkembangan teknologi, pengaruhnya akan terus berkembang. Untuk memahami arah yang dapat diambil oleh teknologi ini, ada baiknya kita memahami bagaimana kita sampai di sini. Berikut ini adalah sejarah perkembangan besar dalam AI:

Pra abad ke-20

1726

Novel fantastis Jonathan Swift "Gulliver's Travels" memperkenalkan ide The Engine, sebuah alat mekanik besar yang digunakan untuk membantu para sarjana dalam menghasilkan ide, kalimat, dan buku-buku baru.  

Para ahli memutar pegangan pada mesin, yang memutar balok kayu bertuliskan kata-kata. Mesin ini dikatakan dapat menciptakan ide-ide baru dan risalah filosofis dengan menggabungkan kata-kata dalam susunan yang berbeda:

"Setiap orang tahu betapa melelahkannya metode yang biasa digunakan untuk menyerap seni dan ilmu pengetahuan; sedangkan dengan penemuannya, orang yang paling bodoh sekalipun, dengan biaya yang masuk akal dan dengan sedikit kerja fisik, dapat menulis buku-buku filsafat, puisi, politik, hukum, matematika, dan teologi, tanpa sedikit pun bantuan dari kepintaran atau studi."

- Gulliver's Travels karya Jonathan Swift (1726)

Satire Swift mengantisipasi konsep pembuatan teks algoritmik, yang kini menjadi kenyataan dengan AI modern. Model AI dapat menghasilkan teks yang koheren dengan menggabungkan kata-kata dan ide berdasarkan algoritma yang mendasarinya, mirip dengan apa yang dimaksudkan untuk dilakukan oleh Mesin fiksi Swift.

1900-1950

1914

Insinyur Spanyol Leonardo Torres y Quevedo mendemonstrasikan mesin catur pertama, El Ajedrecista di Exposition Universelle di Paris. Ini menggunakan elektromagnet dan sepenuhnya otomatis. El Ajedrecista secara otomatis memainkan permainan catur sederhana yaitu raja dan benteng melawan raja. Mesin ini tidak memerlukan campur tangan manusia setelah diatur - mesin ini secara otonom membuat pindah catur yang legal dan jika lawan manusia membuat pindah ilegal, mesin akan memberi tanda kesalahan. Jika mesin ditempatkan pada posisi menang, ia mampu memeriksa lawan manusia dengan andal.

1921

Sebuah pertunjukan berjudul "Rossum's Universal Robots" (R.U.R) dibuka di London. Drama karya Karel Čapek ini merupakan pertama kalinya kata "robot" digunakan dalam bahasa Inggris. Dalam bahasa Ceko, kata "robota" diasosiasikan dengan kerja wajib atau kerja paksa yang dilakukan oleh para petani dalam sistem feodal. Istilah "robot" dengan cepat mendapatkan pengakuan internasional setelah kesuksesan drama ini dan menjadi istilah standar untuk makhluk mekanik atau buatan yang diciptakan untuk melakukan tugas. Kendati robot-robot Čapek bersifat organik, kata ini kemudian diasosiasikan dengan mesin-mesin mekanis dan humanoid yang dirancang untuk melakukan pekerjaan yang monoton dan tidak terampil.

1939

John Vincent Atanasoff, seorang profesor fisika dan matematika di Iowa State College, dan mahasiswa pascasarjana Clifford Berry, menciptakan Atanasoff-Berry Computer (ABC) dengan dana hibah sebesar USD 650 di Iowa State University. Komputer ABC dianggap sebagai salah satu komputer elektronik digital paling awal dan tonggak sejarah dalam bidang ilmu komputer Amerika.

Meskipun ABC tidak pernah sepenuhnya beroperasi atau digunakan secara luas, ABC memperkenalkan beberapa konsep utama yang akan menjadi dasar dalam pengembangan komputasi modern.

Tidak seperti perangkat komputasi sebelumnya yang mengandalkan sistem desimal, ABC menggunakan biner (1 dan 0) untuk mewakili data, yang menjadi standar untuk komputer setelahnya. ABC juga merupakan salah satu komputer pertama yang menggunakan sirkuit elektronik untuk komputasi alih-alih sistem mekanis atau elektromekanis, yang memungkinkan perhitungan yang lebih cepat dan lebih andal. ABC memisahkan penyimpanan data (memori) dari unit pemrosesan (operasi logika), prinsip yang masih diikuti dalam arsitektur komputer modern. Ini menggunakan kapasitor untuk menyimpan data dan dapat menangani hingga 30 persamaan simultan.

ABC menggunakan sekitar 300 tabung vakum untuk operasi logikanya, yang membuatnya jauh lebih cepat daripada kalkulator mekanik sebelumnya. Tabung vakum, meskipun besar dan rentan terhadap kegagalan, merupakan perkembangan utama dalam komputasi elektronik. ABC memiliki berat lebih dari 700 pon dan dapat menyelesaikan hingga 29 persamaan linier simultan.

1943

Warren S. McCulloch dan Walter Pitts memublikasikan "A Logical Calculus of the Ideas Immanent in Nervous Activity" dalam Bulletin of Mathematical Biophysics.1 Ini adalah salah satu karya penting dalam sejarah ilmu saraf dan AI. Makalah ini meletakkan dasar bagi gagasan bahwa otak dapat dipahami sebagai sistem komputasi dan memperkenalkan konsep neural networks, yang kini menjadi teknologi kunci dalam AI modern. Ide ini menginspirasi sistem komputer yang menyimulasikan fungsi dan proses seperti otak, terutama melalui neural networks dan pembelajaran mendalam.

1950

Makalah penting dari ahli matematika Inggris Alan Turing "Computing Machinery and Intelligence" diterbitkan di Mind. 2 Makalah ini adalah teks dasar dalam AI dan menjawab pertanyaan, "Bisakah mesin berpikir?" Pendekatan Turing membentuk fondasi untuk diskusi di masa depan tentang sifat mesin berpikir dan bagaimana kecerdasan mereka dapat diukur melalui "permainan imitasi", yang sekarang dikenal sebagai Uji Turing. Turing memperkenalkan eksperimen pemikiran untuk menghindari langsung menjawab pertanyaan "Bisakah mesin berpikir?" Sebaliknya, ia merumuskan ulang masalahnya ke dalam bentuk yang lebih spesifik dan operasional: Dapatkah mesin menunjukkan perilaku cerdas yang tidak dapat dibedakan dari perilaku manusia?

Uji Turing telah menjadi konsep utama dalam AI, yang berfungsi sebagai salah satu cara untuk mengukur kecerdasan mesin dengan menilai kemampuan mesin untuk meniru percakapan dan perilaku manusia secara meyakinkan.

1950–1980

1951

Marvin Minsky dan Dean Edmunds membangun neural networks pertama. Stochastic Neural Analog Reinforcement Calculator (SNARC) adalah upaya awal untuk memodelkan proses pembelajaran di otak manusia, khususnya melalui pembelajaran penguatan.

SNARC dirancang untuk menyimulasikan perilaku tikus yang menjelajahi labirin. Idenya adalah agar mesin tersebut meniru cara hewan belajar melalui penghargaan dan hukuman—dengan menyesuaikan perilakunya dari waktu ke waktu berdasarkan masukan. Ini adalah komputer analog yang menggunakan jaringan 3000 tabung vakum di samping bobot sinaptik untuk menyimulasikan 40 unit seperti neuron.

1952

Allen Newell, seorang ahli matematika dan ilmuwan komputer, dan Herbert A. Simon, seorang ilmuwan politik, mengembangkan program-program berpengaruh seperti Logic Theorist dan General Problem Solver, yang merupakan program pertama yang meniru kemampuan pemecahan masalah manusia dengan menggunakan metode komputasi.

1955

Istilah "kecerdasan buatan" pertama kali diciptakan dalam proposal lokakarya berjudul "A Proposal for the Dartmouth Summer Research Project on Artificial Intelligence,"3 yang disampaikan oleh John McCarthy dari Dartmouth College, Marvin Minsky dari Harvard University, Nathaniel Rochester dari IBM dan Claude Shannon dari Bell Telephone Laboratories.

Lokakarya, yang berlangsung setahun kemudian, pada bulan Juli dan Agustus 1956, secara umum dianggap sebagai tanggal lahir resmi bidang AI yang tengah berkembang pesat.

1957

Frank Rosenblatt, seorang psikolog dan ilmuwan komputer, mengembangkan Perceptron, neural networks buatan awal yang memungkinkan pengenalan pola berdasarkan jaringan pembelajaran komputer dua lapis. Perceptron memperkenalkan konsep pengklasifikasi biner yang dapat belajar dari data dengan menyesuaikan bobot input melalui algoritma pembelajaran. Meskipun terbatas pada pemecahan masalah yang dapat dipisahkan secara linier, ini menjadi dasar untuk neural networks dan pengembangan machine learning di masa depan.

1958

John McCarthy mengembangkan bahasa pemrograman Lisp4, yang merupakan singkatan dari LISt Processing. Lisp dikembangkan dari karya McCarthy dalam memformalkan algoritma dan logika matematika, terutama dipengaruhi oleh keinginannya untuk menciptakan bahasa pemrograman yang dapat menangani informasi simbolis. Lisp segera menjadi bahasa pemrograman paling populer yang digunakan dalam penelitian AI.

1959

Arthur Samuel memelopori konsep machine learning dengan mengembangkan program komputer yang meningkatkan kinerjanya dalam permainan catur dari waktu ke waktu. Samuel mendemonstrasikan bahwa komputer dapat diprogram untuk mengikuti aturan yang telah ditetapkan dan "belajar" dari pengalaman, yang pada akhirnya bermain lebih baik daripada programmer. Karyanya menandai langkah besar dalam mengajarkan mesin untuk berkembang melalui pengalaman, menciptakan istilah "machine learning" dalam prosesnya.

 

Oliver Selfridge menerbitkan makalahnya di "Pandemonium: Sebuah paradigma untuk belajar."5 Model kekacauan yang diusulkannya adalah sebuah sistem di mana berbagai "demon" (unit pemrosesan) bekerja bersama untuk mengenali pola. Demon bersaing untuk mengidentifikasi fitur dalam data yang belum diprogram sebelumnya, yang menyimulasikan pembelajaran tanpa pengawasan. Model Selfridge adalah kontribusi awal untuk pengenalan pola, yang memengaruhi perkembangan masa depan dalam visi mesin dan AI.

 

John McCarthy memperkenalkan konsep Advice Taker dalam makalahnya "Programs with Common Sense."6 Program ini bertujuan untuk memecahkan masalah dengan memanipulasi kalimat dalam logika formal, meletakkan dasar untuk penalaran dalam AI. McCarthy membayangkan sebuah sistem yang dapat memahami instruksi, bernalar dengan pengetahuan yang masuk akal dan belajar dari pengalaman, dengan tujuan jangka panjang mengembangkan AI yang dapat beradaptasi dan belajar seefektif manusia. Konsep ini membantu membentuk penelitian awal dalam representasi pengetahuan dan penalaran otomatis.

1965

Filsuf Hubert Dreyfus menerbitkan "Alchemy and Artificial Intelligence",7 dengan argumen bahwa pikiran manusia beroperasi secara fundamental berbeda dengan komputer. Ia memprediksi batasan kemajuan AI karena tantangan mereplikasi intuisi dan pemahaman manusia. Kritiknya berpengaruh dalam memicu perdebatan tentang batasan filosofis dan praktis AI.

 

I.J. Good menulis "Speculations Concerning the First Ultraintelligent Machine",8 yang dengan terkenal menyatakan bahwa begitu mesin ultraintelligent dibuat, ia dapat merancang sistem yang lebih cerdas lagi, menjadikannya penemuan terakhir umat manusia—asalkan teknologi ini tetap dapat dikendalikan. Ide-idenya menggambarkan diskusi modern tentang superintelligence AI dan risikonya.

 

Joseph Weizenbaum mengembangkan ELIZA,9 sebuah program yang meniru percakapan manusia dengan menanggapi input yang diketik dalam bahasa alami. Walaupun Weizenbaum bermaksud menunjukkan kedangkalan komunikasi manusia-komputer, ia terkejut dengan banyaknya pengguna yang mengaitkan emosi seperti manusia dengan program tersebut, sehingga menimbulkan pertanyaan etika tentang AI dan interaksi manusia.

 

Edward Feigenbaum, Bruce Buchanan, Joshua Lederberg, dan Carl Djerassi mengembangkan DENDRAL di Universitas Stanford.10 DENDRAL merupakan sistem pakar pertama yang mengotomatiskan proses pengambilan keputusan ahli kimia organik dengan menyimulasikan pembentukan hipotesis. Keberhasilan DENDRAL menandai kemajuan dalam AI, yang menunjukkan bagaimana sistem dapat melakukan tugas-tugas khusus serta atau lebih baik daripada pakar manusia.

1966

Dikembangkan di SRI pada akhir 1960-an, Shakey adalah robot mobile pertama yang mampu menalar tindakannya sendiri, menggabungkan persepsi, perencanaan, dan pemecahan masalah.11 Dalam artikel majalah Life tahun 1970, Marvin Minsky memperkirakan bahwa dalam waktu tiga hingga delapan tahun, AI akan mencapai kecerdasan umum seperti manusia pada umumnya. Pencapaian Shakey menandai tonggak sejarah dalam bidang robotika dan AI, meskipun target waktu yang ambisius dari Minsky terbukti terlalu optimis.

1969

Arthur Bryson dan Yu-Chi Ho memperkenalkan backpropagation, sebuah metode untuk mengoptimalkan sistem dinamis multitahap. Meskipun awalnya dikembangkan untuk sistem kontrol, algoritma ini menjadi sangat penting untuk melatih neural networks multilayer. Backpropagation menjadi terkenal pada tahun 2000-an dan 2010-an dengan kemajuan dalam daya komputasi, memungkinkan munculnya pembelajaran mendalam.

 

Marvin Minsky dan Seymour Papert menerbitkan Perceptrons: Pengantar Geometri Komputasi,12 yang secara kritis menganalisis keterbatasan neural networks. Pekerjaan mereka sering disalahkan karena mengurangi minat pada neural networks. Dalam edisi 1988, mereka berpendapat bahwa kemajuan telah terhenti karena kurangnya pemahaman teoretis meskipun telah melakukan banyak percobaan dengan perceptron pada pertengahan 1960-an.

1970

Terry Winograd menciptakan SHRDLU, sebuah program natural language understanding yang inovatif.13 SHRDLU dapat berinteraksi dengan pengguna dalam bahasa Inggris untuk memanipulasi objek di dunia blok virtual, yang menunjukkan potensi komputer untuk memahami dan merespons instruksi yang rumit. Ini adalah pencapaian awal dalam pemrosesan bahasa alami, meskipun keberhasilannya terbatas pada lingkungan yang spesifik dan sangat terstruktur. Kemampuan SHRDLU menyoroti janji dan tantangan untuk mencapai pemahaman bahasa AI yang lebih luas.

1972

Dikembangkan di Universitas Stanford, MYCIN merupakan salah satu sistem pakar pertama yang dibuat untuk membantu dokter mendiagnosis infeksi bakteri dan merekomendasikan pengobatan antibiotik.14 MYCIN menggunakan pendekatan berbasis aturan untuk menyimulasikan proses pengambilan keputusan oleh pakar manusia dan menciptakan platform untuk pengembangan sistem AI medis. Namun, karena masalah etika dan hukum, itu tidak pernah diterapkan dalam praktik klinis.

1973

James Lighthill menyajikan laporan penting kepada British Science Research Council tentang kemajuan penelitian AI, yang menyimpulkan bahwa AI telah gagal memenuhi janji awalnya.15 Dia berpendapat bahwa bidang tersebut belum menghasilkan terobosan yang signifikan, yang mengarah pada pengurangan drastis dalam pendanaan pemerintah untuk AI di Inggris. Laporan ini berkontribusi pada dimulainya winter16 AI, sebuah periode berkurangnya minat dan investasi dalam penelitian AI.

1980–2000

1980

WABOT-217, robot humanoid yang dikembangkan di Universitas Waseda, Jepang, dibangun mulai tahun 1980 dan selesai sekitar tahun 1984. Robot ini mengikuti WABOT-1, yang telah dibangun pada tahun 1973. Sementara WABOT-1 berfokus pada mobilitas dan komunikasi dasar, WABOT-2 lebih terspesialisasi, yang dirancang khusus sebagai robot musisi. Kamera ini dapat membaca partitur musik dengan mata "kameranya", berkomunikasi dengan manusia, memainkan musik pada organ elektronik dan bahkan mengiringi penyanyi manusia. Proyek ini merupakan langkah penting menuju pengembangan robot humanoid dan AI yang mampu melakukan tugas-tugas yang kompleks dan mirip manusia, seperti ekspresi artistik.

1982

Jepang meluncurkan Fifth Generation Computer Systems Project (FGCS) dengan tujuan mengembangkan komputer yang dapat menangani penalaran logis dan pemecahan masalah, sehingga mendorong penelitian AI ke depan. Proyek ambisius ini bertujuan untuk membangun mesin yang mampu melakukan tugas-tugas seperti pemrosesan bahasa alami dan sistem pakar. Meskipun dihentikan pada tahun 1992, proyek FGCS dan temuan-temuannya memberikan kontribusi yang sangat besar terhadap pengembangan bidang pemrograman logika serentak.

1984

Pada pertemuan tahunan Association for the Advancement of Artificial Intelligence (AAAI), Roger Schank dan Marvin Minsky memperingatkan tentang musim dingin AI yang akan datang, "AI Winter," memprediksi bahwa ekspektasi yang melambung tinggi terhadap AI akan segera mengarah pada penurunan investasi dan penelitian, mirip dengan penurunan pendanaan pada pertengahan 1970-an. Prediksi mereka menjadi kenyataan dalam waktu tiga tahun karena minat terhadap AI berkurang akibat janji-janji yang tidak terpenuhi, yang mengakibatkan penurunan pendanaan dan perlambatan kemajuan. Periode ini dikenal sebagai Musim Dingin AI kedua.

Peringatan Schank dan Minsky menyoroti sifat siklus hype AI, di mana tingginya optimisme diikuti oleh kekecewaan ketika teknologi gagal memenuhi harapan investor dan publik.

1986

David Rumelhart, Geoffrey Hinton dan Ronald Williams mempublikasikan makalah penting "Learning representations by back-propagating errors", di mana mereka menjelaskan algoritma backpropagation.18 Metode ini memungkinkan neural networks untuk menyesuaikan bobot internalnya dengan "back-propagating" kesalahan melalui jaringan, sehingga meningkatkan kemampuan jaringan multilayer untuk mempelajari pola-pola yang kompleks. Algoritma backpropagasi menjadi dasar untuk pembelajaran mendalam modern, memicu minat baru pada neural networks dan mengatasi beberapa keterbatasan yang disorot dalam penelitian AI sebelumnya. Penemuan ini dikembangkan dari karya Arthur Bryson dan Yu-Chi Ho pada tahun 1969 dengan menerapkan algoritme backpropagation secara khusus pada neural networks, yang mengatasi keterbatasan sebelumnya dalam melatih jaringan multilayer.

Terobosan ini membuat neural networks layak untuk aplikasi praktis dan membuka pintu bagi revolusi pembelajaran mendalam tahun 2000-an dan 2010-an.

1987

Sepanjang pidatonya di Educom, John Sculley, CEO Apple, memperkenalkan video Knowledge Navigator yang menggambarkan masa depan di mana asisten digital cerdas membantu pengguna mengakses sejumlah besar informasi melalui sistem jaringan.19 Video ini menampilkan seorang profesor yang berinteraksi dengan asisten yang berpikiran cepat dan aktivasi suara yang dapat mengambil data, menjawab pertanyaan, dan menampilkan informasi dari apa yang sekarang kita kenal sebagai internet. Video tersebut meramalkan banyak elemen teknologi modern seperti asisten AI, database pengetahuan jaringan, dan dunia digital kita yang saling berhubungan.

1988

Judea Pearl menerbitkan Probabilistic Reasoning in Intelligent Systems, yang merevolusi cara AI memproses informasi di bawah ketidakpastian.20 Karya ini memperkenalkan jaringan Bayesian, sebuah formalisme untuk merepresentasikan model probabilitas yang kompleks dan algoritma untuk melakukan inferensi di dalamnya. Metode Pearl memungkinkan sistem AI untuk membuat keputusan yang beralasan dalam lingkungan yang tidak pasti, mempengaruhi bidang-bidang yang jauh melampaui AI, termasuk teknik dan ilmu pengetahuan alam. Kontribusinya diakui dengan Penghargaan Turing 2011, yang mengutip perannya dalam menciptakan "landasan representasi dan komputasi" untuk penalaran probabilistik modern dalam AI.21

 

Rollo Carpenter mengembangkan Jabberwacky22, chatbot awal yang dirancang untuk menyimulasikan percakapan seperti manusia yang menarik, menghibur, dan lucu. Tidak seperti sistem berbasis aturan, Jabberwacky belajar dari interaksi manusia untuk menghasilkan dialog yang lebih alami, membuka jalan bagi model AI percakapan selanjutnya. Chatbot ini adalah salah satu upaya pertama untuk menciptakan AI yang meniru percakapan manusia sehari-hari yang spontan melalui pembelajaran terus-menerus dari interaksinya dengan pengguna.

 

Peneliti dari IBM T.J. Watson Research Center menerbitkan "A Statistical Approach to Language Translation", yang menandai peralihan penting dari metode berbasis aturan ke metode probabilistik dalam penerjemahan mesin.23 Pendekatan ini, yang dicontohkan oleh proyek Candide IBM24, menggunakan 2,2 juta pasangan kalimat bahasa Inggris-Prancis, yang sebagian besar bersumber dari proses Parlemen Kanada. Metodologi baru ini menekankan pembelajaran dari pola statistik dalam data daripada mencoba memahami atau "memahami" bahasa, yang mencerminkan tren yang lebih luas menuju machine learning yang bergantung pada analisis contoh yang diketahui. Model probabilistik ini membuka jalan bagi banyak kemajuan masa depan dalam pemrosesan bahasa alami dan terjemahan mesin.

 

Marvin Minsky dan Seymour Papert merilis edisi yang diperluas dari buku mereka tahun 1969, Perceptrons, sebuah kritik penting terhadap neural networks. Dalam prolog baru, berjudul "A View from 1988," mereka merefleksikan kemajuan yang lambat di bidang AI, mencatat bahwa banyak peneliti terus mengulangi kesalahan di masa lalu karena tidak terbiasa dengan tantangan sebelumnya.12 Mereka menyoroti perlunya pemahaman teoretis yang lebih dalam, yang kurang dalam penelitian Neural Networks sebelumnya. Mereka menggarisbawahi kritik asli mereka sambil mengakui pendekatan yang muncul yang nantinya akan mengarah pada kemajuan pembelajaran mendalam modern.

1989

Yann LeCun dan tim peneliti di AT&T Bell Labs mencapai terobosan dengan berhasil menerapkan algoritma backpropagation ke jaringan neural networks untuk mengenali gambar kode ZIP yang ditulis tangan.24 Ini adalah salah satu aplikasi praktis pertama dari pembelajaran mendalam menggunakan convolutional neural networks. Meskipun perangkat kerasnya terbatas pada saat itu, dibutuhkan sekitar tiga hari untuk melatih jaringan, sebuah peningkatan yang berarti dari upaya sebelumnya. Keberhasilan sistem dalam pengenalan digit tulisan tangan, tugas utama untuk mengotomatiskan layanan pos, menunjukkan potensi neural networks untuk tugas pengenalan gambar dan meletakkan dasar bagi pertumbuhan eksplosif pembelajaran mendalam dalam dekade berikutnya.

1993

Penulis fiksi ilmiah dan ahli matematika Vernor Vinge menerbitkan esai "The Coming Technological Singularity," di mana ia memprediksi bahwa kecerdasan super akan tercipta dalam 30 tahun ke depan, yang secara fundamental mengubah peradaban manusia.25 Vinge berpendapat bahwa kemajuan teknologi, terutama dalam AI, akan mengarah pada ledakan kecerdasan—mesin yang melampaui kecerdasan manusia—dan berakhirnya era manusia seperti yang kita kenal. Esainya berperan penting dalam mempopulerkan konsep "singularitas teknologi," momen ketika AI akan melampaui kendali manusia, memicu perdebatan dalam komunitas AI, etika, dan futurisme.

Prediksi ini terus memengaruhi diskusi tentang dampak potensial AI dan superintelligence, terutama risiko eksistensial dan pertimbangan etis dalam menciptakan mesin dengan kecerdasan jauh melampaui kemampuan.

1995

Richard Wallace mengembangkan chatbot A.L.I.C.E.26 (Artificial Linguistic Internet Computer Entity), yang dibangun di atas fondasi yang diletakkan oleh program ELIZA dari Joseph Weizenbaum. Tidak seperti ELIZA, yang mengandalkan tanggapan naskah untuk mensimulasikan percakapan, A.L.I.C.E. memanfaatkan World Wide Web yang baru saja muncul untuk mengumpulkan dan memproses data bahasa alami dalam jumlah besar, sehingga memungkinkannya untuk terlibat dalam percakapan yang lebih kompleks dan lancar. A.L.I.C.E. menggunakan teknik pencocokan pola yang disebut AIML (Artificial Intelligence Markup Language) untuk mengurai dan menghasilkan respons, sehingga lebih mudah beradaptasi dan dapat diskalakan daripada pendahulunya. Karya Wallace menetapkan panggung untuk kemajuan lebih lanjut dalam AI percakapan, yang memengaruhi asisten virtual dan chatbot modern.

1997

Sepp Hochreiter dan Jürgen Schmidhuber memperkenalkan Long Short-Term Memory (LSTM), sebuah jenis neural networks berulang (RNN) yang dirancang untuk mengatasi keterbatasan RNN tradisional, terutama ketidakmampuannya untuk menangkap ketergantungan jangka panjang dalam data secara efektif. Jaringan LSTM banyak digunakan dalam aplikasi seperti pengenalan tulisan tangan, pengenalan ucapan, pemrosesan bahasa alami dan perkiraan deret waktu.

 

Deep Blue dari IBM membuat sejarah dengan mengalahkan juara dunia catur Garry Kasparov dalam pertandingan enam pertandingan.27 Ini adalah pertama kalinya sebuah program permainan catur komputer mengalahkan juara dunia di bawah kontrol waktu turnamen catur standar. Kemenangan Deep Blue menunjukkan bahwa komputer dapat mengungguli manusia dalam permainan yang sangat strategis, yang telah lama dianggap sebagai ciri khas kecerdasan manusia. Kemampuan mesin untuk menghitung jutaan pindah per detik, dikombinasikan dengan kemajuan dalam teori permainan dan heuristik, memungkinkannya untuk mengalahkan Kasparov, memperkuat tempat Deep Blue dalam sejarah AI.

Peristiwa ini juga memicu perdebatan tentang hubungan masa depan antara kognisi manusia dan AI, yang memengaruhi penelitian AI selanjutnya di bidang lain seperti pemrosesan bahasa alami dan sistem otonom.

1998

Dave Hampton dan Caleb Chung menciptakan Furby, hewan peliharaan robot domestik pertama yang sukses secara luas.28 Furby dapat merespons sentuhan, suara, dan cahaya serta "belajar" bahasa dari waktu ke waktu, dimulai dari bahasanya, Furbish, tetapi secara bertahap "berbicara" lebih banyak bahasa Inggris saat berinteraksi dengan pengguna. Kemampuannya untuk meniru pembelajaran dan berinteraksi dengan pengguna membuatnya menjadi pendahulu robot sosial yang lebih canggih, yang memadukan robotika dengan hiburan untuk pertama kalinya dalam produk konsumen.

 

Yann LeCun, Yoshua Bengio, dan kolaborator mereka memublikasikan makalah yang berpengaruh tentang aplikasi neural networks untuk pengenalan tulisan tangan.29 Pekerjaan mereka berfokus pada penggunaan jaringan saraf konvolusional untuk mengoptimalkan algoritma backpropagation, membuatnya lebih efektif untuk melatih jaringan dalam. Dengan menyempurnakan proses propagasi balik dan menunjukkan kekuatan CNN untuk pengenalan gambar dan pola, penelitian LeCun dan Bengio menetapkan panggung untuk teknik pembelajaran mendalam modern yang digunakan dalam berbagai aplikasi AI saat ini.

2000–2020

2000

Cynthia Breazeal di MIT mengembangkan Kismet, sebuah robot yang dirancang untuk berinteraksi dengan manusia melalui isyarat emosional dan sosial.30 Kismet dilengkapi dengan kamera, mikrofon, dan fitur wajah yang ekspresif, yang memungkinkannya untuk memahami dan merespons emosi manusia seperti kebahagiaan, kesedihan, dan keterkejutan. Perkembangan ini menandai kemajuan dalam robotika sosial, jelajahi bagaimana robot dapat berinteraksi dengan manusia secara lebih alami.

2006

Geoffrey Hinton menerbitkan "Learning Multiple Layers of Representation," yang merangkum terobosan-terobosan utama dalam pembelajaran mendalam dan menguraikan bagaimana neural networks multilapisan dapat dilatih secara lebih efektif.31 Karya Hinton berfokus pada pelatihan neural networks dengan koneksi bertingkat untuk menghasilkan data sensorik, bukan sekadar mengklasifikasikannya. Pendekatan ini mewakili pergeseran dari neural networks tradisional ke apa yang sekarang kita sebut pembelajaran mendalam, memungkinkan mesin untuk mempelajari representasi data hierarkis yang kompleks.

2007

Fei-Fei Li dan timnya di Universitas Princeton memulai proyek ImageNet, yang menciptakan salah satu database gambar beranotasi terbesar dan paling komprehensif.32 ImageNet dirancang untuk mendukung pengembangan perangkat lunak pengenalan objek visual dengan menyediakan jutaan gambar berlabel di ribuan kategori. Skala dan kualitas kumpulan data memungkinkan kemajuan dalam penelitian visi komputer, terutama dalam melatih model pembelajaran mendalam untuk mengenali dan mengklasifikasikan objek dalam gambar.

2009

Rajat Raina, Anand Madhavan, dan Andrew Ng mempublikasikan "Large-scale Deep Unsupervised Learning using Graphics Processors", dengan argumen bahwa unit pemrosesan grafis (GPU) dapat jauh mengungguli CPU multi-inti tradisional untuk tugas-tugas pembelajaran mendalam.33 Mereka menunjukkan bahwa kekuatan komputasi GPU yang unggul dapat merevolusi penerapan metode pembelajaran mendalam tanpa pengawasan, yang memungkinkan para peneliti untuk melatih model-model yang lebih luas dan rumit dengan lebih efisien. Pekerjaan ini berperan penting dalam mempercepat adopsi GPU dalam pembelajaran mendalam, yang mengarah ke terobosan di tahun 2010-an yang mendukung aplikasi AI modern di bidang-bidang seperti visi komputer dan pemrosesan bahasa alami.

 

Ilmuwan komputer di Laboratorium Informasi Cerdas Northwestern University membangun Stats Monkey, sebuah program yang mampu secara otomatis membuat berita olahraga tanpa campur tangan manusia. Dengan menggunakan statistik pertandingan, Stats Monkey dapat membuat cerita yang jelas mengenai pertandingan baseball, yang lengkap dengan ringkasan, kinerja pemain, dan analisis.

2011

Watson dari IBM, sebuah komputer canggih yang dapat menjawab pertanyaan dengan bahasa alami, menjadi berita utama dengan berkompetisi dalam acara permainan Jeopardy! melawan dua jawara tersukses dalam acara tersebut, Ken Jennings dan Brad Rutter, dan mengalahkan mereka.35 Kemampuan Watson dalam memproses dan menginterpretasikan bahasa alami serta basis pengetahuannya yang luas memungkinkannya untuk menjawab pertanyaan-pertanyaan kompleks dengan cepat dan akurat. Kemenangan ini menyoroti kemajuan dalam kemampuan AI untuk memahami dan berinteraksi dengan bahasa manusia pada tingkat yang canggih.

 

Apple meluncurkan Siri, asisten virtual yang terintegrasi ke dalam sistem operasi iOS. Siri memiliki fitur antarmuka pengguna bahasa alami yang memungkinkan pengguna untuk berinteraksi dengan perangkat mereka melalui perintah suara. Siri dapat melakukan tugas-tugas seperti mengirim pesan, mengatur pengingat, memberikan rekomendasi, dan menjawab pertanyaan menggunakan machine learning untuk beradaptasi dengan preferensi dan pola suara setiap pengguna. Sistem pengenalan suara adaptif yang dipersonalisasi ini memberi pengguna pengalaman individual dan menandai lompatan dalam kegunaan dan aksesibilitas asisten yang didukung AI untuk konsumen sehari-hari.

2012

Jeff Dean dan Andrew Ng melakukan percobaan menggunakan neural networks besar dengan 10 juta gambar tanpa label yang bersumber dari video YouTube.36 Selama percobaan, neural networks tersebut, tanpa pelabelan sebelumnya, belajar untuk mengenali pola dalam data dan "untuk menghibur kita", satu neuron menjadi sangat responsif terhadap gambar kucing. Penemuan ini merupakan demonstrasi pembelajaran tanpa pengawasan—yang menunjukkan bagaimana neural networks dapat secara mandiri mempelajari fitur-fitur dari sejumlah besar data.

 

Peneliti dari University of Toronto, yang dipimpin oleh Geoffrey Hinton, mendesain neural networks convolutional yang mencapai hasil terobosan dalam ImageNet Large Scale Visual Recognition Challenge.37 CNN mereka, yang dikenal dengan nama AlexNet mencapai tingkat kesalahan 16%, sebuah peningkatan yang substansial dari hasil tahun sebelumnya yaitu 25%. Pencapaian ini menandai titik balik untuk pembelajaran mendalam dalam visi komputer, membuktikan bahwa CNN dapat mengungguli metode klasifikasi gambar tradisional ketika dilatih pada kumpulan data besar.

2016

AlphaGo dari Google DeepMind mengalahkan Lee Sedol, salah satu pemain Go top dunia. Go, sebuah permainan papan yang kompleks dengan lebih banyak kemungkinan gerakan daripada atom di alam semesta, telah lama dianggap sebagai tantangan bagi AI.38 Kemenangan 4-1 AlphaGo atas Sedol merupakan momen terobosan dalam AI, yang menunjukkan kekuatan teknik pembelajaran mendalam dalam mengelola tugas-tugas strategis yang sangat kompleks yang sebelumnya dianggap tidak mampu oleh AI.

Hanson Robotics memperkenalkan Sophia, robot humanoid yang sangat canggih.39 Sophia dapat mengenali wajah, melakukan kontak mata, dan melakukan percakapan dengan menggunakan kombinasi pengenalan gambar dan pemrosesan bahasa alami.

2017

Para peneliti di laboratorium Facebook Artificial Intelligence Research (FAIR) melatih dua chatbot untuk bernegosiasi satu sama lain. Meskipun chatbots diprogram untuk berkomunikasi dalam bahasa Inggris, selama percakapan mereka, mereka mulai menyimpang dari bahasa manusia yang terstruktur dan menciptakan bahasa singkatan mereka sendiri untuk berkomunikasi dengan lebih efisien.40 Perkembangan ini tidak terduga, karena bot mengoptimalkan komunikasi mereka tanpa campur tangan manusia. Eksperimen dihentikan untuk menjaga bot dalam bahasa yang dapat dimengerti manusia, tetapi kejadian tersebut menyoroti potensi sistem AI untuk berkembang secara mandiri dan tidak dapat diprediksi.

2020

OpenAI memperkenalkan GPT-3, model bahasa dengan 175 miliar parameter, menjadikannya salah satu model AI terbesar dan paling canggih hingga saat ini. GPT-3 menunjukkan kemampuan untuk menghasilkan teks seperti manusia, terlibat dalam percakapan, menulis kode, menerjemahkan bahasa, dan menghasilkan tulisan kreatif berdasarkan prompt bahasa alami. Sebagai salah satu contoh paling awal dari model bahasa besar (LLM), ukuran dan skala besar GPT memungkinkannya untuk melakukan berbagai tugas bahasa dengan sedikit atau tanpa pelatihan khusus tugas. Contoh ini menunjukkan potensi AI untuk memahami dan menghasilkan bahasa yang sangat koheren.

 

AlphaFold 2 dari DeepMind menciptakan terobosan besar dalam biologi dengan secara akurat memprediksi struktur 3D protein hanya dari urutan asam aminonya. Pencapaian ini berhasil memecahkan tantangan yang telah membingungkan para ilmuwan selama beberapa dekade memahami cara protein melipat menjadi bentuk tiga dimensi yang unik. Keakuratan tinggi AlphaFold 2 dalam memprediksi struktur protein memiliki dampak signifikan pada penelitian penyakit dan pengembangan obat. Teknologi ini membuka peluang baru untuk memahami mekanisme molekuler penyakit dan merancang terapi yang lebih efektif dan efisien.

2021 - Sekarang

2021

MUM (Multitask Unified Model), yang dikembangkan oleh Google, adalah model AI yang canggih yang dirancang untuk meningkatkan pengalaman pencarian dengan memahami dan menghasilkan bahasa di75 bahasa. MUM dapat melakukan banyak tugas, menganalisis teks, gambar, dan video secara bersamaan, sehingga memungkinkannya menangani permintaan pencarian yang lebih kompleks dan bernuansa.41 Tidak seperti model tradisional, MUM dapat menangani input multimodal dan memberikan jawaban yang komprehensif dan kaya konteks untuk pertanyaan canggih yang melibatkan berbagai sumber informasi.

 

Tesla meluncurkan Full Self-Driving (FSD) Beta, sebuah sistem bantuan pengemudi tingkat lanjut yang bertujuan untuk mencapai mengemudi secara otonom. FSD Beta menggunakan pembelajaran mendalam dan neural networks untuk menavigasi skenario mengemudi yang kompleks seperti jalanan kota secara real-time, jalan raya, dan persimpangan. Hal ini memungkinkan kendaraan Tesla untuk menyetir, berakselerasi, dan mengerem secara otonom dalam kondisi tertentu sementara tetap membutuhkan pengawasan driver. FSD Beta Tesla menandai sebuah langkah menuju tujuan perusahaan untuk kendaraan yang sepenuhnya otonom, meskipun tantangan peraturan dan masalah keselamatan tetap berada di jalur untuk mencapai penerapan teknologi mengemudi otonom secara luas.

2021–2023

OpenAI meluncurkan DALL-E, diikuti oleh DALL-E 2 dan DALL-E 3, model AI generatif yang mampu menghasilkan gambar yang sangat detail dari deskripsi tekstual. Model-model ini menggunakan pembelajaran mendalam dan arsitektur transformator untuk membuat gambar yang kompleks, realistis, dan artistik berdasarkan input pengguna. DALL-E 2 dan 3 memperluas penggunaan AI dalam pembuatan konten visual, sehingga pengguna dapat mengubah ide menjadi gambar tanpa keahlian desain grafis tradisional.

2024

Februari

Google meluncurkan Gemini 1.5 dalam versi beta terbatas, sebuah model bahasa canggih yang mampu menangani panjang konteks hingga 1 juta token.42 Model ini dapat memproses dan memahami sejumlah besar informasi dalam satu prompt, meningkatkan kemampuannya untuk mempertahankan konteks dalam percakapan dan tugas-tugas yang rumit melalui teks yang panjang. Gemini 1.5 mewakili lompatan penting dalam pemrosesan bahasa alami dengan memberikan kemampuan memori yang ditingkatkan dan pemahaman kontekstual atas input yang panjang.

 

OpenAI secara terbuka mengumumkan Sora, model teks-to-video yang mampu menghasilkan video hingga satu menit dari deskripsi tekstual.43 Inovasi ini memperluas penggunaan konten yang dihasilkan AI di luar gambar statis, sehingga memungkinkan pengguna membuat klip video yang dinamis dan terperinci berdasarkan prompt. Sora diharapkan membuka kemungkinan baru dalam pembuatan konten video.

 

StabilityAI mengumumkan Stable Diffusion 3, model text-to-image terbarunya. Layaknya Sora, Stable Diffusion 3 menggunakan arsitektur yang serupa untuk menghasilkan konten yang detail dan kreatif dari prompt teks.44

 

Mei

Google DeepMind meluncurkan ekstensi baru dari AlphaFold yang membantu mengidentifikasi kanker dan penyakit genetik, menawarkan alat yang ampuh untuk diagnosa genetik dan pengobatan yang dipersonalisasi.45

 

IBM memperkenalkan keluarga model AI generatif Granite sebagai bagian dari portofolio produk AI watsonx. Dengan kisaran 3–34 miliar parameter, model Granite dirancang untuk tugas-tugas seperti pembuatan kode, perkiraan, dan pemrosesan dokumen. Sumber terbuka dan tersedia di bawah lisensi Apache 2.0, model ini ringan, hemat biaya, dan dapat disesuaikan, menjadikannya ideal untuk berbagai aplikasi bisnis.

 

Juni

Apple mengumumkan Apple Intelligence, sebuah integrasi ChatGPT ke dalam iPhone baru dan Siri.46 Integrasi ini memungkinkan Siri untuk melakukan tugas-tugas yang lebih kompleks, melakukan percakapan yang lebih alami, dan memahami dan menjalankan perintah yang lebih detail.

 

September

NotebookLM memperkenalkan DeepDive, AI multimodal baru yang mampu mengubah materi sumber menjadi presentasi audio yang menarik dan terstruktur sebagai podcast.47 Kemampuan DeepDive untuk menganalisis dan meringkas informasi dari berbagai format, termasuk halaman web, teks, audio, dan video, membuka peluang baru untuk membuat konten yang dipersonalisasi dan otomatis di berbagai platform. Kemampuan ini menjadikannya alat serbaguna untuk produksi media dan pendidikan.

 

Tren AI saat ini mengarah pada evolusi baru AI generatif yang beroperasi pada model dasar yang lebih kecil dan lebih efisien, serta munculnya AI agen, di mana model AI tertentu bekerja sama untuk menyelesaikan permintaan pengguna dengan lebih cepat. Lebih jauh ke masa depan, kendaraan otonom akan melaju di jalan raya, AI multimodal akan menciptakan audio, video, teks dan gambar dalam satu platform, dan asisten AI akan membantu pengguna menavigasi kehidupan pribadi dan karier mereka.

Catatan kaki
  1. A logical calculus of the ideas immanent in nervous activity, springer.com, Desember 1943
  2. Computing machinery and intelligence, Mind, Oktober 1950
  3. A proposal for the Dartmouth summer research project on artificial intelligence, Stanford.edu, 31 Agustus 1955
  4. Lisp (bahasa pemrograman), wikipedia.org
  5. Pandemonium: a paradigm for learning, aitopics.org
  6. Programs with common sense, stanford.edu
  7. Alchemy and artifical intelligence, rand.org, Desember 1965
  8. Speculations concerning the first ultraintelligent machine, sciencedirect.com
  9. ELIZA, wikipedia.org
  10. Dendral, wikipedia.org
  11. Shakey the robot, sri.com
  12. Perceptrons: an introduction to computational geometry, MIT.edu
  13. SHRDLU, stanford.edu
  14. MYCIN: a knowledge-based program for infectious disease diagnosis, science.direct.com
  15. Artificial Intelligence: a general survey, chilton-computing.org.uk, Juli 1972
  16. AI winter, wikipedia.org
  17. WABOT, humanoid.waseda.ac.jp
  18. Learning representations by back-propagating errors, nature.com, 9 Oktober 1986
  19. Knowledge navigator, youtube.com, 29 April 2008
  20. Probabilistic reasoning in intelligent systems: networks of plausible inference, sciencedirect.com, 1988
  21. Judea Pearl Turing Award, amturing.amc.org
  22. Jabberwacky, wikipedia.org
  23. A statistical approach to language translation, acm.org, 22 August 1988
  24. Candide: a statistical machine translation system, aclanthology.org
  25. The coming technological singularity: how to survive in the post-human era, edoras.sdsu.edu, 1993
  26. A.L.I.C.E. (Artificial Linguistic Internet Computer Entity), wikipedia.org
  27. Deep blue (chess computer), wikipedia.org
  28. Furby, wikipedia.org
  29. Pembelajaran berbasis gradien diterapkan pada pengenalan dokumen, Stanford.edu, November 1998
  30. Kismet, mit.edu
  31. Learning multiple layers of representation, toronto.edu
  32. ImageNet, wikipedia.org
  33. Large-scale deep unsupervised learning using graphic processors, stanford.edu
  34. The robots are coming! Oh, they're here, nytimes.com, 19 Oktober 2009
  35. Watson IBM invitational, jeopardy.com, 22 Juni 2015
  36. Using large-scale brain simulations for machine learning and A.I., blog.google, 26 Juni 2012
  37. ImageNet large scale visual recognition challenge 2012, image-net.org
  38. AlphaGo, wikipedia.org
  39. We talked to Sophia, youtube.com, 28 Desember 2017
  40. Facebook's artificial intelligence robots shut down after they start talking to each other in their own language, independent.co.uk, 31 July 2017
  41. How will Google MUM affect your search ranking in 2024?, learn.g2.com. 07 Agustus 2023
  42. Our next-generation model: Gemini 1.5, blog.google, 15 Februari 2024
  43. Sora, openai.com
  44. Stable diffusion 3, stability.ai, 22 Februari 2024
  45. AlphaFold 3 predicts the structure and interactions of all of life’s molecules, blog.google, 8 Mei 2024
  46. Apple intelligence, apple.com, 10 Juni 2024
  47. NotebookLM now lets you listen to a conversation about your sources, blog.google. 11 September 2024
Buletin Think  
Insight AI dan teknologi terbaru dari Think
Daftar hari ini

Sumber daya

IBM AI Academy
Pendidikan AI
Campuran para pakar
Podcast
Cara mempertajam hasil Watson Visual Recognition menggunakan preprocessing
Blog
Masa depan AI telah terbuka
Blog
Ambil langkah selanjutnya

Latih, validasi, setel, dan terapkan model dasar AI generatif dan kemampuan machine learning dengan IBM watsonx.ai, studio perusahaan generasi berikutnya untuk pembangun AI. Bangun aplikasi AI dalam waktu singkat, dengan sedikit data.

  1. Jelajahi watsonx.ai
  2. Pesan demo langsung