Pada awal 2019, perubahan halus tetapi signifikan terjadi di dunia kecerdasan buatan. OpenAI, pemain kunci dalam bidang ini, mulai menjauh dari penekanan sebelumnya pada penelitian terbuka. Seiring waktu, akses ke kumpulan datanya menyempit, detail tentang metode pelatihannya menjadi makin sulit ditemukan dan pekerjaan internalnya menjadi lebih tertutup. Apa yang tampak seperti perubahan arah rutin pada saat itu akan terus menandai titik balik bagi AI, membentuk kembali bagaimana riset dibagikan, dikembangkan, dan diperdebatkan di seluruh dunia.
“Tidak ada visibilitas ke dalam kumpulan data mereka lagi,” kata Karen Hao, pengamat lama lapangan dan mantan Editor Senior untuk Kecerdasan Buatan di MIT Teknologi Review, dalam sebuah wawancara dengan IBM Think.
Buku baru Hao, Empire of AI, mencatat perkembangan AI generatif dari dalam, menelusuri tidak hanya motif ekonomi dan politik di balik kebangkitan perusahaan seperti OpenAI tetapi juga keputusan teknis yang tenang yang mendefinisikan ulang sains itu sendiri. “Bahkan OpenAI tidak selalu tahu apa yang ada di set pelatihan mereka. Datanya terlalu besar untuk diaudit secara manual.”
Pengakuan itu mungkin terdengar sepele bagi pengamat biasa. Namun, bagi para peneliti, ketidakmampuan untuk mengkarakterisasi atau mereplikasi data yang digunakan untuk melatih model secara andal merusak fondasi disiplin. Selama beberapa dekade, machine learning bergantung pada prinsip ilmiah yang sederhana: reproduktivitas. Model harus berperilaku dengan cara yang sama jika dilatih dalam kondisi yang sama. Namun dengan kumpulan data yang sangat besar dan tidak terkurasi saat ini, kondisi tersebut sering kali tidak dapat diketahui.
Dalam sebagian besar ilmu empiris, reproduktifivas adalah tes lakmus untuk ketelitian. Eksperimen kimia yang tidak dapat direproduksi dianggap mencurigakan. Uji coba medis dengan input yang tidak dapat dilacak tidak mungkin lulus ulasan sejawat. Dalam kecerdasan buatan, reproduktivitas secara tradisional bergantung pada peneliti yang menerbitkan tidak hanya arsitektur model dan parameter pelatihan mereka tetapi juga kumpulan data yang tepat yang digunakan untuk melatih model-model tersebut. Kumpulan data ini, apakah koleksi gambar, rekaman audio atau dokumen teks, membentuk dasar dari apa yang diketahui model dan bagaimana mereka menggeneralisasi ke input baru.
Pada awal 2010-an, model keterbukaan ini adalah normanya. Baik akademisi dan peneliti korporat sama-sama berbagi korpus pelatihan mereka, menjelaskan langkah-langkah praproses mereka, dan menjalankan pembandingan terhadap tolok ukur umum. Namun, pada tahun 2020, lingkungan telah berubah. Ketika perusahaan seperti OpenAI mulai bersaing lebih agresif untuk keuntungan komersial, praktik berbagi kumpulan data tidak disukai.
Pergeseran ini bukan hanya tentang kekayaan intelektual. Seperti yang ditunjukkan Hao, besarnya kumpulan data pelatihan modern, sering kali terdiri dari ratusan miliar token yang dipungut dari internet, membuatnya praktis tidak mungkin untuk mendokumentasikannya secara menyeluruh. Perusahaan mulai mengandalkan alat pemungutan dan penyaringan otomatis untuk mengumpulkan kumpulan data mereka. Namun, alat-alat ini tidak dapat mendeteksi masalah halus, dan mereka memperkenalkan tingkat ketidakpastian baru pada proses pelatihan.
Sebuah kasus yang mengungkap datang dari para peneliti di Stanford University, yang mengaudit kumpulan data gambar LAION-5B yang banyak digunakan. Meskipun bersifat publik, kumpulan data berisi ribuan contoh yang diverifikasi atau dicurigai sebagai materi pelecehan seksual anak. Penemuan ini datang bertahun-tahun setelah kumpulan data telah beredar bebas dan telah melatih generator gambar komersial. Episode tersebut menjadi peringatan keras. Jika bahaya sebanyak ini dapat tertanam dalam kumpulan data terbuka, apa yang mungkin mengintai di kumpulan data pribadi?
“Kami bahkan tidak dapat menjamin pembagian data uji dan pelatihan lagi,” jelas Hao, merujuk pada praktik metodologis dasar dalam machine learning.
Dalam pengaturan AI yang khas, kumpulan data dibagi menjadi dua bagian: satu bagian digunakan untuk melatih model dan yang lainnya untuk menguji kinerjanya. Ini membantu mengukur akurasi model pada data yang belum pernah dilihat sebelumnya. Namun, ketika kumpulan data begitu besar dan kabur sehingga isinya secara efektif tidak diketahui, timbul risiko bahwa konten duplikat muncul di kedua set, mencemari evaluasi dan meningkatkan metrik kinerja.
Hasilnya adalah bidang yang makin bergantung pada kepercayaan daripada verifikasi. “Ini telah menjadi lebih alkimia daripada ilmiah,” kata Hao. “Kami melemparkan lebih banyak komputasi dan lebih banyak data pada model dan berharap sesuatu muncul.”
Tidak semua orang berbondong-bondong berusaha untuk menaikkan skala. Seperti yang dijelaskan Hao, gerakan halus lainnya datang dari para peneliti yang mengikuti jalan yang berbeda. Alih-alih menjangkau database yang lebih besar, mereka mengejar kumpulan kecil data yang dipilih sendiri. Bukan berapa banyak data yang mereka miliki, tetapi bagaimana data itu menangkap nuansa bahasa, jangkauan pengalaman manusia, dan keharusan keadilan.
Sementara industri mendorong lebih banyak, ia juga menanyakan apa yang diabaikan di sepanjang jalan. DeepSpeech dari Mozilla, misalnya, adalah proyek pengenalan suara yang dibangun di atas klip audio yang disumbangkan oleh pengguna dengan persetujuan penuh. Setiap klip ditinjau dan diberi tag secara manual, dengan upaya ekstensif yang ditujukan untuk menyempurnakan kumpulan data untuk memastikan kejelasan dan keberagaman dalam hal suara, aksen, dan pola linguistik.
Demikian pula, model bahasa BLOOM, yang dikembangkan oleh konsorsium riset global di bawah bimbingan Hugging Face, dilatih pada kumpulan data publik yang dikumpulkan dengan memperhatikan keberagaman linguistik, geografis, dan topikal. Setiap sumber didokumentasikan. Audit komunitas diundang. Tidak seperti model dasar yang tidak jelas, BLOOM membuat metodologi pelatihannya terbaca.
Namun, upaya seperti itu makin dibayangi. Logika industri yang berlaku sekarang mendukung skala, kata Hao. Model yang lebih besar yang dilatih pada kumpulan data yang lebih besar cenderung menunjukkan properti yang muncul, seperti penalaran kompleks atau pembuatan kode, bahkan tanpa penyetelan khusus tugas. Ini mendorong tim untuk meninggalkan desain data yang cermat demi mengikis semua yang mereka bisa.
Pola pikir yang berfokus pada skala di OpenAI bukan hanya kesimpulan teknis. Itu adalah hasil dari sistem kepercayaan yang koheren, jika tidak ortodoks, yang dimiliki oleh kepemimpinannya, Hao menunjukkan. Dia mengatakan bahwa Ilya Sutskever, Kepala Ilmuwan di OpenAI, adalah seorang absolutis pembelajaran mendalam. Dia percaya bahwa neural networks yang cukup besar, jika diberi cukup data, pada akhirnya akan mengembangkan kecerdasan seperti manusia. Di sisi lain, Sam Altman, CEO OpenAI, mendekati kecerdasan buatan sebagai pengusaha, melihat penskalaan eksponensial sebagai jalan tercepat menuju dominasi. Greg Brockman, Presiden OpenAI, adalah pikiran teknik yang berfokus untuk mewujudkan penskalaan itu.
Arsitektur yang memungkinkan doktrin ini adalah transformer, jenis neural networks yang pertama kali diperkenalkan pada tahun 2017. Transformer unggul dalam memodelkan urutan data, seperti teks, karena mereka dapat melacak hubungan antara kata-kata jarak jauh dalam sebuah kalimat. Yang terpenting, mereka dapat ditingkatkan secara efisien. Menambahkan lebih banyak lapisan dan lebih banyak parameter meningkatkan kinerja.
Tim riset OpenAI menyadari bahwa jika mereka melatih transformer pada kumpulan data yang cukup besar dengan kekuatan komputasi yang cukup, mereka dapat melewati kebutuhan akan fitur buatan khusus, penalaran simbolis, atau desain modular. Kecerdasan, dalam pandangan mereka, akan muncul dari data.
Untuk melatih model seperti GPT-4, OpenAI tidak hanya membutuhkan ide tetapi infrastruktur. Model bahasa dengan ukuran ini membutuhkan klaster puluhan ribu unit pemrosesan grafis. Dirancang awalnya untuk merender gambar tiga dimensi, GPU terbukti sangat berguna untuk perkalian matriks di jantung neural networks. Namun, merangkai mereka bersama-sama untuk bertindak sebagai sistem terpadu membutuhkan orkestrasi perangkat lunak dan perangkat keras khusus.
Insinyur OpenAI mengembangkan teknik untuk mempartisi model menjadi pecahan, yang dapat didistribusikan ke beberapa chip dan dilatih secara paralel. Mereka membuat protokol checkpoint untuk melestarikan pelatihan parSIAL, mengurangi risiko kegagalan bencana. Mereka membangun protokol komunikasi khusus untuk menyinkronkan pembaruan di seluruh mesin. Ini bukan kemajuan glamor, tetapi itu penting.
“Tidak ada yang pernah berlatih di 10.000 chip sebelumnya,” kata Hao. “Mereka harus mengetahuinya secara real time.”
Kemajuan ini memungkinkan peningkatan model lebih cepat dan dengan efisiensi yang lebih besar daripada pesaing. Namun, mereka juga berkontribusi pada jenis kerahasiaan baru. OpenAI berhenti menerbitkan banyak detail di balik terobosanya. Mengungkapkan terlalu banyak, menurut perusahaan, akan memberikan keunggulan kompetitif.
Pada 2024, sebagian besar perusahaan teknologi besar telah menyusul. IBM, Google, Meta, Amazon, Anthropic dan pendatang baru, seperti Mistral, semuanya telah menghasilkan model bahasa besar menggunakan arsitektur transformator dan teknik pelatihan serupa. Banyak yang menggunakan pembelajaran penguatan dengan umpan balik manusia, sebuah metode di mana manusia menilai kualitas keluaran model, memungkinkan model untuk disesuaikan agar lebih selaras dengan preferensi manusia.
Bagi orang luar, perbedaan antara sistem ini menjadi lebih sulit untuk dibedakan. Pengembang aplikasi mulai merancang antarmuka yang dapat bekerja dengan model apa pun di belakang layar, memungkinkan mereka untuk beralih penyedia sesuai kebutuhan. Harga, latensi, dan waktu aktif menjadi lebih penting daripada perbedaan marjinal dalam kecerdasan.
“Semua orang mencoba menjadi model agnostik sekarang,” kata Hao. "OpenAI tidak lagi memonopoli model yang bagus."
Dengan skala yang tidak lagi menjadi pembeda, perusahaan mulai berinvestasi dalam paradigma yang berbeda: agensi. Dalam kecerdasan buatan, agensi mengacu pada kemampuan sistem untuk mengambil inisiatif, bertahan dari waktu ke waktu dan bertindak menuju tujuannya. Alih-alih bereaksi terhadap prompt, agen merencanakan tindakan, memantau hasil, dan menyesuaikan perilaku.
Ini membutuhkan kemampuan baru. Model harus mempertahankan memori di seluruh sesi, berintegrasi dengan alat pihak ketiga dan membuat keputusan tanpa petunjuk eksplisit. Tujuannya adalah pindah dari chatbot pasif ke kolaborator aktif.
OpenAI telah lama terinspirasi oleh film "Her", di mana seorang pengguna jatuh cinta dengan asisten AI yang beradaptasi dengan lancar dengan kebutuhannya. Menciptakan sistem seperti itu berarti mengembangkan tidak hanya kecerdasan, tetapi kehadiran. Hao mencatat bahwa tim internal OpenAI telah mengejar mimpi ini di seluruh domain produk dan penelitian.
“Anda tidak dapat membangun asisten semacam itu tanpa memberikan memori, ketekunan, dan otonomi model,” katanya.
Namun, untuk membuat agen benar-benar efektif, OpenAI membutuhkan lebih dari sekadar algoritma. Dibutuhkan jenis data baru dan cara baru untuk mengumpulkannya. Internet, yang dulunya merupakan sumber data pelatihan yang melimpah, telah menjadi jenuh dengan konten sintetis. Banyak dokumen yang sekarang tersedia secara online sendiri dihasilkan oleh model sebelumnya.
Ini menciptakan loop masukan di mana pelatihan online menjadi makin kurang berharga. Untuk memutus lingkaran, perusahaan beralih ke pengumpulan data yang lebih intim. Hao melaporkan bahwa OpenAI sedang menjelajahi perangkat khusus yang dapat menangkap perilaku pengguna real-time, dari interaksi mobile hingga percakapan suara dan konteks lingkungan.
“Ada terlalu banyak konten yang dihasilkan AI secara online,” kata Hao. “Jika Anda menginginkan data berkualitas tinggi, Anda harus mendapatkannya langsung dari orang-orang.”
Gelombang konten yang dihasilkan oleh AI yang makin meningkat, kata Hao, menimbulkan pertanyaan sulit tentang persetujuan, pengawasan, dan kontrol. Apakah orang benar-benar dapat memilih untuk tidak membiarkan data mereka dikumpulkan? Dan apa pendapat mereka akan memiliki model yang dilatih pada kata-kata, gambar, atau perilaku mereka?
Bagi Hao, jawabannya bukan terletak pada tekno-optimisme atau kiamat, tetapi pada transparansi. Dia tidak menganut ideologi dominan dalam AI—apa yang dia sebut “boomer,” yang percaya kecerdasan buatan akan menyelamatkan umat manusia, atau “doomer” yang takut itu akan menghancurkan kita.
"Saya berada di pihak akuntabilitas," katanya. "Sistem ini mencerminkan kekuatan institusional. Kita perlu tahu bagaimana mereka dibuat dan siapa yang mendapat manfaat.”
Perusahaan perlu menjelaskan bagaimana model mereka diuji, data apa yang mereka gunakan dan bagaimana mereka memahami hasilnya, kata Hao. Mereka harus melacak kesalahan dan membagikan temuan mereka sehingga orang lain dapat melihat lebih dekat.
Tanpa keterbukaan semacam ini, Hao memperingatkan, AI berisiko menjadi kotak hitam berpemilik — kuat, tetapi tidak dapat dipertanggungjawabkan.
