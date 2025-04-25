Tolok ukur, biaya inferensi, inovasi: bagaimana AI mengubah cara hidup kita? Tahun ini, Laporan Indeks AI 2025 Stanford menambahkan area cakupan baru untuk mencerminkan peran AI yang berkembang dalam setiap aspek kehidupan kita.
IBM Think membongkar beberapa tren utama dalam laporan tersebut dengan Vanessa Parli, Director of Research Program di Stanford institute untuk Human-Centered Artificial Intelligence, dan Ash Minhas, Content Manager di IBM.
Sebuah topik hangat, jika memang pernah ada, tolok ukur telah menjadi perdebatan utama saat ini karena kemampuan AI berkembang begitu cepat dan secara konsisten mengungguli alat yang digunakan untuk mengukurnya.
“Setiap tahun, kami melihat bagaimana algoritme ini berkinerja di seluruh tolok ukur, dan setiap tahun sepertinya mereka mengalahkan tolok ukur tersebut,” kata Vanessa Parli, salah satu penulis laporan, dalam sebuah wawancara dengan IBM Think. “Demikian pula, tahun ini, hal itu terjadi bahkan dengan tolok ukur yang lebih baru.”
Laporan tersebut mencatat bahwa pada tahun 2023, para peneliti memperkenalkan tolok ukur baru, MMMU, GPQA, dan SWE-bench, untuk menguji batas-batas sistem AI yang canggih. Hanya setahun kemudian, kinerja meningkat tajam: skor naik masing-masing sebesar 18,8, 48,9, dan 67,3 poin persentase di MMMU, GPQA dan SWE-bench, menurut laporan tersebut.
Hal ini menimbulkan ambiguitas dalam komunitas riset tentang makna dan nilai sebenarnya dari tolok ukur LLM. Parli mengajukan pertanyaan penting untuk dipertimbangkan: “Apakah kita mengukur hal yang benar? Apakah tolok ukur itu telah terkompromi? Dan bagaimana seharusnya komunitas ilmiah mengevaluasi model?”
Berpikir ke depan, Ash Minhas juga mempertanyakan seperti apa masa depan tolok ukur nantinya. “Kapan itu akan berhenti?” ia bertanya dalam sebuah wawancara dengan IBM Think. “Apakah Tes Turing akan selalu menjadi sasaran yang terus berubah? Apakah ujian terakhir manusia memang yang terakhir?”
Sementara itu, para pakar memperingatkan terhadap risiko overfitting, sebuah fenomena di mana model AI telah belajar untuk berkinerja sangat baik pada tes tolok ukur tertentu tetapi mungkin gagal untuk menyesuaikan diri dengan data baru yang belum pernah ditemui dalam penerapan dunia nyata. “Apakah kita hanya melatih model untuk lulus tolok ukur?” ia menambahkan. “MMMU adalah tolok ukur yang baik, tetapi apakah itu karena model tahu cara menanggapi tolok ukur?”
Minhas juga memperingatkan bahwa antusias dan momentum kemajuan dapat menjadi prioritas alih-alih kepedulian pada etika, keadilan, dan bias.
Dengan Nobel Prize di bidang Fisika dan Kimia tahun lalu diberikan kepada para peneliti yang bekerja pada jaringan saraf buatan serta desain dan prediksi protein, sulit untuk mengabaikan pentingnya peran AI yang berkembang di bidang medis. Laporan tersebut mencatat bahwa jumlah perangkat medis berbasis AI yang disetujui FDA telah tumbuh secara eksponensial: pada tahun 2023, 223 disetujui, dibandingkan dengan hanya enam pada tahun 2015.
“Area AI yang meningkatkan penemuan ilmiah ini dapat berdampak besar pada masyarakat kita”, kata Parli.
Menurut Minhas, pertumbuhan ini menunjukkan laju inovasi yang cepat, tetapi juga menimbulkan pertanyaan: “Apakah kita memiliki pakar yang tepat dan keterampilan yang tepat untuk dapat menguji berbagai perangkat dan produk baru ini?”
AI telah menjadi kekuatan utama di balik investasi besar pada tahun 2024. Jumlah perusahaan rintisan AI generatif yang baru didanai naik hampir tiga kali lipat, dan setelah bertahun-tahun adopsi yang lambat, adopsi bisnis meningkat secara signifikan pada tahun 2024, menurut laporan tersebut.
AI telah beralih dari posisi yang kurang penting menjadi pendorong utama nilai bisnis. Total investasi perusahaan dalam AI mencapai 252,3 miliar USD pada tahun 2024, dengan investasi swasta melonjak 44,5%, serta merger dan akuisisi meningkat 12,1% dibandingkan tahun sebelumnya. Hal tersebut turut mendorong ekosistem perusahaan rintisan yang berkembang di AS, di mana investasi AI swasta mencapai 109,1 miliar USD pada tahun 2024.
Di lingkungan kerja, AI juga merupakan pemain utama, dan banyak yang mengantisipasi dampak AI agen pada alur kerja perusahaan
Namun, bisnis bergerak pada kecepatan yang berbeda dari inovasi. “Teknologi ini melompat maju, tetapi orang-orang dan proses-proses membutuhkan waktu untuk berubah”, kata Minhas.
Dampak AI pada ROI masih bisa diperdebatkan, ujarnya. “Belum ada pemahaman yang baik tentang manfaat ekonomi,” kata Minhas. “Tidak ada yang setuju apa ROI-nya, dan tidak ada yang benar-benar tahu.”
Laporan tersebut menyoroti bahwa negara-negara di seluruh dunia juga meningkatkan investasi mereka dalam infrastruktur, dan, tentu saja, peluncuran model AI canggih dari Tiongkok menunjukkan bahwa kemajuan AS tidak bisa dianggap remeh.
“Saya tidak berpikir kita bisa begitu saja meremehkan bahwa AS akan selalu berada di posisi teratas daftar ini, dan kita perlu terus memikirkan komponen-komponen AI ini: komputasi, bakat, data”, kata Parli. “Kita harus terus berinvestasi jika ingin mempertahankan kepemimpinan inovasi yang kita miliki di masa lalu, dan memastikan bahwa kita memiliki bahan yang tepat untuk mewujudkannya.”
Namun, laporan tersebut menyoroti tren lain yang menarik, bahkan mungkin kontradiktif, yaitu: negara-negara dengan investasi tertinggi di bidang AI, seperti Amerika Serikat, menunjukkan lebih banyak keraguan terhadap produk dan layanan AI daripada negara-negara dengan anggaran teknologi AI yang lebih terbatas.
Menurut angka yang dibagikan dalam laporan tersebut, 80% orang yang disurvei di Indonesia percaya produk AI lebih bermanfaat daripada berbahaya, dibandingkan dengan hanya 39% di AS.
“Di banyak negara, AI memungkinkan akses ke sumber daya tertentu, [seperti] layanan kesehatan, misalnya, dan saya pikir kita mungkin akan lebih optimis tentang AI dan perbedaan budaya,” jelas Parli. “Ada juga perbedaan budaya seputar pertanyaan seperti privasi, keamanan, dan privasi data.”
Pada akhirnya, AI akan lebih banyak hadir di ruang fisik.
Laporan tersebut menemukan bahwa dari 2013 hingga 2023, jumlah robot industri yang diinstal secara global kira-kira tiga kali lipat, dengan 541.000 diinstal pada tahun 2023.
“Dengan beberapa alat AI, di mana Anda dapat berbicara dengan robot dalam bahasa alami, Anda dapat menggunakan gerakan”, kata Parli. “Anda dapat bekerja lebih dekat dengan robot, [dan] akan lebih mudah untuk berkolaborasi dengan mereka. Saya melihat layanan kesehatan sebagai area di mana robotika akan melangkah lebih jauh.”
