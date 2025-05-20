Mengetahui bagaimana model bahasa besar bekerja sangat penting untuk memahami mengapa mereka terkadang salah. LLM memprediksi kata berikutnya dalam kalimat berdasarkan pola yang telah mereka pelajari dari sejumlah besar teks. Mereka tidak menarik fakta dari database tetapi membuat tebakan yang terdidik. Hal ini dapat menyebabkan jawaban yang terdengar akurat tetapi salah, terutama ketika topiknya tidak jelas, tidak biasa atau di luar apa yang telah dilatih oleh model.

Halusinasi sulit untuk dihilangkan karena mereka bukan bug dalam sistem; mereka adalah fitur yang melek at dari bagaimana model probabilistik ini bekerja. Ketika tidak ada pola solid yang tersedia dalam data pelatihan, atau ketika prompt terlalu kabur atau terbuka, model dapat menciptakan sesuatu yang terdengar masuk akal.

Ada juga pertanyaan yang lebih filosofis yang dimainkan. Ketika model AI menciptakan sesuatu, apakah model tersebut gagal atau berhasil?

Puri mencatat bahwa ketika model menjadi lebih kuat dalam penalaran mereka, mereka mungkin juga menunjukkan perilaku yang lebih “kreatif” yang berbatasan dengan halusinasi. “Orang bisa berargumen bahwa kreativitas melibatkan semacam halusinasi,” katanya. “Anda membayangkan hal yang tak terbayangkan. Namun dalam aplikasi perusahaan, hal itu merupakan suatu kewajiban, bukan kekuatan.”

Peneliti IBM Payel Das termasuk di antara mereka yang mencoba mengatasi masalah ini dengan memikirkan kembali bagaimana model menangani informasi. “Ini adalah paradoks kemajuan,” kata Das kepada IBM Think dalam sebuah wawancara. “Model-model ini semakin baik dalam penalaran, tetapi belum tentu dalam mengingat. Mereka bisa memecahkan masalah yang lebih sulit tetapi masih salah dasar-dasarnya.”

Timnya di IBM telah mengembangkan Larimar, sistem augmentasi memori yang dirancang untuk memberikan model bentuk memori jangka pendek yang dapat diedit. Idenya adalah membiarkan model merevisi atau melupakan fakta sesuai kebutuhan, tanpa melatih ulang seluruh sistem; fleksibilitas waktu nyata yang sebagian besar kurang dimiliki oleh LLM saat ini.

“Model saat ini statis dan rapuh,” katanya. “Anda tidak bisa mengajari mereka sesuatu di tengah percakapan atau memperbarui pemahaman mereka tanpa melatih mereka sepenuhnya. Larimar adalah langkah untuk membuat mereka lebih fleksibel.”

Pendekatan berbasis memori lainnya juga menunjukkan harapan. MemReasoner, yang dikembangkan oleh para peneliti Microsoft, berfokus untuk membantu model bernalar secara lebih efektif di seluruh rangkaian panjang dengan memilih dan menghubungkan informasi yang relevan dari bagian awal percakapan. Proyek CameLot IBM sendiri dirancang untuk membantu model tetap koheren saat bekerja dengan volume besar teks atau interaksi yang diperluas.

Di luar laboratorium, perusahaan seperti Vectara membangun alat praktis untuk mengatasi halusinasi. “Agen penjaga” Vectara memantau output AI secara real-time dan menulis ulang kesalahan sebelum mencapai pengguna. Das mengatakan meskipun tidak ada perbaikan tunggal yang akan menyelesaikan masalah, menggabungkan strategi memori dan revisi adalah langkah maju yang kuat.

“Kami tidak akan pernah menghilangkan setiap kesalahan,” kata Das. “Sama seperti manusia yang melakukan kesalahan. Tetapi kita dapat membuat model yang lebih baik dalam belajar, beradaptasi, dan mengoreksi diri mereka sendiri. Dan itu membuat perbedaan besar.”