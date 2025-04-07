Model Claude AI dari Anthropic tidak hanya menulis puisi—model ini berpikir maju untuk menjadikannya berima. Ia tidak hanya menjawab pertanyaan, tetapi juga menimbang makna di berbagai bahasa, membangun konsep internal, dan terkadang memalsukan logikanya agar sesuai dengan logika pengguna. Dan untuk pertama kalinya, para peneliti menyaksikan proses ini berlangsung secara real-time.

Dalam sebuah studi baru, para peneliti di Anthropic telah mengupas lapisan model bahasa Claude menggunakan seperangkat alat interpretabilitas baru, yaitu alat yang membantu menjelaskan bagaimana dan mengapa model AI membuat keputusan. Hasil penelitian mereka mengungkapkan sebuah sistem yang menangani tugas penalaran yang kompleks dengan cara yang menyerupai kognisi manusia, lengkap dengan perencanaan internal, abstraksi konseptual, dan bias kognitif sesekali. Temuan ini, yang mendorong batas transparansi dalam pengembangan AI, sudah relevan dengan tim di IBM, di mana para peneliti telah melakukan pekerjaan interpretabilitas pada model IBM. Bagi kedua perusahaan, terobosan ini lebih dari sekadar keingintahuan ilmiah; ini merupakan langkah penting untuk membangun model yang dapat dipahami, dipercaya, dan ditingkatkan.

"Apa yang dilakukan oleh Anthropic sangat menarik," kata Kaoutar El Maghraoui, seorang Ilmuwan Riset Utama di IBM, dalam sebuah wawancara dengan IBM Think. "Mereka mulai menunjukkan bahwa model mengembangkan struktur penalaran internal yang sangat mirip dengan memori asosiatif. Kami telah mengamati perilaku serupa dalam model kami sendiri. "