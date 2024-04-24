Para peneliti telah menciptakan jenis malware baru yang belum pernah terlihat sebelumnya, yang mereka sebut worm "Morris II", yang memanfaatkan layanan AI populer untuk menyebarkan diri, menginfeksi sistem baru, dan mencuri data. Nama tersebut merujuk pada worm komputer Morris asli yang menyebabkan kekacauan di internet pada tahun 1988.
Worm ini menunjukkan potensi bahaya ancaman keamanan AI dan menciptakan urgensi baru seputar pengamanan model AI.
Para peneliti dari Cornell Tech, Institut Teknologi Israel, dan Intuit menggunakan apa yang mereka sebut sebagai “prompt yang mereplikasi diri adversarial” untuk membuat worm. Ini adalah prompt yang, ketika dimasukkan ke dalam model bahasa besar (LLM) (mereka mengujinya pada ChatGPT milik OpenAI, Gemini milik Google, serta model sumber terbuka LLaVA yang dikembangkan oleh peneliti dari University of Wisconsin-Madison, Microsoft Research, dan Columbia University), akan mengecoh model untuk menghasilkan prompt tambahan. Hal ini memicu chatbot membuat prompt berbahaya miliknya sendiri, yang kemudian dijalankan dengan melaksanakan instruksi tersebut (mirip dengan injeksi SQL dan serangan buffer overflow).
Worm memiliki dua kemampuan utama:
1. Eksfiltrasi data: Worm dapat mengekstrak data pribadi yang sensitif dari sistem email yang terinfeksi, termasuk nama, nomor telepon, detail kartu kredit, dan nomor jaminan sosial.
2. Propagasi spam: Worm dapat menghasilkan dan mengirim spam serta email berbahaya lainnya melalui asisten email yang didukung AI yang telah dikompromikan, sehingga membantunya menyebar dan menginfeksi sistem lain.
Para peneliti berhasil mendemonstrasikan kemampuan ini dalam lingkungan yang terkendali, menunjukkan bagaimana worm dapat memanfaatkan ekosistem AI generatif untuk mencuri data atau mendistribusikan malware. Worm AI “Morris II” belum ditemukan di alam liar, dan para peneliti tidak mengujinya pada asisten email yang tersedia untuk umum.
Mereka menemukan bahwa mereka dapat menggunakan prompt yang mereplikasi diri, baik dalam prompt teks maupun prompt yang disematkan dalam file gambar.
Dalam mendemonstrasikan pendekatan prompt teks, para peneliti menulis email yang menyertakan prompt teks adversarial, “meracuni” basis data asisten email AI menggunakan retrieval-augmented generation (RAG), yang memungkinkan LLM mengambil data eksternal. RAG menerima email tersebut dan mengirimkannya ke penyedia LLM, yang kemudian menghasilkan respons yang melakukan jailbreak pada layanan AI, mencuri data dari email, dan selanjutnya menginfeksi host baru ketika LLM digunakan untuk membalas email yang dikirim oleh klien lain.
Saat menggunakan gambar, para peneliti menyandikan prompt yang mereplikasi diri ke dalam gambar tersebut, sehingga asisten email meneruskan pesan ke alamat email lain. Gambar tersebut berfungsi sebagai konten (spam, penipuan, propaganda, disinformasi, atau materi penyalahgunaan) sekaligus muatan aktivasi yang menyebarkan worm.
Namun, para peneliti mengatakan bahwa hal tersebut merepresentasikan jenis ancaman keamanan siber baru seiring sistem AI menjadi semakin maju dan saling terhubung. Malware buatan laboratorium ini hanyalah contoh terbaru dari layanan chatbot berbasis LLM yang menunjukkan kerentanannya untuk dieksploitasi dalam serangan siber berbahaya.
OpenAI telah mengakui kerentanan dan mengatakan sedang berupaya membuat sistemnya tahan terhadap serangan semacam ini.
Ketika AI generatif menjadi semakin luas digunakan, aktor jahat dapat memanfaatkan teknik serupa untuk mencuri data, menyebarkan informasi yang salah, atau mengganggu sistem dalam skala yang lebih besar. Teknologi ini juga bisa dimanfaatkan oleh aktor negara asing untuk campur tangan dalam pemilihan atau memicu perpecahan sosial.
Kita jelas memasuki era di mana alat keamanan siber AI (deteksi ancaman AI dan bentuk AI keamanan siber lainnya) telah menjadi komponen inti dan penting untuk melindungi sistem serta data dari serangan siber, sekaligus menimbulkan risiko ketika dimanfaatkan oleh penyerang siber.
Saatnya sekarang untuk merangkul alat keamanan siber AI dan mengamankan alat AI yang dapat digunakan untuk serangan siber.