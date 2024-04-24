Para peneliti dari Cornell Tech, Institut Teknologi Israel, dan Intuit menggunakan apa yang mereka sebut sebagai “prompt yang mereplikasi diri adversarial” untuk membuat worm. Ini adalah prompt yang, ketika dimasukkan ke dalam model bahasa besar (LLM) (mereka mengujinya pada ChatGPT milik OpenAI, Gemini milik Google, serta model sumber terbuka LLaVA yang dikembangkan oleh peneliti dari University of Wisconsin-Madison, Microsoft Research, dan Columbia University), akan mengecoh model untuk menghasilkan prompt tambahan. Hal ini memicu chatbot membuat prompt berbahaya miliknya sendiri, yang kemudian dijalankan dengan melaksanakan instruksi tersebut (mirip dengan injeksi SQL dan serangan buffer overflow).

Worm memiliki dua kemampuan utama:

1. Eksfiltrasi data: Worm dapat mengekstrak data pribadi yang sensitif dari sistem email yang terinfeksi, termasuk nama, nomor telepon, detail kartu kredit, dan nomor jaminan sosial.

2. Propagasi spam: Worm dapat menghasilkan dan mengirim spam serta email berbahaya lainnya melalui asisten email yang didukung AI yang telah dikompromikan, sehingga membantunya menyebar dan menginfeksi sistem lain.

Para peneliti berhasil mendemonstrasikan kemampuan ini dalam lingkungan yang terkendali, menunjukkan bagaimana worm dapat memanfaatkan ekosistem AI generatif untuk mencuri data atau mendistribusikan malware. Worm AI “Morris II” belum ditemukan di alam liar, dan para peneliti tidak mengujinya pada asisten email yang tersedia untuk umum.

Mereka menemukan bahwa mereka dapat menggunakan prompt yang mereplikasi diri, baik dalam prompt teks maupun prompt yang disematkan dalam file gambar.