Organisasi memiliki serangkaian proyek baru yang sedang dibangun dengan memanfaatkan AI generatif. Selama fase pengumpulan dan penanganan data, Anda perlu mengumpulkan sejumlah besar data untuk dimasukkan ke model dan Anda menyediakan akses ke beberapa orang, termasuk ilmuwan data, insinyur, pengembang, dan lainnya. Hal ini menghadirkan risiko dengan memusatkan semua data itu di satu tempat dan memberi akses ke sana kepada banyak orang. Ini berarti bahwa AI generatif adalah jenis penyimpanan data baru yang dapat membuat data baru berdasarkan data organisasi yang ada. Apakah Anda melatih model, mengadaptasinya, atau menghubungkannya ke RAG (Vector DB), data tersebut kemungkinan memiliki PII, masalah privasi, dan informasi sensitif lainnya di dalamnya. Gundukan data sensitif ini adalah target merah yang berkedip-kedip yang akan dicoba untuk diakses oleh para penyerang.

Dalam pengembangan model, aplikasi baru sedang dibangun dengan cara baru dengan kerentanan baru yang menjadi titik masuk baru yang akan coba dieksploitasi oleh penyerang. Pengembangan sering dimulai dengan tim sains data mengunduh dan menggunakan kembali model pembelajaran mesin sumber terbuka yang telah dilatih sebelumnya dari repositori model online seperti HuggingFace atau TensorFlow Hub. Repositori berbagi model sumber terbuka telah lahir dari kompleksitas ilmu data yang melekat, kekurangan praktisi, dan nilai yang mereka berikan kepada organisasi dalam hal mengurangi waktu dan upaya secara drastis yang diperlukan untuk adopsi AI generatif. Namun, repositori semacam itu mungkin tidak memiliki kontrol keamanan yang komprehensif, yang pada akhirnya meneruskan risiko ke perusahaan—dan penyerang mengandalkannya. Penyerang dapat menyuntikkan backdoor atau malware ke salah satu model ini dan mengunggah model yang terinfeksi kembali ke repositori berbagi model, mempengaruhi siapa saja yang mengunduhnya. Kekurangan keamanan secara umum di sekitar model ML, ditambah dengan semakin sensitifnya data yang diekspos oleh model ML, berarti bahwa serangan yang menargetkan model ini memiliki kemungkinan besar untuk menyebabkan kerusakan.

Dan selama inferensi dan penggunaan langsung, penyerang dapat memanipulasi perintah untuk menerobos pengaman dan membujuk model agar berperilaku buruk dengan menghasilkan respons yang tidak diizinkan terhadap perintah berbahaya termasuk informasi yang bias dan beracun lainnya, yang menimbulkan kerusakan reputasi. Atau, penyerang dapat memanipulasi model dan menganalisis pasangan input-output untuk melatih model pengganti untuk meniru perilaku model target, yang secara efektif “mencuri” kemampuannya, merugikan keunggulan kompetitif perusahaan.