Model AI tidak hanya memproses lebih banyak data; mereka juga menangani data secara berbeda dari sistem lama. Jika perangkat lunak tradisional secara tidak sengaja mengekspos informasi sensitif, seorang insinyur dapat masuk dan men-debug kode. Tetapi model AI (termasuk model bahasa besar seperti ChatGPT) tidak dikodekan sebanyak yang dibuat untuk berkembang melalui proses yang disebut machine learning. Pencipta mereka sendiri tidak tahu persis bagaimana mereka bekerja, membuat “debugging” menjadi tidak sepele, jika bukan tidak mungkin.

Output yang tidak disengaja adalah salah satu kategori kekhawatiran, tetapi organisasi juga perlu waspada terhadap serangan berbahaya yang disengaja. Peneliti telah menunjukkan bahwa alat AI mengandung jenis kerentanan baru yang dapat dieksploitasi oleh peretas pintar, bidang yang dikenal sebagai machine learning adversarial.

Dalam beberapa tahun terakhir, misalnya, pakar keamanan siber telah menunjukkan bahwa dengan mengeksploitasi satu keanehan model AI—yaitu, bahwa output mereka diberi skor kepercayaan yang lebih tinggi saat menanggapi data yang telah mereka latih—aktor jahat dapat menyimpulkan apakah data tertentu ada dalam set pelatihan. Dalam skenario tertentu, kesimpulan seperti itu akan menjadi pelanggaran privasi besar. Misalnya, pertimbangkan model AI yang diketahui telah dilatih pada catatan perawatan kesehatan pribadi pasien positif HIV.

Dalam contoh terkenal lainnya, para peneliti lebih dari sekadar menyimpulkan apakah data ada dalam set pelatihan. Mereka menciptakan serangan algoritmik yang secara efektif dapat merekayasa balik data aktual yang digunakan untuk melatih model. Dengan mengeksploitasi aspek model AI yang dikenal sebagai "gradien", para peneliti dapat secara berulang menyempurnakan gambar yang dipenuhi noise menjadi gambar yang mendekati wajah sebenarnya yang telah digunakan untuk melatih model pengenalan wajah.2

Pertaruhan seputar perlindungan data tetap tinggi:Laporan Biaya Pelanggaran Data IBM tahun 2025 menetapkan bahwa biaya rata-rata pelanggaran tersebut adalah USD 4,4 juta. (Pelanggaran semacam itu juga memerlukan biaya yang sulit diukur dalam bentuk kerusakan kepercayaan publik terhadap merek seseorang.)

Sementara banyak dari pelanggaran data ini tidak melibatkan AI, semakin banyak yang melakukannya. Laporan Indeks AI 2025 Stanford menemukan bahwa jumlah insiden privasi dan keamanan AI melonjak 56,4% dalam setahun, dengan 233 kasus yang dilaporkan pada tahun 2024.3