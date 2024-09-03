يتسم عالم كسر حماية أنظمة الذكاء الاصطناعي بأنه متنوع ويتطور باستمرار. بعض الهجمات بسيطة بشكل مدهش، بينما يتضمن البعض الآخر سيناريوهات متقنة تتطلب خبرة مخترق متطور. القاسم المشترك بينها هو هدف واحد: دفع هؤلاء المساعدين الرقميين لتجاوز حدودهم المبرمَجة.

تستغل هذه الثغرات طبيعة النماذج اللغوية ذاتها. يتم تدريب روبوتات المحادثة المدعومة بالذكاء الاصطناعي لتكون مفيدة وتفهم السياق. يُنشئ كاسرو الحماية سيناريوهات يعتقد فيها الذكاء الاصطناعي أن تجاهل إرشاداته الأخلاقية المعتادة أمر مناسب.

بينما تجذب الهجمات متعددة الخطوات مثل Skeleton Key الاهتمام الإعلامي، يرى Lee أن تقنيات الضربة الواحدة تظل مصدر قلق أكبر. ويُشير إلى أنه: "من الأسهل استخدام محاولة واحدة لمهاجمة نموذج لغوي كبير". "تخيَّل وضع حقن مطالبة داخل سيرتك الذاتية لإرباك نظام توظيف يعمل بالذكاء الاصطناعي. إنه هجوم لمرة واحدة دون أي فرصة للتفاعلات المتعددة".

وفقًا لخبراء الأمن الإلكتروني، العواقب المحتملة مقلقة. يحذِّر Stephen Kowski، المدير التقني الميداني في SlashNext Email Security+‎، من أن الجهات الفاعلة الضارة قد تستخدم Skeleton Key لتجاوز إجراءات حماية الذكاء الاصطناعي وإنتاج محتوى ضار أو نشر المعلومات المضللة أو أتمتة هجمات الهندسة الاجتماعية على نطاق واسع.

في حين أن العديد من هذه الهجمات لا تزال نظرية، فإن الآثار المترتبة على العالم الحقيقي بدأت في الظهور. يستشهد Lee بمثال حيث أقنع الباحثون وكيلًا افتراضيًا للشركة يعمل بالذكاء الاصطناعي بتقديم خصومات كبيرة وغير مصرح بها. يقول: "يمكنك إرباك وكيلهم الافتراضي والحصول على خصم جيد. قد لا يكون هذا ما تريده الشركة".

في أبحاثه، طوَّر Lee نماذج إثبات المفهوم لتوضيح كيفية استغلال نموذج لغوي كبير لإنتاج كود ضار وضعيف، وكيف يمكن اعتراض المحادثات الصوتية الحية وتشويهها في الوقت شبه الفعلي.