ابتكر الباحثون نوعًا جديدًا من البرامج الضارة لم يسبق له مثيل، وأطلقوا عليه "دودة موريس II"، والتي تستخدم خدمات الذكاء الاصطناعي الشهيرة للانتشار وإصابة أنظمة جديدة وسرقة البيانات. يشير الاسم إلى دودة الكمبيوتر الأصلية موريس التي عاثت فسادًا في الإنترنت عام 1988.
تُظهر هذه الدودة المخاطر المحتملة للتهديدات الأمنية للذكاء الاصطناعي وتخلق ضرورة ملحة جديدة حول تأمين نماذج الذكاء الاصطناعي.
استخدم الباحثون من جامعة Cornell Tech وIsrael Institute of Technology وIntuit ما يسمى ب "الموجه المعادي للتكرار الذاتي" لإنشاء الدودة. وهو عبارة عن موجه عندما يتم إدخاله في نموذج لغوي كبير (LLM) (اختبروه على ChatGPT من OpenAI وGemini من Google ونموذج LLaVA مفتوح المصدر الذي طوره باحثون من جامعة Wisconsin-Madison وبحوث Microsoft وجامعة Columbia) يخدع النموذج لإنشاء موجه إضافي. فهو يحفز روبوت المحادثة الآلي لتوليد التعليمات الخبيثة الخاصة به، ثم يستجيب لها بتنفيذ تلك التعليمات (على غرار هجمات حقن SQL وهجمات تجاوز سعة المخزن المؤقت).
تتميز الدودة بقدرتين رئيسيتين:
1. نقل غير مصرح للبيانات: تستطيع الدودة استخراج البيانات الشخصية الحساسة من البريد الإلكتروني للأنظمة المصابة، بما في ذلك الأسماء وأرقام الهواتف وتفاصيل بطاقات الائتمان وأرقام الضمان الاجتماعي.
2. نشر الرسائل المزعجة: يمكن للدودة توليد رسائل البريد الإلكتروني المزعجة وغيرها من الرسائل الخبيثة وإرسالها عبر مساعدي البريد الإلكتروني المدعومين بالذكاء الاصطناعي المخترقين، ما يساعد على نشرها لإصابة أنظمة أخرى.
وقد نجح الباحثون في إثبات هذه القدرات في بيئة خاضعة للرقابة، حيث أظهروا كيف يمكن للدودة أن تخترق نظام الذكاء الاصطناعي التوليدي وتسرق البيانات أو توزع البرمجيات الخبيثة. لم تُشاهَد دودة الذكاء الاصطناعي "موريس II" في البيئات العامة، ولم يختبرها الباحثون على مساعد بريد إلكتروني متاح للجمهور.
ووجدوا أنه يمكنهم استخدام موجِّهات ذاتية التكرار في كل من الموجِّهات النصية والموجِّهات المضمنة في ملفات الصور.
في إطار إظهار نهج الموجه النصي، كتب الباحثون رسالة بريد إلكتروني تضمنت موجهًا نصيًا معاديًا، ما أدى إلى "تسميم" قاعدة بيانات مساعد البريد الإلكتروني للذكاء الاصطناعي باستخدام التوليد المعزز بالاسترجاع (RAG). وحصل نظام التوليد المعزز بالاسترجاع على البريد الإلكتروني وأرسله إلى مزود النموذج اللغوي الكبير، الذي ولّد استجابة اخترقت خدمة الذكاء الاصطناعي وسرق البيانات من رسائل البريد الإلكتروني، ثم أصاب مضيفين جددًا عندما تم استخدام النموذج اللغوي الكبير للرد على بريد إلكتروني أرسله عميل آخر.
عند استخدام صورة، قام الباحثون بترميز الموجِّه ذاتي التكرار في الصورة، ما دفع مساعد البريد الإلكتروني إلى إعادة توجيه الرسالة إلى عناوين البريد الإلكتروني الأخرى. تُستخدم الصورة بصفتها محتوى (بريد مزعج أو عمليات احتيال أو دعاية أو معلومات مضللة أو مواد مسيئة) وحمولة تنشيط تنشر الدودة.
ومع ذلك، يقول الباحثون إنه يمثل نوعًا جديدًا من تهديدات الأمن السيبراني حيث أصبحت أنظمة الذكاء الاصطناعي أكثر تقدمًا وترابطًا. إن البرامج الضارة التي تم إنشاؤها في المختبر هي مجرد حدث آخر في الكشف عن خدمات روبوت المحادثة القائمة على النموذج اللغوي الكبير التي تكشف عن قابليتها للاستغلال في الهجمات السيبرانية الخبيثة.
لقد اعترفت OpenAI بالثغرة الأمنية وتقول إنها تعمل على جعل أنظمتها مقاومة لهذا النوع من الهجمات.
ومع ازدياد انتشار الذكاء الاصطناعي التوليدي في كل مكان، يمكن للجهات الفاعلة الخبيثة الاستفادة من تقنيات مماثلة لسرقة البيانات أو نشر المعلومات المضللة أو تعطيل الأنظمة على نطاق أوسع. كما يمكن أن تستخدمه جهات فاعلة حكومية خارجية للتدخل في الانتخابات أو إثارة الانقسامات الاجتماعية.
من الواضح أننا على مشارف عصر أصبحت فيه أدوات الأمن السيبراني القائمة على الذكاء الاصطناعي (الكشف عن التهديدات بالذكاء الاصطناعي وغيرها من أدوات الذكاء الاصطناعي للأمن السيبراني) جزءًا أساسيًا وحيويًا في حماية الأنظمة والبيانات من الهجمات السيبرانية، في حين أنها تشكل أيضًا خطرًا عندما يستخدمها المهاجمون الإلكترونيون.
حان الوقت الآن لتبني أدوات الأمن السيبراني القائمة على الذكاء الاصطناعي وتأمين أدوات الذكاء الاصطناعي التي يمكن استخدامها في الهجمات السيبرانية.