استخدم الباحثون من جامعة Cornell Tech وIsrael Institute of Technology وIntuit ما يسمى ب "الموجه المعادي للتكرار الذاتي" لإنشاء الدودة. وهو عبارة عن موجه عندما يتم إدخاله في نموذج لغوي كبير (LLM) (اختبروه على ChatGPT من OpenAI وGemini من Google ونموذج LLaVA مفتوح المصدر الذي طوره باحثون من جامعة Wisconsin-Madison وبحوث Microsoft وجامعة Columbia) يخدع النموذج لإنشاء موجه إضافي. فهو يحفز روبوت المحادثة الآلي لتوليد التعليمات الخبيثة الخاصة به، ثم يستجيب لها بتنفيذ تلك التعليمات (على غرار هجمات حقن SQL وهجمات تجاوز سعة المخزن المؤقت).

تتميز الدودة بقدرتين رئيسيتين:

1. نقل غير مصرح للبيانات: تستطيع الدودة استخراج البيانات الشخصية الحساسة من البريد الإلكتروني للأنظمة المصابة، بما في ذلك الأسماء وأرقام الهواتف وتفاصيل بطاقات الائتمان وأرقام الضمان الاجتماعي.

2. نشر الرسائل المزعجة: يمكن للدودة توليد رسائل البريد الإلكتروني المزعجة وغيرها من الرسائل الخبيثة وإرسالها عبر مساعدي البريد الإلكتروني المدعومين بالذكاء الاصطناعي المخترقين، ما يساعد على نشرها لإصابة أنظمة أخرى.

وقد نجح الباحثون في إثبات هذه القدرات في بيئة خاضعة للرقابة، حيث أظهروا كيف يمكن للدودة أن تخترق نظام الذكاء الاصطناعي التوليدي وتسرق البيانات أو توزع البرمجيات الخبيثة. لم تُشاهَد دودة الذكاء الاصطناعي "موريس II" في البيئات العامة، ولم يختبرها الباحثون على مساعد بريد إلكتروني متاح للجمهور.

ووجدوا أنه يمكنهم استخدام موجِّهات ذاتية التكرار في كل من الموجِّهات النصية والموجِّهات المضمنة في ملفات الصور.