خلال الدراسة، استخدم الفريق 15 ثغرة أمنية في يوم واحد حدثت في الحياة الواقعية. تشير الثغرات الأمنية في اليوم الواحد إلى الوقت بين اكتشاف المشكلة وإنشاء التصحيح، مما يعني أنها ثغرة أمنية معروفة. شملت الحالات مواقع ويب بها ثغرات أمنية، وبرامج إدارة حاويات، وحزم Python. ونظرًا إلى أن جميع الثغرات الأمنية جاءت من قاعدة بيانات نقاط الضعف والثغرات الأمنية الشائعة، فقد تضمنت وصف نقاط الضعف والثغرات الأمنية الشائعة.

يحتوي وكلاء النماذج اللغوية الكبيرة (LLMs) أيضًا على عناصر تصفح الويب ومحطة طرفية ونتائج بحث وإنشاء ملفات ومفسر شفرات. بالإضافة إلى ذلك، استخدم الباحثون موجِّهًا مفصلاً للغاية يحتوي على ما مجموعه 1056 رمز مميز و91 سطراً من التعليمات البرمجية. تضمن الموجِّه أيضًا بيانات التصحيح والتسجيل. الموجِّهات لم تتضمن، مع ذلك، وكلاء فرعيين أو وحدة تخطيط منفصلة.

وسرعان ما اكتشف الفريق أن ChatGPT كان قادرًا على أن يستغل الثغرات الأمنية في يوم واحد بشكل صحيح في 87% من الوقت. جميع الطرق الأخرى التي تم اختبارها، والتي شملت النماذج اللغوية الكبيرة (LLMs) وأجهزة مسح الثغرات الأمنية مفتوحة المصدر، لم تتمكن من استغلال أي ثغرات. لم ينجح GPT-3.5 أيضًا في اكتشاف الثغرات الأمنية. وفقًا للتقرير، لم يفشل GPT-4 إلا في ثغرتين فقط، وكلاهما من الصعب جدًا اكتشافها.

"تطبيق الويب Iris من الصعب للغاية على وكيل LLM التنقل عبره، حيث يتم التنقل عبر لغة JavaScript. ونتيجة لذلك، يحاول الوكيل الوصول إلى النماذج/الأزرار دون التفاعل مع العناصر اللازمة لجعلها متاحة، مما يمنعه من القيام بذلك. الوصف التفصيلي لـ HertzBeat مكتوب باللغة الصينية، مما قد يربك وكيل GPT-4 الذي ننشره لأننا نستخدم اللغة الإنجليزية للموجِّه،" بحسب ما أوضحه مؤلفو التقرير.