تستغل عمليات حقن المطالبات حقيقة أن تطبيقات النموذج اللغوي الكبير لا تميِّز بوضوح بين تعليمات المطوِّر ومدخلات المستخدم. ومن خلال كتابة مطالبات مصممة بعناية، يمكن للمخترقين تجاوز تعليمات المطوِّر وجَعْل النموذج اللغوي الكبير ينفِّذ تعليماتهم.

لفهم هجمات حقن المطالبات، من المفيد أن نلقي نظرة أولًا على كيفية إنشاء المطورين للعديد من التطبيقات المدعومة بالنماذج اللغوية الكبيرة.

النماذج اللغوية الكبيرة هي نوع من نماذج الأساس، وهي نموذج تعلّم آلي عالي المرونة تم تدريبه على مجموعة بيانات ضخمة. يمكن تكييفها مع المهام المختلفة من خلال عملية تُعرَف باسم "الضبط الدقيق للتعليمات". يُعطي المطورون النموذج اللغوي الكبير مجموعة من التعليمات باللغة الطبيعية لمهمة ما، ويتَّبِعها النموذج.

بفضل الضبط الدقيق للتعليمات، لا يحتاج المطورون إلى كتابة أي كود لبرمجة تطبيقات النموذج اللغوي الكبير. بدلًا من ذلك، يمكنهم كتابة مطالبات النظام، وهي عبارة عن مجموعات تعليمات تخبر نماذج الذكاء الاصطناعي بكيفية التعامل مع إدخال المستخدم. عندما يتفاعل المستخدم مع التطبيق، تتم إضافة إدخاله إلى مطالبة النظام، وتتم تغذية الأمر برمته إلى النموذج اللغوي الكبير كأمر واحد.

تنشأ ثغرة حقن المطالبات لأن كلًا من المطالبة وإدخالات المستخدم تأخذ التنسيق نفسه: سلاسل من نص باللغة الطبيعية. وهذا يعني أن النموذج اللغوي الكبير لا يمكنه التمييز بين التعليمات والإدخال بناءً على نوع البيانات فقط. بدلًا من ذلك، يعتمد على التدريب السابق والمطالبات نفسها لتحديد ما يجب القيام به. إذا قدَّم المهاجم إدخالًا يبدو كافيًا مثل مطالبة النظام، فإن النموذج اللغوي الكبير يتجاهل تعليمات المطورين ويفعل ما يريده المخترق.

كانت عالمة البيانات Riley Goodside من أوائل من اكتشفوا حقن المطالبات. استخدمت Goodside تطبيق ترجمة بسيطًا مدعومًا بنموذج لغوي كبير لتوضيح كيفية عمل الهجمات. وفيما يلي نسخة معدلة قليلًا من مثال Goodside‎2: