النماذج اللغوية المقنعة (MLM) هي نوع من النماذج اللغوية الكبرى (LLM) المستخدمة للمساعدة على التنبؤ بالكلمات المفقودة من النص في مهام معالجة اللغة الطبيعية (NLP). وعليه، تُعد النمذجة اللغوية المقنعة أحد أشكال تدريب نماذج المحولات—ولا سيما تمثيلات التشفير ثنائية الاتجاه من المحولات (BERT) ومشتقاته المحسنة بقوة والمدربة مسبقًا (RoberTA)—على مهام معالجة اللغة الطبيعية من خلال تدريب النموذج على ملء الكلمات المقنعة داخل النص، ومن ثَم التنبؤ بالكلمات الأكثر احتمالية وتماسكًا لإكمال النص.1

تساعد النمذجة اللغوية المقنعة في العديد من المهام—بدءًا من تحليل المشاعر إلى توليد النصوص—من خلال تدريب النموذج على فهم العلاقة السياقية بين الكلمات. في الواقع، غالبًا ما يستخدم المطورون الباحثون النمذجة اللغوية المقنعة لإنشاء نماذج مدربة مسبقًا تخضع لمزيد من الضبط الدقيق الخاضع للإشراف للمهام اللاحقة، مثل تصنيف النصوص أو الترجمة الآلية. ومن ثَم، تدعم النماذج اللغوية المقنعة العديد من خوارزميات النمذجة اللغوية الحديثة. على الرغم من أن النمذجة اللغوية المقنعة هي طريقة للتدريب المسبق للنماذج اللغوية، فإن المصادر الإلكترونية تشير إليها أحيانًا على أنها طريقة تعلم بالنقل. قد يكون هذا مبررًا، حيث بدأت بعض مجموعات البحث في تطبيق النمذجة اللغوية المقنعة كمهمة نهائية بحد ذاتها.

تحتوي محولات HuggingFace ومكتبات Tensorflow النصية على دوال مصممة لتدريب النماذج اللغوية المقنعة في Python واختبارها، سواء كمهام نهائية أو مهام لاحقة.