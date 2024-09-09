تتعلّم النماذج اللغوية الكبيرة (LLMs)، المُدرَّبة على تيرابايتات من البيانات، "اتخاذ" القرارات وإصدار التنبؤات من دون برمجتها صراحةً للقيام بذلك. هذا الفرع من الذكاء الاصطناعي، المعروف باسم التعلم الآلي، ازداد شيوعًا مع تقليد خوارزميات التعلم الآلي لطريقة تعلّم البشر، مما أدّى تدريجيًا إلى تحسين دقّة المحتوى الذي تولّده.

ولكن المزيد من البيانات يعني أيضًا المزيد من المشكلات. وكما تقول Nathalie Baracaldo، كبيرة الباحثين في IBM: "أي بيانات يتعلّمها النموذج — الجيدة والسيئة — ستبقى."

وهكذا، يمكن للنماذج الأكبر حجمًا من أي وقت مضى أن تولِّد مزيدًا من اللغة السامة والبغيضة، وأن تحتوي على بيانات حساسة لا تتماشى مع معايير الأمن السيبراني. لماذا؟ يتم تدريب هذه النماذج على بيانات غير منظمة وغير موثوقٍ بها من الإنترنت. حتى مع وجود محاولات صارمة لتصفية البيانات، ومواءمة النماذج لتحديد الأسئلة التي لا ينبغي الإجابة عنها وما الإجابات التي ينبغي تقديمها، واستخدام حواجز حماية أخرى لفحص مخرجات النموذج، لا يزال السلوك غير المرغوب فيه والبرمجيات الضارة والمواد السامة والمحتوى المحمي بحقوق الطبع والنشر يتسلل.

إعادة تدريب هذه النماذج لإزالة البيانات غير المرغوب فيها يستغرق شهورًا ويتطلّب ملايين الدولارات. وعلاوة على ذلك، عندما تكون النماذج مفتوحة المصدر، تنتقل أي ثغرات في النموذج الأساسي إلى العديد من النماذج والتطبيقات الأخرى.

وتهدف أساليب إلغاء التعلّم إلى التخفيف من هذه المشكلات. من خلال تحديد أهداف إلغاء التعلّم، مثل نقاط بيانات محددة تتضمّن محتوى يحتوي على لغة ضارّة أو غير أخلاقية أو محمية بحقوق الطبع والنشر أو موجِّهات نصية غير مرغوب فيها، تزيل خوارزميات إلغاء التعلّم تأثير المحتوى المستهدف بكفاءة.