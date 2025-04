يعدّ ضبط التعليمات جزءًا من الفئة الأوسع من تقنيات التخصيص (التدريب الدقيق) المستخدمة لتكييف نماذج الأساس المدربة مسبقا لأداء مهام متخصصة. يمكن تخصيص نماذج الأساس لأغراض متعددة، بدءًا من تخصيص الأسلوب مرورًا بتعزيز المعرفة والمفردات الأساسية للنموذج المدرب مسبقًا ووصولًا إلى تحسين الأداء لحالة استخدام معينة. على الرغم من أن التخصيص لا يقتصر على مجال محدد أو بنية معينة لنموذج ذكاء اصطناعي، إلا أنه أصبح جزءا لا يتجزأ من دورة حياة نماذج LLM. على سبيل المثال، يتم تقديم عائلة نموذج Llama 2 من Meta (بأحجام مختلفة) كنموذج أساسي، وكنسخة مخصصة للمحادثة (Llama-2-chat) وكنسخة مخصصة للبرمجة (Code Llama).

ضبط التعليمات ليس حصرًا على تقنيات التخصيص الأخرى. على سبيل المثال، غالبا ما تخضع نماذج المحادثة لكل من ضبط التعليمات والتعلم المعزز من تعليقات البشر (RLHF)، وهي تقنية تخصيص تهدف إلى تحسين صفات مثل المساعدة والصدق. أما النماذج المخصصة للبرمجة، فتخضع عادةً لضبط التعليمات (لتحسين الاستجابة للتعليمات بشكل عام) بالإضافة إلى تخصيص إضافي لبيانات برمجية محددة (لتعزيز معرفة النموذج بصياغة البرمجة والمفردات).

تعود صول نماذج LLMs إلى الورقة البحثية لعام 2017 بعنوان "Attention is All You Need" التي قدمت نموذج المحول واسع النطاق لمهام معالجة اللغة الطبيعية (NLP)، لكن دمج ضبط التعليمات و التعلم RLHF-- المستند إلى أوراق بحثية مؤثرة من Google (في عام 2021)1 وOpenAI (في عام 2022)- 2 - أدى إلى ظهور نماذج LLMs الحديثة التي أطلقت عصر الذكاء الاصطناعي التوليدي، بدءًا بإطلاق ChatGPT.