ما الضبط الدقيق الفعال للمعلمات (PEFT)؟

15 أغسطس 2024

المؤلفين

Cole Stryker

Editorial Lead, AI Models

Ivan Belcic

Staff writer

ما الضبط الدقيق الفعال للمعلمات (PEFT)؟

يُعد الضبط الدقيق الفعال للمعلمات (PEFT) طريقة لتحسين أداء النماذج اللغوية الكبيرة (LLMs) والشبكات العصبية المدربة لمهام أو مجموعات بيانات محددة. ويوفر الضبط الدقيق الفعال للمعلمات الوقت والموارد الحسابية من خلال تدريب مجموعة صغيرة من المعلمات والحفاظ على معظم بنية النماذج الكبيرة التي تم تدريبها مسبقًا.

يمكن للشبكات العصبية المدربة على المهام العامة مثل معالجة اللغة الطبيعية (NLP) أو تصنيف الصور أن تتخصص في مهمة جديدة ذات صلة من دون الحاجة إلى إعادة تدريبها بالكامل. الضبط الدقيق الفعال للمعلمات هي طريقة موفرة للموارد لإنشاء نماذج عالية التخصص من دون البدء من الصفر في كل مرة.

كيف تعمل عمليات الضبط الدقيق الفعال للمعلمات؟

يعمل الضبط الدقيق الفعال للمعلمات عن طريق تجميد معظم معلمات وطبقات نموذج اللغة المدرب مسبقًا مع إضافة بعض المعلمات القابلة للتدريب، والمعروفة باسم المحولات، إلى الطبقات النهائية للمهام النهائية المحددة مسبقًا.

تحتفظ النماذج المضبوطة بدقة بكل التعلم المكتسب أثناء التدريب، بينما تتخصص في مهامها النهائية المعنية. تعمل العديد من طرق الضبط الدقيق الفعال للمعلمات على تعزيز الكفاءة من خلال نقاط التحقق المتدرجة، وهي تقنية موفرة للذاكرة تساعد النماذج على التعلم من دون تخزين الكثير من المعلومات في وقت واحد.

تصميم ثلاثي الأبعاد لكرات تتدحرج على مسار

أحدث الأخبار والرؤى حول الذكاء الاصطناعي 


تتوفر معارف وأخبار منسقة بمهارة حول الذكاء الاصطناعي والسحابة وغيرها في نشرة Think الإخبارية الأسبوعية. 

لماذا يُعد الضبط الدقيق الفعال للمعلمات مهمًا؟

يوازن الضبط الدقيق الفعال للمعلمات بين الكفاءة والأداء لمساعدة المؤسسات على زيادة الموارد الحسابية إلى أقصى حد مع تقليل تكاليف التخزين. يمكن للنماذج القائمة على المحولات مثل GPT-3 وLLaMA وBERT عند ضبطها باستخدام طرق الضبط الدقيق الفعال للمعلمات استخدام جميع المعارف الموجودة في المعلمات ما قبل التدريب، بينما يكون أداؤها أفضل مما كانت عليه من دون ضبط دقيق.

غالبًا ما يُستخدم الضبط الدقيق الفعال للمعلمات أثناء التعلّم التحوّلي، حيث يتم تطبيق النماذج المُدرّبة على مهمة واحدة على مهمة ثانية ذات صلة. على سبيل المثال، قد يتم وضع نموذج مدرب على تصنيف الصور للعمل على اكتشاف الكائنات. وفي حال كان النموذج الأساسي كبيرًا جدًا بحيث لا يمكن إعادة تدريبه بالكامل أو إذا كانت المهمة الجديدة مختلفة عن الأصل، يمكن أن يكون الضبط الدقيق الفعال للمعلمات حلاً مثاليًا.

Mixture of Experts | بودكاست

فك تشفير الذكاء الاصطناعي: تقرير إخباري أسبوعي

انضم إلى لجنة عالمية المستوى من المهندسين والباحثين وقادة المنتجات وغيرهم وهم يجتازون طريق الذكاء الاصطناعي لتزويدك بأحدث أخباره والمعارف المتعلقة به.

مقارنة بين الضبط الدقيق الفعال للمعلمات والضبط الدقيق

تتضمن طرق الضبط الدقيق الكاملة التقليدية تعديلات طفيفة على جميع المعلمات في النماذج اللغوية الكبيرة المدربة مسبقًا لتكييفها مع مهام محددة. ولكن نظرًا لأن التطورات في الذكاء الاصطناعي والتعلم العميق أدت إلى نمو النماذج بشكل أكبر وأكثر تعقيدًا، أصبحت عملية الضبط الدقيق تتطلب الكثير من الموارد الحسابية والطاقة.

كما أن كل نموذج تم ضبطه بدقة له نفس حجم النموذج الأصلي. وتستهلك جميع هذه النماذج مساحة تخزين كبيرة، ما يؤدي إلى زيادة التكاليف للمؤسسات التي تستخدمها. في حين أن الضبط الدقيق يحققتعلمًا آليًا أكثر كفاءة، فإن عملية الضبط الدقيق للنماذج اللغوية الكبيرة نفسها أصبحت غير فعالة.

يقوم الضبط الدقيق الفعال للمعلمات بضبط عدد قليل من المعلمات الأكثر صلة بحالة الاستخدام المخصصة للنموذج لتقديم أداء نموذج متخصص وتقليل أوزان النموذج في الوقت نفسه لتحقيق وفورات كبيرة في تكلفة العمليات الحسابية ووقتها.

مزايا الضبط الدقيق الفعال للمعلمات

يوفر الضبط الدقيق الفعال للمعلمات ثروة من المزايا التي جعلته شائعًا لدى المؤسسات التي تستخدم النماذج اللغوية الكبيرة في عملها:

زيادة الكفاءة

يتم تشغيل معظم النماذج اللغوية الكبيرة المستخدمة في الذكاء الاصطناعي التوليدي من خلال وحدات معالجة الرسومات باهظة الثمن التي تصنعها الشركات المُصنِّعة مثل Nvidia. يستخدم كل نموذج لغوي كبير كميات كبيرة من الموارد الحسابية والطاقة. ويؤدي ضبط المعلمات الأكثر صلة فقط إلى تحقيق وفورات كبيرة في تكاليف الطاقة والحوسبة السحابية.

وقت أسرع مناسب للقيمة

الوقت المناسب للقيمة هو مقدار الوقت الذي يستغرقه تطوير النماذج اللغوية الكبيرة وتدريبها ونشرها حتى تتمكن من البدء في إنشاء قيمة للمؤسسة التي تستخدمها. ونظرًا لأن الضبط الدقيق الفعال للمعلمات لا يُعدل سوى عدد قليل من المعلمات القابلة للتدريب، فإنه يستغرق وقتًا أقل بكثير لتحديث نموذج لمهمة جديدة. يمكن للضبط الدقيق الفعال للمعلمات تقديم أداء مماثل لأداء عملية الضبط الدقيق الكامل بجزء بسيط من الوقت والنفقات.

لا يوجد نسيان كارثي

يحدث النسيان الكارثي عندما تفقد النماذج اللغوية الكبيرة أو "تنسى" المعرفة المكتسبة أثناء عملية التدريب الأولية حيث يتم إعادة تدريبها أو ضبطها لحالات الاستخدام الجديدة. ونظرًا لأن الضبط الدقيق الفعال للمعلمات يحافظ على معظم المعلمات الأولية، فإنه يحمي أيضًا من النسيان الكارثي.

انخفاض مخاطر فرط التخصيص

فرط التخصيص يحدث عندما يلتزم النموذج بشكل كبير ببيانات التدريب الخاصة به أثناء عملية التدريب، ما يجعله غير قادر على إنشاء تنبؤات دقيقة في سياقات أخرى. وتُعد نماذج المحولات التي تم ضبطها باستخدام الضبط الدقيق الفعال للمعلمات أقل عرضة لفرط التخصيص لأن معظم معلماتها تظل ثابتة.

تقليل متطلبات البيانات

يقلل الضبط الدقيق الفعال للمعلمات من متطلبات بيانات التدريب لعملية الضبط الدقيق من خلال التركيز على عدد قليل من المعلمات. ويتطلب الضبط الدقيق الكامل مجموعة بيانات تدريب أكبر بكثير لأن جميع معلمات النموذج سيتم تعديلها في أثناء عملية الضبط الدقيق.

ذكاء اصطناعي يمكن الوصول إليه بشكل أسهل

تكون تكاليف تطوير النماذج اللغوية الكبيرة المتخصصة مرتفعة للغاية من دون الضبط الدقيق الفعال للمعلمات، بحيث لا تستطيع العديد من المؤسسات الصغيرة أو المتوسطة تحملها. يوفر الضبط الدقيق الفعال للمعلمات النماذج اللغوية الكبيرة للفرق التي قد لا يتوفر لديها الوقت أو الموارد اللازمة لتدريب النماذج وضبطها.

ذكاء اصطناعي أكثر مرونة

يُمكِّن الضبط الدقيق الفعال للمعلمات علماء البيانات وغيرهم من المختصين من تخصيص النماذج اللغوية الكبيرة العامة لحالات الاستخدام الفردية. ويمكن لفرق الذكاء الاصطناعي تجربة تحسين النماذج من دون القلق بشأن استنزاف الموارد الحسابية وموارد الطاقة والتخزين.

تقنيات الضبط الدقيق الفعال للمعلمات

تمتلك فرق الذكاء الاصطناعي العديد من تقنيات وخوارزميات الضبط الدقيق الفعال للمعلمات تحت تصرفها، ولكل منها مزاياها وتخصصاتها النسبية. ويمكن العثور على العديد من أدوات الضبط الدقيق الفعال للمعلمات الأكثر شيوعًا في Hugging Face والعديد من مجتمعات GitHub الأخرى.

المحولات

تُعد المحولات إحدى أولى تقنيات الضبط الدقيق الفعال للمعلمات التي يتم تطبيقها على نماذج معالجة اللغة الطبيعية (NLP). سعى الباحثون جاهدين للتغلب على تحدي تدريب نموذج لمهام متعددة في المراحل النهائية، مع تقليل أوزان النموذج إلى الحد الأدنى. وكانت وحدات المحول هي الحل: وهي عبارة عن إضافات صغيرة تدرج حفنة من المعلمات القابلة للتدريب والمخصصة للمهام في كل طبقة محول من محولات النموذج.

LoRA

يستخدم التكييف منخفض الرتبة للنماذج اللغوية الكبيرة (LoRA) مصفوفات تحلل مزدوجة منخفضة الرتبة لتقليل أوزان النماذج وتقليل المجموعة الفرعية للمعلمات القابلة للتدريب بشكل أكبر.

QLoRA

التكيف منخفض الرتبة المُكمّم QLoRA هي نسخة موسعة من التكيف منخفض الرتبة LoRA تقوم بتكميم أو توحيد وزن كل معلمة تم تدريبها مسبقًا لتصبح 4 بتات فقط من الوزن النموذجي البالغ 32 بت. وعلى هذا النحو، يوفر التكيف منخفض الرتبة المُكمّم مساحة كبيرة للذاكرة ويجعل من الممكن تشغيل النماذج اللغوية الكبيرة على وحدة معالجة رسومات واحدة فقط.

ضبط البادئات

تم إنشاء ضبط البادئة خصوصًا لنماذج توليد اللغة الطبيعية (NLG)، حيث يُلحق ضبط البادئة متجهًا مستمرًا خاصًا بالمهمة يُعرف باسم البادئة بكل طبقة محول مع بقاء جميع المعلمات مجمدة. ومن ثمَّ، تخزّن النماذج المضبوطة مسبقًا عدد معلمات أقل بألف مرة من النماذج المضبوطة بدقة كاملة ذات الأداء المماثل.

ضبط المطالبات

يعمل ضبط المطالبات على تبسيط ضبط البادئة وتدريب النماذج عن طريق إدخال مطالبات مخصصة في بيانات الإدخال أو التدريب. يتم إنشاء المطالبات اليدوية، في حين أن المطالبات البرمجية عبارة عن سلاسل من الأرقام التي ينشئها الذكاء الاصطناعي والتي تستمد المعرفة من النموذج الأساسي. وتم العثور على مطالبات برمجية تتفوق في الأداء على المطالبات اليدوية التي ينشئها الإنسان أثناء الضبط.

ضبط P

يُعد ضبط P أحد أشكال ضبط المطالبات المصمم خصوصًا لمهام Natural Language Understanding وبدلاً من استخدام المطالبات التي يتم إنشاؤها يدويًا، يوفر ضبط P تدريب المطالبات وإنشاءها بشكل مؤتمت، ما يؤدي إلى مطالبات تدريبية أكثر تأثيرًا بمرور الوقت.

حلول ذات صلة
IBM watsonx.ai

تدريب الذكاء الاصطناعي التوليدي والتحقق من صحته وضبطه ونشره، وكذلك قدرات نماذج الأساس والتعلم الآلي باستخدام IBM watsonx.ai، وهو استوديو الجيل التالي من المؤسسات لمنشئي الذكاء الاصطناعي. أنشئ تطبيقات الذكاء الاصطناعي بسرعة أكبر وببيانات أقل.

اكتشف watsonx.ai
حلول الذكاء الاصطناعي

استفد من الذكاء الاصطناعي في عملك بالاستعانة بخبرة IBM الرائدة في مجال الذكاء الاصطناعي ومحفظة حلولها المتوفرة لك.

استكشف حلول الذكاء الاصطناعي
خدمات الذكاء الاصطناعي

أعدّ ابتكار عمليات ومهام سير العمل الحساسة بإضافة الذكاء الاصطناعي لتعزيز التجارب وصنع القرارات في الوقت الفعلي والقيمة التجارية.

استكشف خدمات الذكاء الاصطناعي
اتخِذ الخطوة التالية

احصل على وصول شامل إلى القدرات التي تغطي دورة حياة تطوير الذكاء الاصطناعي. تمكَّن من إنتاج حلول ذكاء اصطناعي قوية بفضل الواجهات سهلة الاستخدام وعمليات سير العمل السلسة وإمكانية الوصول إلى واجهات برمجة التطبيقات ومجموعات تطوير البرامج القياسية في الصناعة.

استكشف watsonx.ai احجز عرضًا توضيحيًا مباشرًا