يُعد الضبط الدقيق الفعال للمعلمات (PEFT) طريقة لتحسين أداء النماذج اللغوية الكبيرة (LLMs) والشبكات العصبية المدربة لمهام أو مجموعات بيانات محددة. ويوفر الضبط الدقيق الفعال للمعلمات الوقت والموارد الحسابية من خلال تدريب مجموعة صغيرة من المعلمات والحفاظ على معظم بنية النماذج الكبيرة التي تم تدريبها مسبقًا.
يمكن للشبكات العصبية المدربة على المهام العامة مثل معالجة اللغة الطبيعية (NLP) أو تصنيف الصور أن تتخصص في مهمة جديدة ذات صلة من دون الحاجة إلى إعادة تدريبها بالكامل. الضبط الدقيق الفعال للمعلمات هي طريقة موفرة للموارد لإنشاء نماذج عالية التخصص من دون البدء من الصفر في كل مرة.
يعمل الضبط الدقيق الفعال للمعلمات عن طريق تجميد معظم معلمات وطبقات نموذج اللغة المدرب مسبقًا مع إضافة بعض المعلمات القابلة للتدريب، والمعروفة باسم المحولات، إلى الطبقات النهائية للمهام النهائية المحددة مسبقًا.
تحتفظ النماذج المضبوطة بدقة بكل التعلم المكتسب أثناء التدريب، بينما تتخصص في مهامها النهائية المعنية. تعمل العديد من طرق الضبط الدقيق الفعال للمعلمات على تعزيز الكفاءة من خلال نقاط التحقق المتدرجة، وهي تقنية موفرة للذاكرة تساعد النماذج على التعلم من دون تخزين الكثير من المعلومات في وقت واحد.
يوازن الضبط الدقيق الفعال للمعلمات بين الكفاءة والأداء لمساعدة المؤسسات على زيادة الموارد الحسابية إلى أقصى حد مع تقليل تكاليف التخزين. يمكن للنماذج القائمة على المحولات مثل GPT-3 وLLaMA وBERT عند ضبطها باستخدام طرق الضبط الدقيق الفعال للمعلمات استخدام جميع المعارف الموجودة في المعلمات ما قبل التدريب، بينما يكون أداؤها أفضل مما كانت عليه من دون ضبط دقيق.
غالبًا ما يُستخدم الضبط الدقيق الفعال للمعلمات أثناء التعلّم التحوّلي، حيث يتم تطبيق النماذج المُدرّبة على مهمة واحدة على مهمة ثانية ذات صلة. على سبيل المثال، قد يتم وضع نموذج مدرب على تصنيف الصور للعمل على اكتشاف الكائنات. وفي حال كان النموذج الأساسي كبيرًا جدًا بحيث لا يمكن إعادة تدريبه بالكامل أو إذا كانت المهمة الجديدة مختلفة عن الأصل، يمكن أن يكون الضبط الدقيق الفعال للمعلمات حلاً مثاليًا.
تتضمن طرق الضبط الدقيق الكاملة التقليدية تعديلات طفيفة على جميع المعلمات في النماذج اللغوية الكبيرة المدربة مسبقًا لتكييفها مع مهام محددة. ولكن نظرًا لأن التطورات في الذكاء الاصطناعي والتعلم العميق أدت إلى نمو النماذج بشكل أكبر وأكثر تعقيدًا، أصبحت عملية الضبط الدقيق تتطلب الكثير من الموارد الحسابية والطاقة.
كما أن كل نموذج تم ضبطه بدقة له نفس حجم النموذج الأصلي. وتستهلك جميع هذه النماذج مساحة تخزين كبيرة، ما يؤدي إلى زيادة التكاليف للمؤسسات التي تستخدمها. في حين أن الضبط الدقيق يحققتعلمًا آليًا أكثر كفاءة، فإن عملية الضبط الدقيق للنماذج اللغوية الكبيرة نفسها أصبحت غير فعالة.
يقوم الضبط الدقيق الفعال للمعلمات بضبط عدد قليل من المعلمات الأكثر صلة بحالة الاستخدام المخصصة للنموذج لتقديم أداء نموذج متخصص وتقليل أوزان النموذج في الوقت نفسه لتحقيق وفورات كبيرة في تكلفة العمليات الحسابية ووقتها.
يوفر الضبط الدقيق الفعال للمعلمات ثروة من المزايا التي جعلته شائعًا لدى المؤسسات التي تستخدم النماذج اللغوية الكبيرة في عملها:
يتم تشغيل معظم النماذج اللغوية الكبيرة المستخدمة في الذكاء الاصطناعي التوليدي من خلال وحدات معالجة الرسومات باهظة الثمن التي تصنعها الشركات المُصنِّعة مثل Nvidia. يستخدم كل نموذج لغوي كبير كميات كبيرة من الموارد الحسابية والطاقة. ويؤدي ضبط المعلمات الأكثر صلة فقط إلى تحقيق وفورات كبيرة في تكاليف الطاقة والحوسبة السحابية.
الوقت المناسب للقيمة هو مقدار الوقت الذي يستغرقه تطوير النماذج اللغوية الكبيرة وتدريبها ونشرها حتى تتمكن من البدء في إنشاء قيمة للمؤسسة التي تستخدمها. ونظرًا لأن الضبط الدقيق الفعال للمعلمات لا يُعدل سوى عدد قليل من المعلمات القابلة للتدريب، فإنه يستغرق وقتًا أقل بكثير لتحديث نموذج لمهمة جديدة. يمكن للضبط الدقيق الفعال للمعلمات تقديم أداء مماثل لأداء عملية الضبط الدقيق الكامل بجزء بسيط من الوقت والنفقات.
يحدث النسيان الكارثي عندما تفقد النماذج اللغوية الكبيرة أو "تنسى" المعرفة المكتسبة أثناء عملية التدريب الأولية حيث يتم إعادة تدريبها أو ضبطها لحالات الاستخدام الجديدة. ونظرًا لأن الضبط الدقيق الفعال للمعلمات يحافظ على معظم المعلمات الأولية، فإنه يحمي أيضًا من النسيان الكارثي.
فرط التخصيص يحدث عندما يلتزم النموذج بشكل كبير ببيانات التدريب الخاصة به أثناء عملية التدريب، ما يجعله غير قادر على إنشاء تنبؤات دقيقة في سياقات أخرى. وتُعد نماذج المحولات التي تم ضبطها باستخدام الضبط الدقيق الفعال للمعلمات أقل عرضة لفرط التخصيص لأن معظم معلماتها تظل ثابتة.
يقلل الضبط الدقيق الفعال للمعلمات من متطلبات بيانات التدريب لعملية الضبط الدقيق من خلال التركيز على عدد قليل من المعلمات. ويتطلب الضبط الدقيق الكامل مجموعة بيانات تدريب أكبر بكثير لأن جميع معلمات النموذج سيتم تعديلها في أثناء عملية الضبط الدقيق.
تكون تكاليف تطوير النماذج اللغوية الكبيرة المتخصصة مرتفعة للغاية من دون الضبط الدقيق الفعال للمعلمات، بحيث لا تستطيع العديد من المؤسسات الصغيرة أو المتوسطة تحملها. يوفر الضبط الدقيق الفعال للمعلمات النماذج اللغوية الكبيرة للفرق التي قد لا يتوفر لديها الوقت أو الموارد اللازمة لتدريب النماذج وضبطها.
يُمكِّن الضبط الدقيق الفعال للمعلمات علماء البيانات وغيرهم من المختصين من تخصيص النماذج اللغوية الكبيرة العامة لحالات الاستخدام الفردية. ويمكن لفرق الذكاء الاصطناعي تجربة تحسين النماذج من دون القلق بشأن استنزاف الموارد الحسابية وموارد الطاقة والتخزين.
تمتلك فرق الذكاء الاصطناعي العديد من تقنيات وخوارزميات الضبط الدقيق الفعال للمعلمات تحت تصرفها، ولكل منها مزاياها وتخصصاتها النسبية. ويمكن العثور على العديد من أدوات الضبط الدقيق الفعال للمعلمات الأكثر شيوعًا في Hugging Face والعديد من مجتمعات GitHub الأخرى.
تُعد المحولات إحدى أولى تقنيات الضبط الدقيق الفعال للمعلمات التي يتم تطبيقها على نماذج معالجة اللغة الطبيعية (NLP). سعى الباحثون جاهدين للتغلب على تحدي تدريب نموذج لمهام متعددة في المراحل النهائية، مع تقليل أوزان النموذج إلى الحد الأدنى. وكانت وحدات المحول هي الحل: وهي عبارة عن إضافات صغيرة تدرج حفنة من المعلمات القابلة للتدريب والمخصصة للمهام في كل طبقة محول من محولات النموذج.
يستخدم التكييف منخفض الرتبة للنماذج اللغوية الكبيرة (LoRA) مصفوفات تحلل مزدوجة منخفضة الرتبة لتقليل أوزان النماذج وتقليل المجموعة الفرعية للمعلمات القابلة للتدريب بشكل أكبر.
التكيف منخفض الرتبة المُكمّم QLoRA هي نسخة موسعة من التكيف منخفض الرتبة LoRA تقوم بتكميم أو توحيد وزن كل معلمة تم تدريبها مسبقًا لتصبح 4 بتات فقط من الوزن النموذجي البالغ 32 بت. وعلى هذا النحو، يوفر التكيف منخفض الرتبة المُكمّم مساحة كبيرة للذاكرة ويجعل من الممكن تشغيل النماذج اللغوية الكبيرة على وحدة معالجة رسومات واحدة فقط.
تم إنشاء ضبط البادئة خصوصًا لنماذج توليد اللغة الطبيعية (NLG)، حيث يُلحق ضبط البادئة متجهًا مستمرًا خاصًا بالمهمة يُعرف باسم البادئة بكل طبقة محول مع بقاء جميع المعلمات مجمدة. ومن ثمَّ، تخزّن النماذج المضبوطة مسبقًا عدد معلمات أقل بألف مرة من النماذج المضبوطة بدقة كاملة ذات الأداء المماثل.
يعمل ضبط المطالبات على تبسيط ضبط البادئة وتدريب النماذج عن طريق إدخال مطالبات مخصصة في بيانات الإدخال أو التدريب. يتم إنشاء المطالبات اليدوية، في حين أن المطالبات البرمجية عبارة عن سلاسل من الأرقام التي ينشئها الذكاء الاصطناعي والتي تستمد المعرفة من النموذج الأساسي. وتم العثور على مطالبات برمجية تتفوق في الأداء على المطالبات اليدوية التي ينشئها الإنسان أثناء الضبط.
يُعد ضبط P أحد أشكال ضبط المطالبات المصمم خصوصًا لمهام Natural Language Understanding وبدلاً من استخدام المطالبات التي يتم إنشاؤها يدويًا، يوفر ضبط P تدريب المطالبات وإنشاءها بشكل مؤتمت، ما يؤدي إلى مطالبات تدريبية أكثر تأثيرًا بمرور الوقت.
تدريب الذكاء الاصطناعي التوليدي والتحقق من صحته وضبطه ونشره، وكذلك قدرات نماذج الأساس والتعلم الآلي باستخدام IBM watsonx.ai، وهو استوديو الجيل التالي من المؤسسات لمنشئي الذكاء الاصطناعي. أنشئ تطبيقات الذكاء الاصطناعي بسرعة أكبر وببيانات أقل.
استفد من الذكاء الاصطناعي في عملك بالاستعانة بخبرة IBM الرائدة في مجال الذكاء الاصطناعي ومحفظة حلولها المتوفرة لك.
أعدّ ابتكار عمليات ومهام سير العمل الحساسة بإضافة الذكاء الاصطناعي لتعزيز التجارب وصنع القرارات في الوقت الفعلي والقيمة التجارية.
تعلّم كيف يمكن للمديرين التنفيذيين تحقيق التوازن بين القيمة التي يمكن أن يقدمها الذكاء الاصطناعي مقابل الاستثمار الذي يتطلبه والمخاطر التي يثيرها.
تعلّم المفاهيم الأساسية وطوّر مهاراتك من خلال المختبرات العملية والدورات التدريبية والمشاريع الموجهة والتجارب وغيرها.
تعرّف على كيفية دمج الذكاء الاصطناعي التوليدي والتعلّم الآلي بثقة في أعمالك
هل ترغب في زيادة عائد استثماراتك في الذكاء الاصطناعي؟ تعرّف على كيفية تأثير توسيع نطاق الذكاء الاصطناعي التوليدي في المجالات الرئيسية، من خلال مساعدة أفضل العقول لديك على وضع حلول مبتكرة جديدة وطرحها.
لقد قمنا باستطلاع آراء 2000 مؤسسة حول مبادرات الذكاء الاصطناعي لديها لمعرفة ما ينجح وما لا ينجح وكيف يمكنك المضي قدمًا.
يُعَد IBM Granite مجموعة من نماذج الذكاء الاصطناعي المفتوحة والموثوق بها وذات الأداء العالي، وهي مصممة خصيصًا للأعمال ومُحسَّنة لتوسيع نطاق تطبيقات الذكاء الاصطناعي لديك. استكشف خيارات اللغة والتعليمات البرمجية والسلاسل الزمنية وضوابط الحماية.
تعرّف على كيفية اختيار نموذج أساس الذكاء الاصطناعي الأكثر ملاءمة لحالة الاستخدام الخاصة بك.
تعمّق في العناصر الثلاثة الهامة لاستراتيجية الذكاء الاصطناعي القوية: إنشاء ميزة تنافسية، وتوسيع نطاق الذكاء الاصطناعي عبر الأعمال، وتطوير الذكاء الاصطناعي الجدير بالثقة.