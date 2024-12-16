تولِّد النماذج اللغوية الكبيرة النص عن طريق التنبؤ بالكلمة التالية (أو بالأحرى الرمز التالي) وفقًا لتوزيع احتمالات محدد. يتم تعيين قيمة عددية تُعرَف باسم logit لكل رمز مميز من النموذج اللغوي الكبير، ويتم تحويل مجموعة الرموز المميزة بالكامل إلى توزيع احتمالات Softmax. يتم تعيين قيمة لكل رمز عبر دالة Softmax تتراوح بين الصفر والواحد، ويكون مجموع احتمالات Softmax لجميع الرموز يساوي واحدًا.

تُعدِّل مَعلمة درجة الحرارة (temperature) في النموذج اللغوي الكبير هذا التوزيع. درجة الحرارة المنخفضة تجعل الرموز ذات الاحتمال الأعلى أكثر احتمالًا للاختيار، بينما تزيد درجة الحرارة العالية من احتمال اختيار الرموز الأقل احتمالًا. يحدث هذا لأن القيمة الأعلى لدرجة الحرارة تُدخل مزيدًا من التنوع في اختيار الرموز بواسطة النموذج اللغوي الكبير. تؤدي إعدادات درجات الحرارة المختلفة إلى مستويات متفاوتة من العشوائية عند توليد النصوص بواسطة نموذج الذكاء الاصطناعي التوليدي.

تُعَد درجة الحرارة ميزة أساسية للتحكم في العشوائية في أداء النموذج. تُتيح هذه الخاصية للمستخدمين ضبط مخرجات النموذج اللغوي الكبير لتناسب بشكل أفضل التطبيقات الواقعية المختلفة لتوليد النصوص. بشكل أكثر تحديدًا، تُتيح هذه الإعدادات في النموذج اللغوي الكبير للمستخدمين الموازنة بين الاتساق والإبداع عند توليد المخرجات لحالة استخدام معينة. على سبيل المثال، قد تكون درجة الحرارة المنخفضة مفضلة للمهام التي تتطلب الدقة والصحة الواقعية، مثل الوثائق التقنية أو الردود الحوارية مع روبوتات المحادثة. تساعد القيمة المنخفضة لدرجة الحرارة النموذج اللغوي الكبير على إنتاج نصوص أكثر اتساقًا وانسجامًا وتجنُّب الردود غير ذات الصلة. بالمقابل، يُفضَّل استخدام درجة الحرارة العالية للإنتاج الإبداعي أو المهام الإبداعية مثل الكتابة الإبداعية أو جلسات توليد الأفكار. تُتيح إعدادات درجة الحرارة للمستخدمين ضبط النماذج اللغوية الكبيرة بدقة وتعديل مخرجات النموذج لتلائم النتائج المطلوبة لديهم.

غالبًا ما يتم الخلط بين درجة الحرارة و"الإبداع"، لكن هذا لا ينطبق دائمًا. من الأفضل التفكير فيها على أنها مدى اتساع استخدام النموذج للنصوص من بيانات تدريبه. أجرى Max Peeperkorn وآخرون1 تحليلًا تجريبيًا لمخرجات النموذج اللغوي الكبير لقيم درجات الحرارة المختلفة وكتب:

"وجدنا أن درجة الحرارة ترتبط ارتباطًا ضعيفًا بالحداثة، وبشكل متوقع، ترتبط ارتباطًا متوسطًا بعدم الاتساق، لكن لا توجد أي علاقة مع كل من الترابط أو الطابع النموذجي. مع ذلك، فإن تأثير درجة الحرارة في الإبداع أكثر تعقيدًا وضعفًا مما تُوحي به مطالبة "مَعلمة الإبداع"، وتشير النتائج الإجمالية إلى أن النموذج اللغوي الكبير ينتج مخرجات أكثر حداثة قليلًا مع ارتفاع درجة الحرارة.

يمكن لقيمة درجة الحرارة المرتفعة أن تجعل مخرجات النموذج تبدو أكثر إبداعًا ولكن من الأدق اعتبارها أقل تحديدًا من خلال بيانات التدريب.