ما المقصود بمعلمات النماذج؟

ما المقصود بمعلمات النماذج؟

تُعَد مَعلمات النموذج القيم التي يتعلمها نموذج التعلم الآلي، والتي تحدِّد كيفية ربط بيانات الإدخال بالمخرجات، مثل النص المُولَّد أو التصنيف المتوقع. الغرض من خوارزمية التعلم الآلي هو ضبط المَعلمات حتى تتماشى مخرجات نموذج الذكاء الاصطناعي بشكل وثيق مع النتائج المتوقعة.

تحدِّد قيم هذه المَعلمات تنبؤات النموذج وفي النهاية أداء النموذج في مهمة معينة. يؤثِّر عدد المَعلمات في النموذج بشكل مباشر في قدرة النموذج على التقاط الأنماط عبر نقاط البيانات. يمكن أن تحتوي النماذج الكبيرة، مثل تلك المستخدمة في الذكاء الاصطناعي التوليدي، على مليارات المَعلمات، ما يمكِّنها من توليد مخرجات متطورة للغاية. يسمح المزيد من المَعلمات للنماذج بالتقاط أنماط أكثر دقة من البيانات بدقة أكبر، ولكن الكثير من المَعلمات تخاطر بالإفراط في التخصيص.

تحتوي خوارزميات التعلم الآلي المختلفة على أنواع مختلفة من المَعلمات. على سبيل المثال، نماذج الانحدار لها معاملات، والشبكات العصبية لها أوزان وتحيّزات، وبعض الخوارزميات، مثل آلات متجهات الدعم أو نماذج فضاء الحالة، لها أنواع فريدة من المَعلمات.

لا ينبغي الخلط بين مَعلمات النموذج والمتغيّرات التي تم تعلمها أثناء التدريب، والمَعلمات الفائقة التي يتم تعيينها مسبقًا. يؤثِّر كِلا النوعين من المَعلمات في أداء النموذج وسلوكه، ولكن بطرق مختلفة بشكل كبير. 

أحدث اتجاهات الذكاء الاصطناعي، يقدمها لك الخبراء

احصل على رؤى منسقة حول أهم أخبار الذكاء الاصطناعي وأكثرها إثارةً للاهتمام. اشترِك في خدمة رسائل Think الإخبارية الأسبوعية. راجع بيان الخصوصية لشركة IBM.

شكرًا لك! لقد اشتركت بنجاح.

سيتم تسليم اشتراكك باللغة الإنجليزية. ستجد رابط إلغاء الاشتراك في كل رسالة إخبارية. يمكنك إدارة اشتراكاتك أو إلغاء اشتراكك هنا. راجع بيان خصوصية IBM لمزيد من المعلومات.

مَعلمات النموذج مبسَّطة

توجد مَعلمات النموذج في نماذج بسيطة - حتى في أبسط نموذج رياضي ممكن، والذي يَصِف الكمية المتغيّرة بمعدل ثابت.

الانحدار الخطي

لمعرفة كيف يمكن أن تؤثِّر مساحة المنزل في سعره، يمكن استخدام نموذج الانحدار الخطي البسيط الذي يعتمد على المعادلة،y=mx+bحيث m (الميل) وb (المقطع) هما المعاملات. بتعديلهما، تتحرك الخطوط وتنحرف لتتناسب بشكل أفضل مع البيانات.

التصنيف

من الأمثلة الأكثر تعقيدًا قليلًا استخدام نموذج الانحدار اللوجستي لتحديد إذا ما كان المنزل سيُباع أم لا بناءً على عدد أيامه في السوق.

يستخدم الانحدار اللوجستي الصيغة التالية:  p=11+e-(wx+b) ، حيث p = "احتمالية البيع" وx = "عدد الأيام في السوق". مرة أخرى، w وb هي مَعلمات "يتعلمها" النموذج. أصبحت المعادلة أكثر تعقيدًا قليلًا، لكنها لا تزال تحتوي على مَعلمتَين فقط.

Mixture of Experts | 28 أغسطس، الحلقة 70

فك تشفير الذكاء الاصطناعي: تقرير إخباري أسبوعي

انضمّ إلى نخبة من المهندسين والباحثين وقادة المنتجات وغيرهم من الخبراء وهم يقدّمون أحدث الأخبار والرؤى حول الذكاء الاصطناعي، بعيدًا عن الضجيج الإعلامي.

أنواع معلمات النماذج

في التعلم الآلي، تأتي مَعلمات النموذج بشكل أساسي في نوعين: الأوزان والتحيّزات. في مثال نموذج الانحدار الخطي البسيط، y=mx+b ، يتوافق الوزن مع الميل ويتحكم في مدى قوة تأثير الإدخال على المخرجات. كلما كان الوزن أكبر، كان تأثير الإدخال أكبر. يتوافق التحيّز مع المقطع b. يُتيح ذلك للنموذج تغيير الخط بأكمله لأعلى أو لأسفل.

الأوزان

الأوزان هي عناصر التحكم الأساسية أو الإعدادات للنموذج، وتحدِّد كيفية تقييم النموذج للبيانات الجديدة واتخاذ التنبؤات.

في نماذج الانحدار، تحدِّد الأوزان التأثير النسبي لكل ميزة من الميزات المستخدمة لتمثيل كل نقطة بيانات إدخال. في الشبكات العصبية، تحدِّد الأوزان مدى تأثير ناتج كل خلية عصبية على خلايا الطبقة التالية. 

في مثال نموذج يحاول التنبؤ بما إذا كان المنزل سيُباع اعتمادًا على عوامل مثل "عدد الأيام في السوق"، يحمل كل عامل وزنًا يعكس مدى تأثيره في احتمال البيع.

التحيزات

تمكّن الانحيازات النماذج من تعديل المخرجات بشكل مستقل عن الأوزان والمدخلات، حيث تعمل كعتبات أو قيم تعويضية. تساعد التحيّزات النماذج على تعميم الأنماط والتوجهات الأكبر ورصدها عبر مجموعة البيانات. 

في نموذج بيع المنازل نفسه، قد تكون النسبة التاريخية لمبيعات جميع المنازل في المنطقة 60% بغض النظر عن عدد الأيام في السوق، حتى لو تم إدراج منزل معين لفترة طويلة أو كان لديه عدد قليل من الزيارات. يُتيح التحيّز للنموذج البدء بهذه الاحتمالية الأساسية الواقعية، ثم تعديلها صعودًا أو هبوطًا بناءً على المدخلات الأخرى.

هذا الاستخدام "للتحيّز" يختلف عن التحيّز الخوارزمي، الذي يحدث عندما يُنتج النموذج نتائج تمييزية. التحيّز هو أيضًا مصطلح يطلق على نوع الخطأ الذي ينتج عن افتراض النموذج افتراضًا غير صحيح حول البيانات، ما يؤدي إلى وجود تباين بين القيم المتوقعة والقيم الفعلية. كلاهما لا علاقة له بتحيّز المَعلمة.

مَعلمات أخرى

هناك أنواع أخرى من المَعلمات في عالم التعلم الآلي. تستخدم النماذج البسيطة المذكورة أعلاه الأوزان والتحيّزات، كما تفعل الشبكات العصبية، إلى جانب مَعلمات الكسب (gain) والتحول (shift) للتطبيع.

على سبيل المثال، تمتلك الشبكات العصبية الالتفافية فلاتر (تُعرَف أيضًا بالنوى)، والتي تكشف الأنماط المكانية. تستخدم الشبكات العصبية المتكررة ذات الذاكرة القصيرة والطويلة مَعلمات تحكُّم (gating) لتنظيم تدفق المعلومات عبر الشبكة. تستخدم النماذج الاحتمالية مثل Naive Bayes المَعلمات لتحديد الاحتمالات الشرطية أو خصائص توزيعات الاحتمال. تحدِّد آلات متجهات الدعم المَعلمات التي تحدِّد موقع وموضع "المستويات الفائقة" لفصل الفئات في فضاء الميزات. تمتلك نماذج فضاء الحالة مَعلمات للملاحظة والضوضاء.

هذه قائمة محدودة من الأمثلة، وتعمل مَعلمات النماذج المختلفة بطرق متميزة. لكن عبر جميعها، تحدِّد المَعلمات كيفية تحويل النماذج للبيانات المدخلة إلى مخرجات.

مَعلمات النموذج مقابل المَعلمات الفائقة

المَعلمات هي في الأساس الإجابات عن السؤال الذي يطرحه النموذج (على سبيل المثال: ما أفضل ميل ممكن للمعادلة الذي يُتيح لنا تحديد سعر المنزل بدقة قصوى بناءً على مساحة المسكن؟").

من ناحية أخرى، يمكن اعتبار لمَعلمات الفائقة كقواعد اللعبة التي توضِّح للنموذج كيفية التوصل إلى الإجابة. يستخدم علماء البيانات الذين يدرِّبون النموذج فهمهم للمشكلة لفرض الحدود التي تحدِّد كيفية بحث النموذج عن الإجابات.

مَعلمات النموذج داخلية في النموذج ويتم تحديثها بواسطته عبر تكرارات عملية التعلم استجابةً لبيانات التدريب. يحدِّث النموذج قيم المَعلمات أثناء التدريب. تتحكم المَعلمات في كيفية تفاعل النموذج مع البيانات غير المرئية.

المَعلمات الفائقة للنموذج خارجية وتُحدَّد مسبقًا من خلال ضبط المَعلمات الفائقة. تَضبِط بعض المَعلمات الفائقة أداء النموذج في أثناء التدريب، مثل معدل التعلم في أثناء الانحدار التدرّجي أو عدد الحلقات التدريبية في عملية التدريب. 

تحدد المعلمات الفائقة الأخرى شكل النموذج وبنيته، مثل عدد أشجار القرار في غابة عشوائية، أو المجموعات في التجميع بالمتوسطات أو الطبقات المخفية في الشبكة العصبية

مَعلمات النموذج في الشبكات العصبية

يمكن أن تكون نماذج التعلم الآلي أكثر تعقيدًا بكثير من الأمثلة السابقة. في الشبكات العصبية مثل النموذج اللغوي الكبيرة (LLM)، يتخذ النموذج قرارات بطريقة مشابهة للطريقة التي تعمل بها الخلايا العصبية البيولوجية معًا في الدماغ البشري. تتكون كل شبكة عصبية من طبقات من الخلايا العصبية الاصطناعية، حيث تمثِّل كل خلية عصبية دالة رياضية تعالج الأرقام. في التعلم العميق، تتكون الشبكات العصبية من العديد من هذه الطبقات.

من طبقة إلى طبقة

تتحكم كل خلية عصبية في مدى قوة تأثير جزء من الشبكة في الجزء الآخر. وتحدِّد الأوزان قوة الروابط بين الخلايا العصبية: أي درجة تأثير ناتج إحدى الخلايا العصبية على إدخال الخلية العصبية التالية. 

أثناء التدريب، تتلقى الشبكة المدخلات. لمواصلة مثال أسعار المنازل، قد تشمل المدخلات مساحة المنزل، وسنة البناء وبيانات ديموغرافية عن الحي وعشرات المدخلات الأخرى.

يتم تمرير ميزات الإدخال هذه إلى الطبقة الأولى من الخلايا العصبية. يتم ضرب كل إدخال من المدخلات في وزنه، وهو أفضل تقدير للشبكة لأهمية تلك الخلية العصبية، ثم يُضاف انحياز لتحسين المرونة، ما يمنح الخلايا العصبية بعض الاستقلالية عن تأثير مجموع المدخلات المرجَّح من الخلايا العصبية في الطبقة السابقة. تحدِّد دالة التنشيط مدى قوة "إطلاق" الخلية العصبية ونقل المعلومات إلى الطبقة التالية كمدخلات لدالات التنشيط لكل خلية عصبية في تلك الطبقة. لكل رابط من هذه الروابط بين الخلايا العصبية وزن خاص بها.

تشكّل الأوزان مصفوفة، وتشكِّل التحيّزات متجهًا، وتحسب الطبقة التركيبات الخطية للمدخلات مضافًا إليها التحيّز، ثم تمرِّر الناتج عبر دالة تنشيط، مثل sigmoid أو tanh أو ReLU أو softmax. وظيفة هذه الدالة هي إدخال اللاخطية، ما يمكِّن الشبكة من تعلُّم ونمذجة الأنماط المعقدة بدلًا من الاقتصار على العلاقات الخطية فقط.

تنتقل البيانات عبر الطبقات "المخفية" اللاحقة. قد تجمع الطبقة المخفية الأولى بين المساحة المربعة للمنزل وعدد غرف النوم للوصول إلى "مساحة المعيشة الإجمالية". قد تجمع طبقة أخرى بين موقع المنزل الجغرافي وتقييم منطقة المدارس لتحديد "جاذبية الحي". لا يمتلك النموذج فهمًا بشريًا لماهية "جاذبية الحي"، بل يقتصر على التعرُّف على الأنماط في أرقام بيانات التدريب وإجراء الترابطات بينها.

من طبقة إلى أخرى، تبدأ الشبكة في "فهم" الأنماط الأكثر صلة. تحوِّل طبقات المجموعات هذه العمليات البسيطة إلى شبكة قوية قادرة على تعُّلم أنماط هرمية معقدة.

الخسارة والانتشار الخلفي

في المرحلة التالية، تحسب الشبكة الخسارة (الفرق بين ناتج الشبكة والحقائق المرجعية - وهي بنية البيانات الموجودة في مجموعة التدريب). ويوفر هذا رقمًا واحدًا يمثِّل مدى بُعد النموذج.

ثم، خلال مرحلة الانتشار الخلفي، تحسب الشبكة مشتق الخسارة بالنسبة للأوزان والتحيّزات، ما يوضِّح للشبكة المَعلمات التي تؤثِّر في الخسارة وكيفية تعديلها لتقليلها. يحدث هذا بترتيب عكسي، طبقة تلو الأخرى ، مع خوارزمية انحدار تدرّجي. تم تصميم خوارزميات التحسين مثل الانحدار التدرّجي لتقليل دالة الخسارة، ما يوضِّح للنموذج كيفية تعديل معاييره بفاعلية لتقليل الخسارة.

تتكرر العمليات السابقة حتى يصبح النموذج قادرًا على تقديم المخرجات (في هذه الحالة، السعر المتوقع للمنزل) بمستوى الأداء المطلوب.

يُظهر مثال التنبؤ بأسعار المنازل كيف تقوم الشبكات العصبية بأخذ العديد من الميزات في وقت واحد، ودمجها بطرق غير خطية، وإنتاج توقع مفيد. ومع ذلك، كان من الممكن تحقيق ذلك من خلال نموذج الانحدار الخطي الأبسط. تتألق الشبكات العصبية حقًا عندما تكون البيانات غير منظمة أو عندما تكون الأنماط معقدة جدًا أو عالية الأبعاد بالنسبة للنماذج التقليدية. على سبيل المثال، يمكن استخدام شبكة عصبية لمعالجة صور الأقمار الصناعية وبيانات خرائط الأحياء للتنبؤ بسعر البيع. أو يمكن تدريبها للتعرُّف على المصطلحات الرئيسية في أوصاف القوائم مثل "شارع هادئ" أو "سقف جديد".

الضبط الدقيق

عند اكتمال التدريب الأوَّلي، يمكن تكييف نماذج الذكاء الاصطناعي بشكل أكبر مع مهام أو مجالات موضوعية محددة. الضبط الدقيق هو عملية تكييف نموذج مدرَّب مسبقًا لحالات استخدام محددة. للقيام بذلك، يتم تحديث مَعلمات النموذج من خلال تدريب إضافي على البيانات الجديدة.

أنواع أخرى من التعلم

يَصِف المثال أعلاه للشبكة العصبية المستخدمة للتنبؤ بأسعار المساكن التعلم الخاضع للإشراف، حيث تتعلم النماذج باستخدام البيانات المصنّفة. في هذا السياق، يتم إعطاء النموذج كلًا من الإدخالات والمخرجات الصحيحة. يقارن النموذج تنبؤاته بالحقيقة الأساسية (في هذه الحالة، البيانات المصنّفة). غالبًا ما يحدث الضبط الدقيق في سياق خاضع للإشراف.

يسمح التعلم غير الخاضع للإشراف للنماذج بتعلم المَعلمات من خلال العثور على أنماط أو هياكل في بيانات غير مصنّفة، دون إخبارهم "بالإجابة الصحيحة". بدلًا من مقارنة التوقعات بالتصنيفات المرجعية (كما في التعلم الخاضع للإشراف)، تحسِّن هذه النماذج أهدافًا تقيس مدى جودة قدرة النموذج على تفسير البيانات نفسها. على سبيل المثال، في التجميع، يتم تحديث المَعلمات (مثل مراكز المجموعات في k-means) بشكل تكراري بحيث تقترب النقاط المتشابهة من بعضها. في تقليل الأبعاد، يتم تعلُّم المَعلمات عن طريق إيجاد التوجهات التي تلتقط أكبر قدر من التباين في البيانات.

في التعلم المعزز، يتفاعل النموذج (أو الوكيل المدعوم من نموذج) مع البيئة، ويتلقى مكافآت على الإجراءات الصحيحة. عادةً ما تحدِّد المَعلمات سياسة أو دالة قيمة لتقدير المكافأة المتوقعة. يتم تحديث المَعلمات من خلال مقارنة المكافآت المتوقعة بالمكافآت الفعلية المستلمة.

التحقق من صحة أداء مَعلمات النموذج

يُعَد تحسين الأداء في بيانات التدريب هو الهدف من التدريب، لكنه مجرد وسيلة لتحقيق هدف أوسع. الهدف الأساسي هو التعميم، والذي يتم تحقيقه من خلال تدريب النموذج بطريقة تجعله يعمِّم بشكل جيد على المهام الواقعية التي لم يرها في بيانات التدريب الخاصة به.

يجب توخّي الحذر لتجنُّب المخاطر مثل الإفراط في التخصيص، حيث تلتقط المَعلمات الضوضاء أو التغيّرات العشوائية في بيانات التدريب، ما يؤدي إلى ضعف قدرة النموذج على التعميم على بيانات جديدة. يجب أن تكون المَعلمات مرنة بما يكفي لتتعلم الأنماط المفيدة، لكنها لا يجب أن تكون مرنة لدرجة تحفظ التفاصيل غير المهمة.

يتم استخدام العديد من تقنيات علم البيانات لتقييم أداء النموذج. التحقق المتبادل هو تقنية لتقييم النموذج يتم فيها تقسيم مجموعة البيانات إلى عدة أجزاء (folds). يتم تدريب النموذج على بعض الأجزاء واختباره على الجزء المتبقي، وتتكرر هذه العملية حتى يتم استخدام كل جزء كمجموعة اختبار. يقلل هذا من خطر الإفراط في التخصيص، لأن النموذج يتم اختباره على عدة أقسام من البيانات. لا يغيّر التحقق المتبادل المَعلمات بشكل مباشر، ولكنه يختبر مدى تعميم المَعلمات المكتسبة على البيانات غير المرئية. إذا كان الأداء متسقًا عبر الأجزاء، فمن المحتمل أن تكون المَعلمات محسَّنة جيدًا. إذا لم يكن الأمر كذلك، فقد تكون مَعلمات النموذج مناسبة بشكل مفرط للمجموعة الفرعية من بيانات التدريب التي شاهدتها بالفعل. قد يؤدي التدريب الإضافي على البيانات الأكثر تنوعًا إلى تحسين التعميم.

ومن الأساليب الأخرى التشغيل التمهيدي، وهو أسلوب إحصائي يتضمن إنشاء مجموعات بيانات جديدة عن طريق أخذ عيّنات عشوائية مع الاستبدال من مجموعة البيانات الأصلية. يُنتج التشغيل التمهيدي العديد من مجموعات المَعلمات، نظرًا لأن كل عينة تمهيد تكون مختلفة قليلًا. من خلال الاطِّلاع على التباين بين هذه النماذج التمهيدية (bootstrapped)، يمكن قياس مدى موثوقية المَعلمات عند تدريبها على بيانات مختلفة قليلًا.

يعتمد الممارسون أيضًا على مقاييس تقيس أداء النموذج، مثل الدقة والاستدعاء والإحكام ومتوسط الخطأ التربيعي. توفِّر هذه التعليقات تقييمًا موضوعيًا لما إذا كانت المَعلمات الحالية توجِّه النموذج في الاتجاه الصحيح.

حلول ذات صلة
IBM watsonx.ai

تدريب الذكاء الاصطناعي التوليدي والتحقق من صحته وضبطه ونشره، وكذلك قدرات نماذج الأساس والتعلم الآلي باستخدام IBM watsonx.ai، وهو استوديو الجيل التالي من المؤسسات لمنشئي الذكاء الاصطناعي. أنشئ تطبيقات الذكاء الاصطناعي بسرعة أكبر وببيانات أقل.

اكتشف watsonx.ai
حلول الذكاء الاصطناعي

استفد من الذكاء الاصطناعي في عملك بالاستعانة بخبرة IBM الرائدة في مجال الذكاء الاصطناعي ومحفظة حلولها المتوفرة لك.

استكشف حلول الذكاء الاصطناعي
الاستشارات والخدمات المتعلقة بالذكاء الاصطناعي

أعدّ ابتكار عمليات ومهام سير العمل الحساسة بإضافة الذكاء الاصطناعي لتعزيز التجارب وصنع القرارات في الوقت الفعلي والقيمة التجارية.

استكشف خدمات الذكاء الاصطناعي
اتخِذ الخطوة التالية

احصل على وصول شامل إلى القدرات التي تغطي دورة حياة تطوير الذكاء الاصطناعي. تمكَّن من إنتاج حلول ذكاء اصطناعي قوية بفضل الواجهات سهلة الاستخدام وعمليات سير العمل السلسة وإمكانية الوصول إلى واجهات برمجة التطبيقات ومجموعات تطوير البرامج القياسية في الصناعة.

استكشف watsonx.ai احجز عرضًا توضيحيًا مباشرًا