ما المقصود بالتعبئة؟

23 سبتمبر 2021

ما المقصود بالتعبئة؟

التعبئة، والمعروفة أيضا باسم تجميع التشغيل التمهيدي، هي طريقة تعلم المجموعة التي تستخدم بشكل شائع لتقليل التباين داخل مجموعة بيانات صاخبة.

في التعبئة، يتم تحديد عينة عشوائية من البيانات في مجموعة تدريب مع الاستبدال—ما يعني أنه يمكن اختيار نقاط البيانات الفردية أكثر من مرة. بعد إنشاء كثير من عينات البيانات، يتم تدريب هذه النماذج الضعيفة بشكل مستقل. واعتمادًا على نوع المهمة—الانحدار أو التصنيف، على سبيل المثال—ينتج متوسط أو غالبية هذه التنبؤات تقديرًا أكثر دقة.

كملاحظة، تُعتبر خوارزمية الغابة العشوائية امتدادًا لطريقة التعبئة، باستخدام كلٍ من التعبئة وعشوائية السمات لإنشاء غابة غير مترابطة من أشجار القرارات.

التعلم الجماعي

يمنح التعلم التجميعي مصداقية لفكرة «الحِكمة الجماعية»، مما يشير إلى أن عملية اتخاذ القرار بتعاون مجموعة أكبر من الأشخاص عادةً ما يكون أفضل من القرار الذي يتخذه شخص واحد ولو كان خبيرًا. وبالمثل، يشير التعلم الجماعي إلى مجموعة من المتعلمين الأساسيين، أو النماذج، التي تعمل بشكل جماعي لتحقيق تنبؤ نهائي أفضل.

قد لا يؤدي النموذج الواحد، المعروف أيضًا باسم نموذج التعلم الأساسي أو نموذج التعلم الضعيف، أداءً جيدًا بشكل فردي بسبب التباين العالي أو التحيز العالي. ومع ذلك، عندما يتم تجميع المتعلمين الضعفاء، يمكن أن يشكلوا متعلمًا قويًا، حيث يقلل تجميعهم من التحيز أو التباين، مما يؤدي إلى أداء أفضل للنموذج.

غالبًا ما تستخدم أساليب التجميع شجرة القرار للتوضيح. يمكن أن تكون هذه الخوارزمية عرضة للتجهيز الزائد، مما يُظهر تباينًا كبيرًا وتحيزًا منخفضًا، عندما لا يتم تقليمها. وعلى العكس من ذلك، يمكن أن يفسح المجال أيضًا للتناسب، مع تباين منخفض وتحيز كبير، عندما يكون صغيرًا جدًا، مثل جذع القرار، وهو شجرة قرار بمستوى واحد.

تذكّر أنه عندما تفرط الخوارزمية في ملاءمة أو عدم ملاءمة مجموعة التدريب الخاصة بها، لا يمكنها التعميم بشكل جيد على مجموعات البيانات الجديدة، لذا تُستخدم طرق التجميع لمواجهة هذا السلوك للسماح بتعميم النموذج على مجموعات البيانات الجديدة. في حين أن أشجار القرار يمكن أن تُظهر تباينًا كبيرًا أو تحيزًا كبيرًا، تجدر الإشارة إلى أنها ليست تقنية النمذجة الوحيدة التي تستفيد من التعلم الجماعي للعثور على "النقطة المثالية" في مفاضلة التحيز والتباين.

التعبئة مقابل التعزيز

يعد كل من التعبئة والتعزيز نوعين رئيسيين من أساليب التعلم الجماعي. كما هو موضح في هذه الدراسة ، فإن الفرق الرئيسي بين طرق التعلم هذه هو كيفية تدريبها.

في عملية التعبئة، يتم تدريب نماذج التعلم الضعيفة بالتوازي، بينما في عملية التعزيز، تتعلم النماذج بالتتابع. هذا يعني أنه يتم إنشاء سلسلة من النماذج، ومع كل تكرار لنموذج جديد، يتم زيادة أوزان البيانات التي تم تصنيفها بشكل خاطئ في النموذج السابق.

وإعادة توزيع الأوزان الترجيحية مما يساعد هذه الخوارزمية على تحديد المعلمات التي تحتاج إلى التركيز عليها لتحسين أدائها. تُعد خوارزمية AdaBoost، وتعني "خوارزمية التعزيز التكيّفي"، واحدة من أكثر خوارزميات التعزيز شيوعًا لأنها كانت الأولى من نوعها. تشمل الأنواع الأخرى من خوارزميات التعزيز XGBoost وGradientBoost وBrownBoost.

ومن الاختلافات الأخرى التي يختلف فيها التعبئة والتعزيز هي السيناريوهات التي يتم استخدامها فيها. على سبيل المثال، تُستخدم طرق التعبئة عادةً على المتعلمين الضعفاء الذين يظهرون تباينًا كبيرًا وتحيزًا منخفضًا، بينما تُستخدم طرق التعزيز عند ملاحظة تباين منخفض وتحيز كبير.

تصميم ثلاثي الأبعاد لكرات تتدحرج على مسار

أحدث الأخبار والرؤى حول الذكاء الاصطناعي 


تتوفر معارف وأخبار منسقة بمهارة حول الذكاء الاصطناعي والسحابة وغيرها في نشرة Think الإخبارية الأسبوعية. 

طريقة عمل التعبئة

في عام 1996، قدّم Leo Breimanخوارزمية التعبئة، والتي تتكون من ثلاث خطوات أساسية:

  1. التشغيل التمهيدي: تعتمد التعبئة على تقنية أخذ العينات من التشغيل التمهيدي لإنشاء مجموعات متنوعة. تقوم طريقة إعادة أخذ العينات هذه بإنشاء مجموعات فرعية مختلفة من مجموعة بيانات التدريب. وتقوم بذلك عن طريق اختيار نقاط البيانات بشكل عشوائي مع الاستبدال. هذا يعني أنه في كل مرة تقوم فيها بتحديد نقطة بيانات من مجموعة بيانات التدريب، يمكنك تحديد نفس المثيل عدة مرات. ونتيجة لذلك، تتكرر قيمة أو مثيل مرتين (أو أكثر) في عينة.

  2. التدريب المتوازي: يتم بعد ذلك تدريب التشغيل التمهيدي هذا بشكل مستقل وبالتوازي مع بعضها البعض باستخدام متعلمين ضعفاء أو متعلمين أساسيين.

  3. التجميع: أخيرًا، اعتمادًا على المهمة (أي الانحدار أو التصنيف)، يتم أخذ متوسط أو غالبية التنبؤات لحساب تقدير أكثر دقة. وفي حالة الانحدار، يؤخذ متوسط لجميع المخرجات التي تنبأت بها المصنفات الفردية؛ وهذا ما يُعرف بالتصويت المرن. بالنسبة إلى مشكلات التصنيف ، تُقبل الفئة التي حصلت على أعلى الأصوات ؛ يُعرف هذا بالتصويت الصعب أو التصويت بالأغلبية.
Mixture of Experts | 25 أبريل، الحلقة 52

فك تشفير الذكاء الاصطناعي: تقرير إخباري أسبوعي

انضم إلى لجنة عالمية المستوى من المهندسين والباحثين وقادة المنتجات وغيرهم في أثناء سعيهم للتغلب على الفوضى والضوضاء المحيطة بالذكاء الاصطناعي لتزويدك بأحدث أخباره والرؤى المتعلقة به.

ميزات التعبئة وتحدياتها

هناك العديد من الفوائد والتحديات الرئيسية التي تمثلها طريقة التعبئة عند استخدامها لمشاكل التصنيف أو الانحدار. تشمل الميزات الرئيسية للتعبئة ما يلي:

  • سهولة التنفيذ: تجعل مكتبات Python مثل scikit-learn (المعروفة أيضًا باسم sklearn) من السهل الجمع بين تنبؤات المتعلمين الأساسيين أو المقدّرين لتحسين أداء النموذج. توثيقهم يحدد الوحدات المتاحة التي يمكنك استخدامها في تحسين النموذج الخاص بك.

  • تقليل التباين: يمكن أن تقلل التعبئة من التباين داخل خوارزمية التعلم. وهذا مفيد بشكل خاص مع البيانات عالية الأبعاد، حيث يمكن أن تؤدي القيم المفقودة إلى تباين أعلى، مما يجعلها أكثر عرضة للتجهيز الزائد ومنع التعميم الدقيق لمجموعات البيانات الجديدة.

تتضمن التحديات الرئيسية للتعبئة ما يلي:

  • فقدان قابلية التفسير: من الصعب استخلاص رؤى تجارية دقيقة للغاية من خلال التعبئة بسبب المتوسط المتضمن عبر التنبؤات. على الرغم من أن المخرجات أكثر دقة من أي نقطة بيانات فردية، إلا أن مجموعة بيانات أكثر دقة أو اكتمالاً يمكن أن تسفر أيضًا عن دقة أكبر في نموذج تصنيف أو انحدار واحد.

  • مكلف من الناحية الحسابية: تتباطأ التعبئة وتصبح أكثر كثافة مع زيادة عدد التكرارات. وبالتالي، فهي ليست مناسبة تمامًا للتطبيقات في الوقت الفعلي. تعد الأنظمة المجمعة أو عدد كبير من نوى المعالجة مثالية لإنشاء مجموعات معبأة بسرعة على مجموعات اختبار كبيرة.

  • أقل مرونة: كأسلوب، تعمل التعبئة بشكل جيد مع الخوارزميات الأقل استقرارًا. إن خوارزمية أكثر استقرارًا أو عرضة لكميات كبيرة من التحيز لا توفر فائدة كبيرة نظرًا لوجود تباين أقل داخل مجموعة بيانات النموذج. كما هو مذكور في الدليل العملي للتعلم الآلي، فإن "تعبئة نموذج الانحدار الخطي سيعيد بشكل فعال التنبؤات الأصلية فقط عندما يكون b كبيرًا بما فيه الكفاية."

تطبيقات التعبئة

تُستخدم تقنية التعبئة في العديد من الصناعات، مما يوفر رؤى للقيمة الواقعية ووجهات النظر المثيرة للاهتمام، كما هو الحال في مناظرات GRAMMY مع Watson. تتضمن حالات الاستخدام الرئيسية ما يلي:

  • الرعاية الصحية: تم استخدام التعبئة لتشكيل تنبؤات البيانات الطبية. على سبيل المثال ، تُظهر الأبحاثأن الأساليب التجميعية قد استخدمت لمصفوفة من مشكلات المعلوماتية الحيوية، مثل اختيار الجينات و/أو البروتينات لتحديد سمة معينة ذات أهمية. وبشكل أكثر تحديدًا، يتعمق هذا البحثفي استخدامه للتنبؤ بظهور مرض السكري استنادًا إلى العديد من مؤشرات المخاطر.

  • تقنية المعلومات: يمكن أن تؤدي التعبئة أيضًا إلى تحسين الدقة والدقة في أنظمة تقنية المعلومات، مثل تلك الخاصة بأنظمة كشف التسلل إلى الشبكة. وفي الوقت نفسه ، يبحث هذا البحثفي الكيفية التي يمكن بها للتعبئة أن تحسن دقة كشف التسلل إلى الشبكة—وتقلل من معدلات النتائج الإيجابية الزائفة.

  • البيئة: تم تطبيق أساليب التجميع، مثل التعبئة، في مجال الاستشعار عن بُعد. وبشكل أكثر تحديدًا، هذا البحث يوضح كيف تم استخدامه لرسم خريطة لأنواع الأراضي الرطبة داخل المناظر الطبيعية الساحلية.

  • التمويل: تم استخدام التعبئة أيضا مع نماذج التعلم العميق في مجال التمويل، وأتمتة المهام الحرجة، بما في ذلك اكتشاف الاحتيال وتقييم مخاطر الائتمان ومشاكل تسعير الخيارات. يوضح هذا البحث كيف تم الاستفادة من التعبئة من بين أساليب التعلم الآلي الأخرى لتقييم مخاطر التخلف عن سداد القروض. تسلط هذه الدراسة الضوء على كيفية مساعدة التعبئة في تقليل المخاطر من خلال منع الاحتيال على بطاقات الائتمان داخل المؤسسات المصرفية والمالية.
حلول ذات صلة
®IBM® watsonx.ai

تدريب الذكاء الاصطناعي التوليدي والتحقق من صحته وضبطه ونشره، وكذلك قدرات نماذج الأساس والتعلم الآلي باستخدام IBM watsonx.ai، وهو استوديو الجيل التالي من المؤسسات لمنشئي الذكاء الاصطناعي. أنشئ تطبيقات الذكاء الاصطناعي بسرعة أكبر وببيانات أقل.

اكتشف watsonx.ai
حلول الذكاء الاصطناعي

استفِد من الذكاء الاصطناعي في عملك بالاستعانة بخبرة IBM الرائدة في مجال الذكاء الاصطناعي ومحفظة حلولها التي ستكون بجانبك.

استكشف حلول الذكاء الاصطناعي
الاستشارات والخدمات المتعلقة بالذكاء الاصطناعي

أعدّ ابتكار عمليات ومهام سير العمل الحساسة بإضافة الذكاء الاصطناعي لتعزيز التجارب وصنع القرارات في الوقت الفعلي والقيمة التجارية.

استكشف خدمات الذكاء الاصطناعي
اتخِذ الخطوة التالية

احصل على وصول شامل إلى القدرات التي تغطي دورة حياة تطوير الذكاء الاصطناعي. توصَّل إلى حلول ذكاء اصطناعي قوية باستخدام واجهات سهلة الاستخدام وتدفقات سير عمل سلسة وإمكانية الوصول إلى واجهات برمجة التطبيقات ومجموعات تطوير البرمجيات وفق معايير الصناعة (SDKs).

استكشف watsonx.ai احجز عرضًا توضيحيًا مباشرًا