Random forest هي خوارزمية تعلم آلي شائعة الاستخدام، مسجلة كعلامة تجارية بواسطة Leo Breiman وAdele Cutler، تجمع بين نواتج عمليات اتخاذ القرار المتعددة للوصول إلى نتيجة واحدة. وقد ساعدت سهولة استخدامها ومرونتها على تبنيها، لأنها تعالج مشاكل التصنيف والانحدار.
نظرًا لأن نموذج الغابة العشوائية يتكون من أشجار قرار متعددة، سيكون من المفيد البدء بوصف خوارزمية شجرة القرار بإيجاز. تبدأ أشجار القرار بسؤال أساسي، مثل «هل يجب أن أتصفح الإنترنت؟» من هناك، يمكنك طرح سلسلة من الأسئلة لتحديد الإجابة، مثل ”هل هي موجة طويلة الأمد؟“ أو ”هل تهب الرياح بعيداً عن الشاطئ؟ تشكّل هذه الأسئلة عقد القرار في الشجرة، وتعمل كوسيلة لتقسيم البيانات. يساعد كل سؤال الفرد على الوصول إلى قرار نهائي، والذي سيتم الإشارة إليه بواسطة عقدة الورقة. الملاحظات التي تناسب المعايير ستتبع فرع "نعم" والتي لا تناسبها ستتبع المسار البديل. تسعى أشجار القرار للعثور على أفضل تقسيم للبيانات الفرعية، وعادةً ما يتم تدريبها من خلال خوارزمية التصنيف وشجرة الانحدار (CART). يمكن استخدام مقاييس، مثل شوائب جيني أو اكتساب المعلومات أو متوسط الخطأ التربيعي (MSE) لتقييم جودة التقسيم.
شجرة القرار هذه هي مثال على مشكلة التصنيف التي تكون فيها تسمية الفئة هي "تصفح" و"لا تتصفح".
على الرغم من أن أشجار القرار هي خوارزميات شائعة للتعلم خاضعة للإشراف، إلا أنها قد تكون عرضة للمشاكل، مثل التحيز والإفراط في التكييف. ومع ذلك، عندما تُشكّل أشجار القرار المتعددة مجموعة في خوارزمية الغابة العشوائية، فإنها تتنبأ بنتائج أكثر دقة، خاصةً عندما تكون الأشجار الفردية غير مترابطة مع بعضها البعض.
تتكون طرق تعلّم المجموعة من مجموعة من عوامل التصنيف؛ مثل مخططات تسلسل القرارات والتي يتم تجميع توقعاتها لتحديد النتائج الأكثر شيوعًا. وأكثر طرق التجميع شهرة هي التعبئة، المعروفة أيضًا باسم تجميع التشغيل التمهيدي (bootstrap)، والتعزيز. في عام 1996، قدم Leo Breiman طريقة التعبئة؛ في هذه الطريقة، يتم اختيار عينة عشوائية من البيانات في مجموعة تدريب مع الاستبدال - مما يعني أنه يمكن اختيار نقاط البيانات الفردية أكثر من مرة. ثم بعد إنشاء العديد من عينات البيانات، يتم تدريب هذه النماذج بشكل مستقل، اعتمادًا على نوع المهمة، مثل الانحدار أو التصنيف، ثم ينتج عن متوسط تلك التوقعات أو معظمها تقديرٌ أدق. ويُستخدم هذا النهج بشكل شائع لتقليل التباين داخل مجموعة البيانات المشوشة.
تُعدّ خوارزمية الغابة العشوائية امتدادًا لطريقة التعبئة لأنها تستخدم كلًا من التعبئة وعشوائية السمات لإنشاء غابة غير مترابطة من أشجار القرارات. في طريقة "عشوائية السمة"، والمعروفة أيضًا باسم تجميع السمة أو "طريقة الفضاء الفرعي العشوائي "، يتم إنشاء مجموعة فرعية عشوائية من السمات، مما يضمن انخفاض الارتباط بين شجرة القرار. وهذا هو الفرق الرئيسي بين أشجار القرارات والغابات العشوائية. فبينما تأخذ أشجار القرارات في الاعتبار جميع تقسيمات السمات المحتملة، فإن الغابات العشوائية تحدد فقط مجموعة فرعية من هذه السمات.
إذا عدنا إلى مثال "هل يجب أن أركب الأمواج؟"، فإن الأسئلة التي قد أطرحها لتحديد التوقع قد لا تكون شاملة مثل مجموعة الأسئلة التي يطرحها شخص آخر. من خلال أخذ جميع التباينات المحتملة في البيانات في الحسبان، يمكننا تقليل مخاطر الإفراط في التكييف والتحيز والتباين الكلي، مما يؤدي إلى تنبؤات أكثر دقة.
تحتوي خوارزميات الغابة العشوائية على ثلاث معاملات فرعية رئيسية، والتي يجب ضبطها قبل التدريب. يتضمن ذلك حجم العقدة وعدد الأشجار وعدد الميزات التي تم أخذ عينات منها. من هناك، يمكن استخدام أداة تصنيف الغابة العشوائية لحل مشاكل الانحدار أو التصنيف.
تتألف خوارزمية الغابة العشوائية من مجموعة من أشجار القرار، وتتألف كل شجرة في المجموعة من عينة بيانات مأخوذة من مجموعة تدريب مع الاستبدال، وتسمى عينة التمهيد. من عينة التدريب هذه ، يتم تخصيص ثلثها كبيانات اختبار، والمعروفة باسم عينة خارج الحقيبة (OOB)، والتي سنعود إليها لاحقًا. يتم بعد ذلك إدخال مثال آخر من العشوائية من خلال تعبئة الميزات، وإضافة المزيد من التنوع إلى مجموعة البيانات وتقليل الارتباط بين أشجار القرار. اعتمادًا على نوع المشكلة، سيختلف تحديد التنبؤ. بالنسبة لمهمة الانحدار، سيتم حساب متوسط أشجار القرارات الفردية، وبالنسبة لمهمة التصنيف، فإن التصويت بالأغلبية، أي المتغير الفئوي الأكثر شيوعًا، سيؤدي إلى الفئة المتوقعة. أخيرًا، يتم استخدام عينة oob للتحقق المتبادل، ووضع اللمسات الأخيرة على هذا التنبؤ.
هناك عدد من المزايا والتحديات الرئيسية التي تظهر عند استخدام "خوارزمية الغابة العشوائية" في حل مشكلات التصنيف أو الانحدار. ومنها ما يلي:
تم تطبيق خوارزمية الغابة العشوائية في عدد من الصناعات، مما سمح لهم باتخاذ قرارات أفضل في مجال الأعمال. فيما يلي بعض حالات الاستخدام:
تدريب الذكاء الاصطناعي التوليدي والتحقق من صحته وضبطه ونشره، وكذلك قدرات نماذج الأساس والتعلم الآلي باستخدام IBM watsonx.ai، وهو استوديو الجيل التالي من المؤسسات لمنشئي الذكاء الاصطناعي. أنشئ تطبيقات الذكاء الاصطناعي بسرعة أكبر وببيانات أقل.
استفد من الذكاء الاصطناعي في عملك بالاستعانة بخبرة IBM الرائدة في مجال الذكاء الاصطناعي ومحفظة حلولها المتوفرة لك.
أعدّ ابتكار عمليات ومهام سير العمل الحساسة بإضافة الذكاء الاصطناعي لتعزيز التجارب وصنع القرارات في الوقت الفعلي والقيمة التجارية.