Random forest هي خوارزمية تعلم آلي شائعة الاستخدام، مسجلة كعلامة تجارية بواسطة Leo Breiman وAdele Cutler، تجمع بين نواتج عمليات اتخاذ القرار المتعددة للوصول إلى نتيجة واحدة. وقد ساعدت سهولة استخدامها ومرونتها على تبنيها، لأنها تعالج مشاكل التصنيف والانحدار.
نظرًا لأن نموذج الغابة العشوائية يتكون من أشجار قرار متعددة، سيكون من المفيد البدء بوصف خوارزمية شجرة القرار بإيجاز. تبدأ أشجار القرار بسؤال أساسي، مثل «هل يجب أن أتصفح الإنترنت؟» من هناك، يمكنك طرح سلسلة من الأسئلة لتحديد الإجابة، مثل ”هل هي موجة طويلة الأمد؟“ أو ”هل تهب الرياح بعيداً عن الشاطئ؟ تشكّل هذه الأسئلة عقد القرار في الشجرة، وتعمل كوسيلة لتقسيم البيانات. يساعد كل سؤال الفرد على الوصول إلى قرار نهائي، والذي سيتم الإشارة إليه بواسطة عقدة الورقة. الملاحظات التي تناسب المعايير ستتبع فرع "نعم" والتي لا تناسبها ستتبع المسار البديل. تسعى أشجار القرار للعثور على أفضل تقسيم للبيانات الفرعية، وعادةً ما يتم تدريبها من خلال خوارزمية التصنيف وشجرة الانحدار (CART). يمكن استخدام مقاييس، مثل شوائب جيني أو اكتساب المعلومات أو متوسط الخطأ التربيعي (MSE) لتقييم جودة التقسيم.
شجرة القرار هذه هي مثال على مشكلة التصنيف التي تكون فيها تسمية الفئة هي "تصفح" و"لا تتصفح".
على الرغم من أن أشجار القرار هي خوارزميات شائعة للتعلم خاضعة للإشراف، إلا أنها قد تكون عرضة للمشاكل، مثل التحيز والإفراط في التكييف. ومع ذلك، عندما تُشكّل أشجار القرار المتعددة مجموعة في خوارزمية الغابة العشوائية، فإنها تتنبأ بنتائج أكثر دقة، خاصةً عندما تكون الأشجار الفردية غير مترابطة مع بعضها البعض.
تتكون طرق تعلّم المجموعة من مجموعة من عوامل التصنيف؛ مثل مخططات تسلسل القرارات والتي يتم تجميع توقعاتها لتحديد النتائج الأكثر شيوعًا. وأكثر طرق التجميع شهرة هي التعبئة، المعروفة أيضًا باسم تجميع التشغيل التمهيدي، والتعزيز. في عام 1996، قدم ليو بريمان (الرابط موجود خارج ibm.com) طريقة التعبئة؛ حيث يتم في هذه الطريقة اختيار عينة عشوائية من البيانات في مجموعة التدريب مع الاستبدال؛ مما يعني أنه يمكن اختيار نقاط البيانات الفردية أكثر من مرة. ثم بعد إنشاء العديد من عينات البيانات، يتم تدريب هذه النماذج بشكل مستقل، اعتمادًا على نوع المهمة، مثل الانحدار أو التصنيف، ثم ينتج عن متوسط تلك التوقعات أو معظمها تقديرٌ أكثر دقة. ويُستخدم هذا النهج بشكل شائع لتقليل التباين داخل مجموعة البيانات المشوشة.
تُعدّ خوارزمية الغابة العشوائية امتدادًا لطريقة التعبئة لأنها تستخدم كلاً من التعبئة وعشوائية الميزات لإنشاء غابة غير مترابطة من أشجار القرارات. تعمل عشوائية الميزة، والمعروفة أيضًا باسم تعبئة الميزات أو "طريقة المساحة الفرعية العشوائية" (الرابط موجود خارج ibm.com)، على توليد مجموعة فرعية عشوائية من الميزات، مما يضمن ارتباطًا منخفضًا بين أشجار القرارات. وهذا هو الفرق الرئيسي بين أشجار القرارات والغابات العشوائية. بينما تأخذ أشجار القرارات في الاعتبار جميع تقسيمات الميزات المحتملة، فإن الغابات العشوائية تحدد فقط مجموعة فرعية من هذه الميزات.
إذا عدنا إلى مثال "هل يجب أن أركب الأمواج؟"، فإن الأسئلة التي قد أطرحها لتحديد التوقع قد لا تكون شاملة مثل مجموعة الأسئلة التي يطرحها شخص آخر. من خلال أخذ جميع التباينات المحتملة في البيانات في الحسبان، يمكننا تقليل مخاطر الإفراط في التكييف والتحيز والتباين الكلي، مما يؤدي إلى تنبؤات أكثر دقة.
تحتوي خوارزميات الغابة العشوائية على ثلاث معاملات فرعية رئيسية، والتي يجب ضبطها قبل التدريب. يتضمن ذلك حجم العقدة وعدد الأشجار وعدد الميزات التي تم أخذ عينات منها. من هناك، يمكن استخدام أداة تصنيف الغابة العشوائية لحل مشاكل الانحدار أو التصنيف.
تتألف خوارزمية الغابة العشوائية من مجموعة من أشجار القرار، وتتألف كل شجرة في المجموعة من عينة بيانات مأخوذة من مجموعة تدريب مع الاستبدال، وتسمى عينة التمهيد. من عينة التدريب هذه ، يتم تخصيص ثلثها كبيانات اختبار، والمعروفة باسم عينة خارج الحقيبة (OOB)، والتي سنعود إليها لاحقًا. يتم بعد ذلك إدخال مثال آخر من العشوائية من خلال تعبئة الميزات، وإضافة المزيد من التنوع إلى مجموعة البيانات وتقليل الارتباط بين أشجار القرار. اعتمادًا على نوع المشكلة، سيختلف تحديد التنبؤ. بالنسبة لمهمة الانحدار، سيتم حساب متوسط أشجار القرارات الفردية، وبالنسبة لمهمة التصنيف، فإن التصويت بالأغلبية، أي المتغير الفئوي الأكثر شيوعًا، سيؤدي إلى الفئة المتوقعة. أخيرًا، يتم استخدام عينة oob للتحقق المتبادل، ووضع اللمسات الأخيرة على هذا التنبؤ.
هناك عدد من المزايا والتحديات الرئيسية التي تظهر عند استخدام "خوارزمية الغابة العشوائية" في حل مشكلات التصنيف أو الانحدار. ومنها ما يلي:
تم تطبيق خوارزمية الغابة العشوائية في عدد من الصناعات، مما سمح لهم باتخاذ قرارات أفضل في مجال الأعمال. فيما يلي بعض حالات الاستخدام:
IBM Granite هي مجموعة من نماذج الذكاء الاصطناعي المفتوحة والموثوق بها وذات الأداء العالي والتي صُمِمَت خصيصًا للأعمال وجرى الارتقاء بها على النحو الأمثل لتوسيع نطاق تطبيقات الذكاء الاصطناعي لديك. استكشف خيارات اللغة والتعليمات البرمجية والسلاسل الزمنية والدرابزين.
لقد قمنا باستطلاع آراء 2000 مؤسسة حول مبادرات الذكاء الاصطناعي لديها لمعرفة ما ينجح وما لا ينجح وكيف يمكنك المضي قدمًا.
استكشف أساليب التعلم الخاضعة للإشراف مثل مصنفات آلات المتجهات الداعمة والمصنفات الاحتمالية.
تعلّم المفاهيم الأساسية وطوّر مهاراتك من خلال المختبرات العملية والدورات التدريبية والمشاريع الموجهة والتجارب وغيرها.
تعرّف على كيفية اختيار نموذج أساس الذكاء الاصطناعي الأكثر ملاءمة لحالة الاستخدام الخاصة بك.
تدريب الذكاء الاصطناعي التوليدي والتحقق من صحته وضبطه ونشره، وكذلك قدرات نماذج الأساس والتعلم الآلي باستخدام IBM watsonx.ai، وهو استوديو الجيل التالي من المؤسسات لمنشئي الذكاء الاصطناعي. أنشئ تطبيقات الذكاء الاصطناعي بسرعة أكبر وببيانات أقل.
استفد من الذكاء الاصطناعي في عملك بالاستعانة بخبرة IBM الرائدة في مجال الذكاء الاصطناعي ومحفظة حلولها المتوفرة لك.
أعدّ ابتكار عمليات ومهام سير العمل الحساسة بإضافة الذكاء الاصطناعي لتعزيز التجارب وصنع القرارات في الوقت الفعلي والقيمة التجارية.