نظرًا لأن نموذج الغابة العشوائية يتكون من أشجار قرار متعددة، سيكون من المفيد البدء بوصف خوارزمية شجرة القرار بإيجاز. تبدأ أشجار القرار بسؤال أساسي، مثل «هل يجب أن أتصفح الإنترنت؟» من هناك، يمكنك طرح سلسلة من الأسئلة لتحديد الإجابة، مثل ”هل هي موجة طويلة الأمد؟“ أو ”هل تهب الرياح بعيداً عن الشاطئ؟ تشكّل هذه الأسئلة عقد القرار في الشجرة، وتعمل كوسيلة لتقسيم البيانات. يساعد كل سؤال الفرد على الوصول إلى قرار نهائي، والذي سيتم الإشارة إليه بواسطة عقدة الورقة. الملاحظات التي تناسب المعايير ستتبع فرع "نعم" والتي لا تناسبها ستتبع المسار البديل. تسعى أشجار القرار للعثور على أفضل تقسيم للبيانات الفرعية، وعادةً ما يتم تدريبها من خلال خوارزمية التصنيف وشجرة الانحدار (CART). يمكن استخدام مقاييس، مثل شوائب جيني أو اكتساب المعلومات أو متوسط الخطأ التربيعي (MSE) لتقييم جودة التقسيم.
شجرة القرار هذه هي مثال على مشكلة التصنيف التي تكون فيها تسمية الفئة هي "تصفح" و"لا تتصفح".
على الرغم من أن أشجار القرار هي خوارزميات شائعة للتعلم خاضعة للإشراف، إلا أنها قد تكون عرضة للمشاكل، مثل التحيز والإفراط في التكييف. ومع ذلك، عندما تُشكّل أشجار القرار المتعددة مجموعة في خوارزمية الغابة العشوائية، فإنها تتنبأ بنتائج أكثر دقة، خاصةً عندما تكون الأشجار الفردية غير مترابطة مع بعضها البعض.