بالنسبة لمجموعة البيانات هذه ، تكون الإنتروبيا 0.94. يمكن حساب ذلك من خلال إيجاد نسبة الأيام التي يكون فيها "لعب التنس" هو "نعم" ، وهو 9/14 ، ونسبة الأيام التي يكون فيها "لعب التنس" هو "لا" ، وهو 5/14. بعد ذلك ، يمكن توصيل هذه القيم بصيغة الإنتروبيا أعلاه.
الإنتروبيا (تنس) = - (9/14) log2 (9/14) - (5/14) log2 (5/14) = 0.94
يمكننا بعد ذلك حساب اكتساب المعلومات لكل سمة على حدة. على سبيل المثال، سيكون اكتساب المعلومات للسمة «الرطوبة» كما يلي:
الربح (التنس والرطوبة) = (0.94) - (7/14) * (0.985) — (7/14) * (0.592) = 0.151
كملخص ،
- 7/14 يمثل نسبة القيم التي تساوي فيها الرطوبة "عالية" إلى إجمالي عدد قيم الرطوبة. في هذه الحالة ، يكون عدد القيم التي تساوي فيها الرطوبة "عالية" هو نفس عدد القيم التي تساوي فيها الرطوبة "طبيعية".
- 0.985 هي الإنتروبيا عندما تكون الرطوبة = "عالية"
- 0.59 هي الإنتروبيا عندما الرطوبة = "طبيعية"
بعد ذلك، كرر حساب اكتساب المعلومات لكل سمة في الجدول أعلاه، وحدد السمة ذات أعلى كسب للمعلومات لتكون نقطة الانقسام الأولى في شجرة القرار. في هذه الحالة، ينتج Outlook أعلى مكسب للمعلومات. من هناك، يتم تكرار العملية لكل شجرة فرعية.