比较结果
要比较两个结果,需要进行有效性测量。为此,将使用树构建器中的“增益”选项卡。我们将查看 提升 ,该图可测量节点中的记录与数据集中的所有记录相比时,其落入目标类别的可能性究竟提升多少。例如,提升值 148% 表示与数据集中的所有记录相比,节点中的记录落在目标类别的可能性是其 1.48 倍。提升值显示在“增益”选项卡的指数列中。
- 在预测变量的完整集合的树构建器中,单击“增益”选项卡。将“目标类别”更改为 1.0。首先单击“分位数”工具栏按钮将显示更改为分位数。然后从此按钮右侧的下拉列表中选择 四分位数 。
- 在具有 10 个预测变量集合的树构建器中重复此步骤,就可以对两个类似的增益表进行比较,如下图中所示。

每个增益表都将其树的终端节点分组为分位数。要比较两个模型的有效性,可查看每个表中 25% 分位数的提升( 指数 值)。
包括所有预测变量时,模型显示提升值 221%。即,具有这些节点中的特征的个案,其响应目标促销活动的可能性是其他个案的 2.2 倍。要查看这些特征的内容,请单击以选择最上面的一行。然后切换到“查看器”选项卡,其中相应的节点现在以黑色框突出显示。沿着树向下寻找每个突出显示的终端节点,以了解这些预测变量的分割方式。第一个分位数仅包含 10 个节点。如果转换为实际应用中的评分模型,那么 10 个不同的客户特征难以进行管理。
如果仅包括前 10 个预测变量(由特征选择识别),则提升值接近为 194%。虽然此模型不如使用所有预测变量的模型那样有效,但它无疑也是有用的。此处第一个分位数仅包含四个节点,因此它更简单。因此,我们可以确定特征选择模型比使用所有预测变量的模型更合适。