评估(E)

逐步选择法保证模型仅包含“统计意义下显著”的预测变量,但不保证模型实际上非常适用于预测目标。为此,需要分析已评分的记录。

图 1. Cox 块:“设置”选项卡
Cox 块:“设置”选项卡
  1. 将模型块放置在工作区上并将其附加到源节点,然后打开该模型块并单击“设置”选项卡。
  2. 选择 时间字段 并指定 保有期 。将根据每个记录的保有期长度对其进行评分。
  3. 选择 追加所有概率

    这样可使用 0.5 作为分界值区分客户是否流失来创建评分;如果客户流失的倾向值大于 0.5,那么这些客户将被标记为流失的客户。该数值并不特殊,但不同的分界值可能产生不同的期望结果。在考虑选择分界值时,有一种方法是使用评估节点。

    图 2. “评估”节点:“图”选项卡
    “评估”节点:“图”选项卡
  4. 将评估节点附加到模型块;在“图”选项卡上,选择包含最佳线
  5. 单击选项选项卡。
    图 3. “评估”节点:“选项”选项卡
    “评估”节点:“图”选项卡
  6. 选择 用户定义的评分 ,然后键入 '$CP-1-1' 作为表达式。这是与流失倾向相对应的模型生成的字段。
  7. 单击运行
    图 4. 增益图
    增益图

    累积增益图会在给定的类别中显示通过把个案总数的百分比作为目标而“增益”的个案总数的百分比。例如,曲线上的一点 (10%, 15%),表示当您使用模型对数据集进行评分,并使用预测的流失倾向对所有观测值进行排序时,您可能希望前 10% 中包含实际类别为 1 (流失者)的所有观测值中约 15% 的观测值。同样,前 60% 包含大约 79.2% 的流失顾客。如果选择整个已评分数据集,那么将获得数据集中所有流失者。

    对角线是“基线”曲线;如果从已评分数据集中随机选择 20% 的记录,那么将期望从实际具有类别 1 的所有记录中“获得”约 20% 的记录。曲线所处的位置越高于基线,增益越大。“最佳”线显示将较高的倾向评分分配到每个流失者(而非每个非流失者)的“完美”模型的曲线。可以通过选择与所需增益相对应的百分比,然后将此百分比映射到相应的分界值,从而选择有助于选择分类分界值的累积增益图。

    “期望”增益的组成取决于类型 I 与类型 II 错误的成本。即,将流失客户分类为非流失客户(类型 I)的成本是多少?将非流失客户分类为流失客户(类型 II)的成本是多少?当客户保持成为首要考虑的问题时,您会希望降低第一类错误;在累积增益图上,这对应于预测倾向值为 1 的前 60% 中的客户已增加的客户维护,这将捕获 79.2% 的可能流失者,但将花费时间和资源用于获得新客户。如果降低维护当前客户群成本是首先要考虑的事,那么您会希望降低类型 II 错误。在图表上,这可能对应于前 20% 增加的客户需求,这将捕获 32.5% 的流失客户。通常,这两方面都非常重要,因此,您必须选择一个决策规则,用于对具有最大敏感度和特异性的客户进行分类。

    图 5. “排序”节点:“设置”选项卡
    “排序”节点:“设置”选项卡
  8. 假定您所定的期望增益为 45.6%,则相应会显示前面 30% 的记录。要找到合适的分类分界值,请将排序节点附加到模型块。
  9. 在“设置”选项卡上,选择以降序按 $CP-1-1 排序,然后单击确定
    图 6. 表
    表
  10. 将“表”节点附加到“排序”节点。
  11. 打开“表”节点,然后单击运行

将输出向下滚动,就会看到第 300 个记录的 $CP-1-1 值为 0.248。使用 0.248 作为分类分界值,就会导致约 30% 的客户被评定为流失者,由此捕获实际总流失者的个数约占 45%。