变量选择

模型构建过程采用向前步进算法。Omnibus 检验是指对模型执行情况的测量。上一步骤的卡方更改是上一步骤和当前步骤中模型的 2 对数似然之间的差值。如果在某一步中要添加变量,则在更改的显著性小于 0.05 时才能进行此包含操作。如果某一步中要移除变量,则在更改的显著性大于 0.10 时才能进行此排除操作。在 12 个步骤中,12 个变量将添加到模型中。

最终的模型包含 地址 、 雇用状况 、 居住地址 、 equip 、 电话卡 、 longmon 、 equipmon 、 multline 、 声音 、 因特网 、 callid ,以及 电子帐单 。要了解单个预测变量的效果,请查看 Exp(B),可将 Exp(B) 解释为预测变量中单元增量风险中的预测更改。
- 地址的 Exp(B) 值表示,对于居住在同一地址的客户,每年的流失风险会降低 100%−(100%× 0.966)=3.4% 。在同一地址居住五年的客户的流失风险会降低 100%−(100%×0.9665)=15.88%。
- 电话卡 的 Exp(B) 值表示没有订购电话卡服务的客户流失的风险比率是订购此服务的客户的 2.175 倍。重新调用分类变量编码,其回归的 No = 1。
- 因特网 的 Exp(B) 值表示未订购因特网服务的客户流失的风险比率是订购此服务的客户的 0.697 倍。这有点令人担忧,因为这表明使用该种服务的客户比不使用的客户取消公司服务的速度更快。

模型左侧变量的评分统计量的显著性值均大于 0.05。但是, tollfree 和 cardmon 的显著性值不小于 0.05,且与该值很接近。二者在今后的研究中有待进一步考证。