分类表

评估模型的下一步是检查模型生成的预测。 请注意,模型基于预测累积概率。 但是,您可能最感兴趣的是模型根据预测变量的值生成正确预测类别的频率。 要了解模型的执行情况,您可以构造 分类表-也称为 混淆矩阵-将预测类别与实际类别交叉制表。 您可以使用保存的模型预测类别在另一个过程中创建分类表。 请参阅主题 使用交叉表分析交叉分类 以获取更多信息。

图 1。 初始模型的分类表
分类表,显示行中的帐户状态以及列中的预测响应类别 (付款当前或关键帐户)

该模型似乎正在执行可敬的预测结果类别的工作,至少对于最常见的类别-类别 3 (当前债务支付) 和类别 5 (关键科目)。 模型正确分类了 90.6% 的类别 3 个案和 75.1% 的类别 5 个案。 此外,类别 2 中的个案比类别 5 更有可能分类为类别 3 ,这是预测有序响应的理想结果。

另一方面,类别 1 (无信用历史记录) 个案的预测有些差,大多数个案被分配到类别 5 (关键科目) ,该类别理论上应该与类别 1 最不相似。 这可能指示定义有序结果标度的方式存在问题。 为了简洁起见,您不会在此处进一步探讨此问题,但在实际数据分析情况下,您可能希望对此进行调查,并尝试通过重新排序,合并或排除某些类别来发现是否可以改进有序刻度本身。

NEXT