设置(购买倾向)
模型验证
模型验证创建训练和测试组以供诊断用途。如果在“诊断输出”部分选择分类表,则此表将分为训练(选中)和测试(未选中)部分,以方便比较。仅当选择分类表后,才能选择模型验证。得分基于从训练样本生成的模型,而训练样本包含的记录数始终少于可用记录总数。例如,缺省训练样本大小为 50%,在一半可用记录上构建的模型不如基于全部可用记录的模型可靠。
- 训练样本分区大小 (%)。 指定分配给训练样本的记录百分比。响应字段的具有非缺失值的其余记录则被指定给测试样本。值必须大于 0 且小于 100。
- 设置种子以复制结果。 由于记录是随机分配给训练和测试样本的,因此每次运行过程时可能会得到不同的结果,除非始终指定相同的随机数种子值。
诊断输出
总体模型质量。 显示总体模型质量(表示为 0 和 1 之间的值)条形图。良好的模型应具有大于 0.5 的值。
分类表。 显示一个表格,对预测的正、负响应和实际的正、负响应进行比较。总体准确率可以在某些方面显示模型工作情况,不过您可能更关注正确预测的正响应的百分比。
- 最小可能性。 将得分值大于指定值的记录指定到分类表中的预测正响应类别。由过程生成的得分代表联系人将做出正面响应(例如,购买产品)的可能性。作为一般规则,您必须指定一个接近最低目标响应率的比例值。例如,如果您对至少 5% 的响应率感兴趣,请指定 0.05。值必须大于 0 且小于 1。
重新编码的响应字段的名称和标签
该过程自动将响应字段重新编码为新字段,其中 1 代表正响应,0 代表负响应,并在重新编码的字段上执行分析。您可以使用自己的名称和标签覆盖缺省名称和标签。名称必须符合 IBM® SPSS® Statistics 命名规则。请参阅变量名称主题以获取更多信息。
保存得分
在原始数据集中自动保存一个包含倾向得分的新字段。得分代表正响应的可能性,并以比例表示。
- 字段名必须符合 IBM SPSS Statistics 命名规则。请参阅变量名称主题以获取更多信息。
- 该字段名不能与数据集中现有字段名重复。如果在同一数据集上多次运行此过程,则需要每次指定不同的名称。