使用预测模型对数据评分

对一组数据应用预测模型的过程称为对数据评分IBM® SPSS® Statistics 具有构建预测模型 (例如回归,聚类,树和神经网络模型) 的过程。 构建模型后,可以将模型指定项保存在文件中,该文件包含重建模型所需的所有信息。 然后,您可以使用该模型文件在其他数据集中生成预测得分。 注:某些过程生成模型 XML 文件,而某些过程生成压缩文件归档(.zip 文件)。

示例。 公司直销部门使用试验邮寄的结果,为其联系人数据库的其余部分指定倾向得分,他们使用各种人口统计学特征来标识最有可能做出响应和购买产品的联系人。

可以将评分视为数据转换。 模型在内部表现为一组数值转换,这组转换将应用于一组给定字段/变量(模型中指定的预测变量)以获得预测结果。 在此意义下,用给定模型对数据评分的过程与对一组数据应用任何函数(例如平方根函数)在实质上相同。

评分过程包含两个基本步骤:

  1. 构建模型并保存模型文件。 使用数据集构建兴趣结果(通常被称为目标)已知的模型。 例如,如果您希望构建可预测谁可能会响应直接邮寄活动的模型,那么需要从已包含响应人和未响应人信息的数据集开始。 例如,这可能是对一小组客户发送的试验邮寄的结果或来自过去类似活动的响应信息。

    :对于一些模型类型,没有兴趣的目标结果。 例如,聚类模型没有目标,而一些最近邻模型也没有目标。

  2. 应用该模型到其他数据集(其中兴趣结果未知)以获取预测结果。