建模简介

模型是一组规则、公式或方程式,可以使用它们来根据一组输入字段或变量预测输出。 例如,金融机构可以使用模型来根据以往的申请人的已知相关信息预测贷款申请人具有较低风险还是较高风险。

预测结果的能力是预测性分析的中心目标,了解建模过程是使用 IBM® SPSS® Modeler的关键。

图 1。 简单的决策树模型
简单的决策树模型

本示例使用决策树模型,该模型使用一系列决策规则对记录进行分类(并预测响应),例如:

IF income = Medium 
AND cards <5
THEN -> 'Good'

虽然此示例使用 CHAID (卡方自动交互检测) 模型,但它旨在作为一般介绍,并且大多数概念广泛适用于 IBM SPSS Modeler中的其他建模类型。

无论要了解哪种模型,均需要首先了解进入该模型的数据。 此示例中的数据包含有关银行客户的信息。 其中使用了下列字段:

字段名称 描述
Credit_rating 信用评级:0 = 不良,1 = 优良,9 = 缺失值
年龄 Age in years
收入 收入水平:1 = 低,2 = 中,3 = 高
Credit_cards 持有的信用卡数:1 = 少于五张,2 = 五张或更多
教育 教育程度:1 = 高中,2 = 大学
Car_loans 申请的汽车贷款数:1 = 没有或者一项,2 = 两项以上

对于已申请银行贷款的客户,银行维护其相关历史信息的数据库,这些信息包括客户是偿还了贷款(信用评级 = 优良)还是拖欠贷款(信用评级 = 不良)。 通过使用此现有数据,银行将构建一个模型,该模型使他们能够预测未来的贷款申请者拖欠贷款的可能性。

通过使用决策树模型,您可以分析两组客户的特征并预测贷款拖欠的发生可能性。

本示例使用了名为 modelingintro.str 的流,该流位于 streams 子文件夹下的 Demos 文件夹中。 数据文件是 tree_credit.sav。 请参阅主题 Demos Folder 以获取更多信息。

我们来看一下流。

  1. 从主菜单中选择下列选项:

    文件 > 打开流

  2. 单击“打开”对话框的工具栏上的金块图标,然后选择 Demos 文件夹。
  3. 双击 streams 文件夹。
  4. 双击名为 modelingintro.str 的文件。

NEXT