构建流程

装入 建模简介 流后,您可以看到已设置 SPSS Modeler 流的部分。

图 1。 为流程建模
为流程建模

要构建流并创建模型,您至少需要三个节点: 数据资产 节点, 类型 节点和建模节点。 (可选) 您还可以添加 分析 节点。

数据资产节点
此节点从外部源读取数据,在本例中为 tree_credit.csv 数据文件。 如果在源节点中指定度量,那么无需在流中包含单独的 类型 节点。
“类型”节点
此节点指定字段属性,例如测量级别 (字段包含的数据类型) 以及每个字段作为建模中的目标或输入的角色。 测量级别是用于指示字段中数据的类型的类别。 源数据文件使用三个不同的测量级别:
  • 连续 字段 (例如 Age 字段) 包含连续数字值。
  • 名义 字段 (例如 Education 字段) 具有两个或两个以上不同的值-在本例中为 CollegeHigh school
  • 有序 字段 (例如 Income level 字段) 描述具有多个具有固有顺序的不同值的数据-在本例中为 LowMediumHigh
图 2。 使用“类型”节点设置目标和输入字段
使用“类型”节点设置目标和输入字段

对于每个字段, 类型 节点还指定 角色 以指示每个字段在建模中所扮演的部分。 对于字段 Credit rating,该角色设置为 Target ,这是用于指示客户是否拖欠贷款的字段。 target 是要预测其值的字段。

对于其他字段,角色设置为 Input 。 输入字段有时称为 predictors,或其值由建模算法用于预测目标字段的值的字段。

建模节点 (modeling node)

建模节点在流运行时生成模型块。 此示例使用 CHAID 节点。 CHAID 或卡方自动交互检测是一种分类方法,它使用称为卡方统计信息的特定类型的统计信息来构建决策树。 节点使用卡方统计信息来计算在决策树中进行分割的最佳位置。

CHAID 建模节点生成模型。 在节点的属性中的 FIELDS下,提供了 使用定制字段角色 选项。 您可以选择此选项并更改字段角色。 但是,在此示例中,请使用 类型 节点中指定的缺省目标和输入。

"表" 或 "分析" 节点
这些节点是可选的。 您可以将 分析 节点连接到模型块,以在将模型块添加到流之后查看评分结果。

三个主节点已连接。 因此,您只需配置 CHAID 节点即可。

  1. 双击 CHAID 节点 (名为 Creditrating)。 这时将显示节点属性。
    图 3。 CHAID 建模节点属性
    CHAID 建模节点属性

    CHAID 节点具有多个选项,您可以在这些选项中指定要构建的模型类型。

    对于这个例子,目标是创建一个崭新的模型。 在 目标 下,使用缺省 构建新模型 选项。

    要创建没有任何增强功能的单个标准决策树模型,请使用缺省目标选项 创建标准模型

    图 4: CHAID 建模节点目标
    CHAID 建模节点目标

    要使此示例的树保持相当简单,请通过提高父节点和子节点的最小个案数来限制树增长。

  2. 中止规则下,选择使用绝对值
  3. 父分支中的最小记录数设置为 400。
  4. 子分支中的最小记录数设置为 200。
图 5。 设置用于决策树构建的中止条件
设置用于决策树构建的中止条件

您可以将所有其他缺省选项用于此示例,因此单击 保存 ,然后单击工具栏上的 运行 以创建模型。 或者,右键单击 CHAID 节点,然后从菜单中选择 运行