构建流程
装入 建模简介 流后,您可以看到已设置 SPSS Modeler 流的部分。

要构建流并创建模型,您至少需要三个节点: 数据资产 节点, 类型 节点和建模节点。 (可选) 您还可以添加 表 或 分析 节点。
- 数据资产节点
- 此节点从外部源读取数据,在本例中为 tree_credit.csv 数据文件。 如果在源节点中指定度量,那么无需在流中包含单独的 类型 节点。
- “类型”节点
- 此节点指定字段属性,例如测量级别 (字段包含的数据类型) 以及每个字段作为建模中的目标或输入的角色。 测量级别是用于指示字段中数据的类型的类别。 源数据文件使用三个不同的测量级别:
- 连续 字段 (例如
Age字段) 包含连续数字值。 - 名义 字段 (例如
Education字段) 具有两个或两个以上不同的值-在本例中为College或High school。 - 有序 字段 (例如
Income level字段) 描述具有多个具有固有顺序的不同值的数据-在本例中为Low,Medium和High。
图 2。 使用“类型”节点设置目标和输入字段 
对于每个字段, 类型 节点还指定 角色 以指示每个字段在建模中所扮演的部分。 对于字段
Credit rating,该角色设置为Target,这是用于指示客户是否拖欠贷款的字段。target是要预测其值的字段。对于其他字段,角色设置为
Input。 输入字段有时称为predictors,或其值由建模算法用于预测目标字段的值的字段。 - 连续 字段 (例如
- 建模节点 (modeling node)
建模节点在流运行时生成模型块。 此示例使用 CHAID 节点。 CHAID 或卡方自动交互检测是一种分类方法,它使用称为卡方统计信息的特定类型的统计信息来构建决策树。 节点使用卡方统计信息来计算在决策树中进行分割的最佳位置。
CHAID 建模节点生成模型。 在节点的属性中的 FIELDS下,提供了 使用定制字段角色 选项。 您可以选择此选项并更改字段角色。 但是,在此示例中,请使用 类型 节点中指定的缺省目标和输入。
- "表" 或 "分析" 节点
- 这些节点是可选的。 您可以将 表 或 分析 节点连接到模型块,以在将模型块添加到流之后查看评分结果。
三个主节点已连接。 因此,您只需配置 CHAID 节点即可。
- 双击 CHAID 节点 (名为 Creditrating)。 这时将显示节点属性。
图 3。 CHAID 建模节点属性 
CHAID 节点具有多个选项,您可以在这些选项中指定要构建的模型类型。
对于这个例子,目标是创建一个崭新的模型。 在 目标 下,使用缺省 构建新模型 选项。
要创建没有任何增强功能的单个标准决策树模型,请使用缺省目标选项 创建标准模型。
图 4: CHAID 建模节点目标 
要使此示例的树保持相当简单,请通过提高父节点和子节点的最小个案数来限制树增长。
- 在中止规则下,选择使用绝对值。
- 将父分支中的最小记录数设置为 400。
- 将子分支中的最小记录数设置为 200。

您可以将所有其他缺省选项用于此示例,因此单击 保存 ,然后单击工具栏上的 运行 以创建模型。 或者,右键单击 CHAID 节点,然后从菜单中选择 运行。