构建流
图 1. “特征选择”示例流

- 将“Statistics 文件”源节点放入空白的流画布中。将此节点指向示例数据文件 customer_dbase.sav ,该文件位于 IBM® SPSS® Modeler 安装程序的 Demos 目录下。(或者,可打开位于 streams 目录下的示例流文件 featureselection.str。)
- 添加“类型”节点。在“类型”选项卡上,向下滚动到底部并将 response_01 的角色更改为目标。将其他响应字段(response_02)和(response_03)以及客户标识(列表顶部的 custid)的角色更改为无。将所有其他字段的角色设置为输入,并单击读取值按钮,然后单击确定。图 2. 添加“类型”节点

- 将“特征选择”建模节点添加到流中。在此节点上,您可以指定要筛选的规则和标准,或要筛选的字段。图 3. 添加“特征选择”建模节点

- 运行流以创建“特征选择”模型块。
- 右键单击流上或“模型”选用板中的模型块并选择编辑或浏览以查看结果。图 4. “特征选择”模型块中的“模型”选项卡

顶部面板显示了被认为对预测有用的字段。这些字段根据重要性进行排列。底部面板显示了从分析中筛选出来的字段及筛选的原因。通过检查顶部面板中的字段,可以确定在随后的建模会话中要使用哪些字段。
- 现在,可以选择要在下游使用的字段。虽然最初已将 34 个字段识别为重要字段,但我们希望进一步精简预测变量集合。
- 使用第一列中的勾选标记来取消选中不需要的预测变量,以便仅选中前 10 个预测变量。(单击行 11 中的选中标记,按住 Shift 键并单击行 34 中的选中标记。)关闭模型块。
- 要在不使用特征选择的情况下比较结果,必须向流添加两个 CHAID 建模节点:一个使用特征选择,另一个不使用。
- 将一个 CHAID 节点连接到“类型”节点,并将另一个节点连接到“特征选择”模型块。
- 打开每个 CHAID 节点,选择“构建选项”选项卡,确保在“目标”窗格中选中了选项构建新模型、构建单个树和启动交互会话。
在“基本”窗格上,确保将最大树深度设置为 5。
图 5. CHAID 建模节点针对所有预测变量字段的目标设置
