自动建模节点
自动建模节点对多种不同的建模方法进行估算和比较,这使您可以在一次建模运行中尝试多种方法。您可以选择所使用的建模算法,以及每个建模算法的具体选项,包括可能互斥的组合。例如,您无需为神经网络选择快速、动态或修剪之中的某个方式,完全可以全部尝试。节点研究选项的每个可能组合,根据您指定的测量为每个候选模型排序,并保存最佳模型用于评分或将来的分析。
您可以根据分析需要从三个自动建模节点中进行选择:
|
|
“自动分类器”节点用于创建和对比二元结果(是或否,流失或不流失等)的若干不同模型,使用户可以选择给定分析的最佳处理方法。由于支持 多种建模算法,因此可以对用户希望使用的方法、每种方法的特定选项以及对比结果的标准进行选择。节点根据指定的选项生成一组模型并根据用户指定的标准排列最佳候选项的顺序。 |
|
|
自动数字节点使用多种不同方法估计和对比模型的连续数字范围结果。此节点和自动分类器节点的工作方式相同,因此可以选择要使用和要在单个建模传递中使用多个选项组合进行测试的算法。受支持的算法包括神经网络、C&R 树、CHAID、线性回归、广义线性回归以及支持向量机 (SVM)。可基于相关度、相对错误或已用变量数对模型进行对比。 |
|
|
“自动聚类”节点估算和比较识别具有类似特征记录组的聚类模型。节点工作方式与其他自动建模节点相同,使您在一次建模运行中即可试验多个选项组合。模型可使用基本测量进行比较,以尝试过滤聚类模型的有效性以及对其进行排序,并提供一个基于特定字段的重要性的测量。 |
最佳模型保存在一个组合模型块中,可对其进行浏览和比较,并选择评分中使用的模型。
- 只有对于二元、名义和数字目标,您才可以选择多个评分模型,并将评分组合在一个模型整体中。通过结合多个模型的预测,可以避免单个模型的局限性,使所得的整体准确性通常比从任一模型中获得的准确性要高。
- 您还可以选择向下钻取结果,或为要使用或进一步探索的所有单独模型生成建模节点或模型块。
模型和执行时间
根据模型的数据集和数量,自动建模节点执行时间可能为数小时或甚至更长。在选择选项时,请注意正在生成的模型个数。如果现实条件允许,您可能希望将建模运行的时间安排在夜晚或周末,因为此时对系统资源的需求可能比较小。
- 必要的话,可以使用分区节点或“样本”节点减少包括在初始训练传递中的记录数。一旦将选择限制在几个生成的候选模型内,就可以恢复全部数据集。
- 要减少输入字段数,请使用特征选择。有关更多信息,请参阅特征选择节点主题。另外,您可以使用初始建模运行来识别需要进一步探索的字段和选项。例如,如果性能最佳的模型似乎都使用了相同的三个字段,那么有力地说明这些字段值得保留。
- 您还可以限制评估任一模型所需的时间并且指定用于过滤和排序模型的评估尺度。