从决策树中生成规则集

生成的规则集模型块可作为定义树的终端分支的一组规则来表示树的结构。 通常,规则集可保留完整的决策树中的大部分重要信息,但其使用的模型比较简单。最重要的区别是,使用规则集时,可以为任意特定记录应用多个规则,也可以不应用任何规则。 例如,可以看到所有预测结果为的规则,紧随其后是所有预测为的规则。 如果应用多个规则,那么每个规则将根据与此规则关联的置信度获得一个加权“投票”,并通过组合应用到所讨论记录的所有规则的加权投票来确定最终的预测。 如果没有规则可应用,那么会将缺省预测分配到该记录。

注: 对规则集进行评分时,您可能会注意到此评分相比于针对树的评分存在差异;这是由于树种每个终端分支都是独立评分的。 如果在数据中存在缺失值,那么您可以明显注意到此差异。

仅可从具有分类目标字段的树(不是回归树)中生成规则集。

在树构建器窗口中,或在浏览决策树模型块时,从菜单中选择以下项:

生成 > 规则集

规则集名称:指定新的规则集模型块的名称。

节点的创建位置:控制新的规则集模型块的位置。 选择工作区GM 选用板两者

最少实例数:指定在规则集模型块中保留的最小实例数(已应用规则的记录数)。 支持度小于指定值的规则将不会包含在新的规则集中。

最小置信度:指定规则集模型块中要保留的规则的最小置信度。 置信度小于指定值的规则将不会包含在新的规则集中。