分区节点
“分区”节点用于生成分区字段,将数据分割为单独的子集或样本,以供模型构建的训练、测试和验证阶段使用。通过用某个样本生成模型并用另一个样本对模型进行测试,可以预判此模型对类似于当前数据的大型数据集的拟合优劣。
分区节点会生成名义字段,其角色设置为分区。此外,如果数据中已经存在相应的字段,可以使用“类型”节点将其指定为分区。在这种情况下,不需要单独的“分区”节点。可以将任何具有两个或三个值的实例化名义字段用作分区,但不能使用标志字段。有关更多信息,请参阅设置字段角色主题。
可以在一个流中定义多个分区字段,但如果这么做,那么必须在每个用于分区的建模节点的“字段”选项卡中选择一个分区字段。(如果仅有一个分区字段,则将在启用分区后自动引入此字段。)
启用分区。要在分析中使用分区,必须在相应的模型构建或分析节点的“模型选项”选项卡中启用分区。取消选择此选项可以在不删除字段的条件下禁用分区功能。
要基于其他标准(如数据范围或位置)创建分区字段,还可以使用“派生”节点。有关更多信息,请参阅“派生”节点主题。
示例。构建 RFM 流以识别积极响应以往营销活动的最新客户时,销售公司的市场营销部可以使用“分区”节点将数据分割到训练分区和检验分区。