“分区”节点

“分区”节点用于生成一个分区字段,来将数据分割为多个单独的子集或样本,以用于模型构建过程的训练、检验和验证阶段。 通过使用一个样本来生成模型,并使用另一个样本来检验该模型,可以预判该模型对类似于当前数据的更大型数据集的拟合优劣。

“分区”节点会生成一个名义字段,其角色设置为分区。 或者,如果数据中已存在相应的字段,您可使用“类型”节点将该字段指定为分区。 在这种情况下,不需要单独的“分区”节点。 可以将任何包含两个或三个值的实例化名义字段用作分区,但不能使用标志字段。

在一个流程中可以定义多个分区字段,但如果这么做,您在每个使用分区功能的建模节点中必须选择单个分区字段。 (如果只有一个分区,那么启用分区后就会自动使用该分区。)

要基于其他标准(例如,数据范围或位置)创建分区字段,您还可以使用“派生”节点。 有关更多信息,请参阅 "派生" 节点

示例。 构建 RFM 流程以识别积极参与过往营销活动的近期客户时,销售公司的市场营销部可以使用“分区”节点将数据分割为训练分区和检验分区。