设置字段角色

字段的角色用于指定其在模型构建过程中的用法 - 例如，字段是输入还是目标（预测的对象）。

注： “分区”、“频率”和“记录标识”角色只能分别应用到单个字段。

可用的角色如下：

输入。字段将用作机器学习的输入（预测变量字段）。

目标。字段将用作机器学习的输出或目标（模型将尝试预测的字段之一）。

两者。字段将被 Apriori 节点同时用作输入和输出。所有其他建模节点都将忽略该字段。

无。机器学习将忽略该字段。测量级别已设置为无类型的字段将在角色列中自动设置为无。

分区。指明字段用于将数据分区为单独的样本（用于训练、测试，也可用于验证）。该字段必须属于实例化集合类型，具有两个或三个可能值（在“字段值”对话框中定义）。第一个值表示训练样本，第二个值表示测试样本，第三个值（如果存在）表示验证样本。所有其他值都将被忽略，且不能使用标志字段。请注意，要在分析中使用分区，必须在相应的模型构建或分析节点的“模型选项”选项卡中启用分区。启用分区时，会将对于分区字段具有空值的记录从分析中排除。如果已在流中定义多个分区字段，那么必须在每个相应建模节点的“字段”选项卡中指定单一分区字段。如果数据中不存在适合的字段，您可以使用“分区”节点或“派生”节点进行创建。有关更多信息，请参阅分区节点主题。

分割。（仅名义、有序和标志字段）指定为字段的每个可能值构建一个模型。

频率。（仅数字字段）设置此角色允许将字段值用作记录的频率加权因子。仅 C&R 树、CHAID、QUEST 和线性模型支持此功能；所有其他节点将忽略此角色。在支持此功能的建模节点的“字段”选项卡上，选择使用频率权重以启用频率加权。

记录标识。此字段将用作唯一记录标识。大多数节点都会忽略此特征；但它受线性模型支持，并且是 IBM Netezza 数据库内挖掘节点所必需的。