设置值的选项

“类型”节点设置下的值方式列显示预定义值的下拉列表。 在此列表中选择指定选项,然后单击齿轮图标将打开一个新的屏幕,在该屏幕中,可以为所选字段设置用于读取、指定、标注和处理值的选项。

很多控件是所有数据类型通用的。 下面介绍这些通用控件。

测量。 显示当前选定的测量级别。 您可以更改此设置以反应希望的数据使用方式。 例如,如果名为 day_of_week 的字段包含代表各天的数字,您可能希望将此更改为名义数据,以创建用于分别检查每个类别的分布节点。

职位 用于告知建模节点字段将成为用于某个机器学习过程的输入(预测变量字段)还是目标(预测字段)。 还提供了其他角色,例如,两者分区拆分频率记录标识

值方式。 选择用于确定所选字段的值的方式。 用于读取值的选项包括:
  • 读取。 选择在节点运行时读取值。
  • 传递。 选择此选项将不为当前字段读取数据。
  • 指定。 此处的选项用于指定所选字段的值和标签。 将此选项与值检查功能配合使用,可以根据您对当前字段的了解指定值。 此选项可针对不同字段类型激活该类型所特有的控件。 对于测量级别为无类型的字段,不能指定值或标签。
  • 扩展。 选择此选项可将在此输入的值追加到当前数据。 例如,如果field_1具有范围 (0,10) ,并且您输入范围 (8,16)中的值,通过添加 16 来扩展范围,而不除去原始最小值。 新范围将为 (0,16)
  • 当前。 选择此项以保留当前数据值。

值标签 (添加/编辑标签)。 在此部分中,您可以输入所选字段的每个值的定制标签。

最大列表长度。 仅适用于测量级别为地理空间集合的数据。 通过指定列表可以包含的元素数目来设置列表的最大长度。

最大字符串长度。 仅可用于无类型数据。 生成 SQL 以创建表时,请使用此字段。 输入数据中最大字符串的值;这样会在表中生成一个足够容纳该字符串的列。 如果字符串长度值不可用,将使用可能不适用于该数据的缺省字符串大小(例如,如果值太小,向表中写入数据时可能会发生错误;如果值太大,可能会对性能产生不利影响。)

检查。 选择强制转换值以符合指定的连续、标志或名义值的方法。 此选项与主要“类型”节点设置中的检查列对应,在此进行的选择将覆盖主要设置中的设置。 通过将值检查功能与用于指定值和标签的选项配合使用,可以使数据中的值与期望的值一致。 例如,如果将值指定为 1, 0 ,然后使用 废弃 。 选项,则可以废弃所有其值不是 10 的记录。

定义缺失值。 选择此项以激活下列控件,这些控件可用于声明数据中的缺失值或空白值。
  • 缺失值。 使用此字段以将特定的值(例如 990)定义为空白值。 该值应适用于字段的存储类型。
  • 范围。 用于指定缺失值的范围,例如,年龄为 1–17 或大于 65。 如果界限值为空,那么范围是无界的。 例如,如果指定下限为 100(没有上限),那么大于或等于 100 的所有值都将定义为缺失值。 界限值包含在内。 例如,下限为 5 且上限为 10 的范围在范围定义中包含 510。 可以为任何存储类型定义缺失值范围,此范围包括日期/时间和字符串(在此情况下,将采用字母排列顺序来确定某个值是否在范围内)。
  • 空/空格。 您还可以将系统空值(在数据中显示为 $null$)和空白(没有可见字符的字符串值)指定为空白值。 请注意,为了执行分析,“类型”节点还会将空字符串视为空白,尽管它们在内部以不同方式进行存储,并且可能在某些情况下以不同方式进行处理。
注: 要将空白编码为未定义或 $null$,请使用 "填充" 节点。