测量级别

测量(也称为测量级别)描述了数据字段在 SPSS Modeler 中的使用。

您可以在导入节点或“类型”节点的节点属性中指定测量。 例如,您可能希望将值为 10 的某个整数字段的测量设置为标志。 通常,1 = True0 = False

存储与测量。 请注意,字段的测量级别不同于字段的存储类型,后者是指数据的存储形式是字符串、整数、实数、日期、时间还是时间戳记。 可以使用“类型”节点在流中的任意位置修改数据类型,而存储必须在读入数据时在源中确定(但是之后也可以使用转换函数对其进行更改)。

可以使用以下测量级别:
  • 缺省值。 存储类型和值未知(例如,由于尚未读取)的数据将显示为缺省值
  • 持续不断。 用于描述数字值,如范围 0–100 或 0.75–1.25。 连续值可以是整数、实数或日期/时间。
  • 绝对的。 用于字符串值(不同值数未知时)。 这是一种非实例化数据类型,表示有关数据存储类型和用法的所有可用信息均未知。 读取数据后,测量级别将为 “标记 ”、“标称”“无类型 ”,具体取决于标称字段中指定的最大成员数。
  • 标志。 用于表示存在或不存在某种特征的两个不同值的数据,例如 truefalseYesNo01 。 使用的值可能有所不同,但必须始终将一个指定为“真实”值,另一个指定为“虚假”值。 数据可表示为文本、整数、实数、日期、时间或时间戳记。
  • 名义。 用于描述具有多个不同值的数据,其中的每个值都被视为集合的一个成员,如 small/medium/large。 名义数据可具有任何存储类型,包括数值、字符串或日期/时间。 请注意,将测量级别设置为名义不会自动将值更改为字符串存储。
  • 序数。 用于描述具有多个顺序固定但值不同的数据。 例如,工资类别或满意度排秩可以归类为有序数据。 顺序由数据元素的自然排列顺序定义。 例如,1, 3, 5 是一组整数的缺省排序顺序,而 HIGH, LOW, NORMAL(按字母顺序升序)是一组字符串的顺序。 使用有序测量级别可以将一组分类数据定义为有序数据,以进行可视化处理、模型构建以及导出到将有序数据识别为不同类型的其他应用程序(如 IBM SPSS Statistics)。 您可以在任何能够使用名义字段的位置使用有序字段。 此外,可以将任何存储类型(实数、整数、字符串、日期、时间等等)的字段定义为有序。
  • 没有类型。 用于不符合任何默认 、连续 、分类 、标记、 名义序数类型的字段,用于具有单个值的字段,或用于集合成员数量超过定义的最大值的标称数据。 在测量级别是一个包含许多成员(例如账号)的集合的情况下 ,Typeless 也很有用。 为字段选择无类型时,角色将自动设置为,并且记录标识将作为唯一的替代项。 集合的最大缺省容量为 250 个唯一值。
  • 收藏。 用于标识列表中记录的非地理空间数据。 集合实际上是深度为零的列表字段,该列表中的元素具有另外某种测量级别。
  • 地理空间。 与“列表”存储类型配合使用以标识地理空间数据。 列表可以是列表深度介于 0 与 2(含首尾值)之间的整数列表实数列表字段。

可以手动指定测量级别,也可以由软件读取数据并根据所读取的值确定其测量级别。 此外,如果有多个连续数据字段需视为分类数据,可以选择一个用于对这些字段进行转换的选项。 请参阅 “转换连续数据 ”。

要使用自动输入

  1. 在“类型”节点中,将所需字段的值方式列设置为读取。 此操作将使元数据可用于所有下游节点。
  2. 单击读取值可立即读取数据源中的值。

要为字段手动设置测量级别

  1. 选择表中的某个字段。
  2. 测量列的下拉列表中为该字段选择测量级别。
  3. 或者,您可以使用复选框来选择多个字段,然后使用顶级下拉列表,一次设置所有选定字段的测量级别。