为重新分类节点设置选项

重新分类节点的使用分为以下三个步骤:

  1. 首先,选择要对多个字段还是单个字段进行重新分类。
  2. 下面,选择是在现有字段内重新编码还是创建新字段。
  3. 然后,根据需要使用重新分类节点对话框中的动态选项映射集合。

    Mode. 选择单个可对一个字段进行重新分类。选择多个将激活若干选项,它们可实现同时转换多个字段。

    重新分类为。选择新字段将保留原始名义字段,并派生包含重新分类的值的新字段。选择现有字段将使用新的分类覆盖原始字段中的值。此选项实质上是一种“填充”操作。

    指定模式和替换选项后,必须选择转换字段并使用对话框下半部分的动态选项指定新的分类值。这些选项会依据前面所选模式的不同而变化。

    重新分类字段。使用右边的字段选择器按钮选择一个(“单个”模式)或多个(“多个”模式)分类字段。

    新字段名称。为包含重新编码值的新名义字段指定名称。如果前面选择了新字段,此选项仅在“多个”模式下可用。如果选择了现有字段,则会保留原始字段名。采用“多个”模式时,此选项将被其它控件替换,以指定向每个新字段添加的扩展名。有关更多信息,请参阅对多个字段进行重新分类主题。

    重新分类值。使用此表,可以实现从旧集合值到此处指定的集合值的明确映射。

    • 原始值。此列列出选择字段的现有值。
    • 新值。使用此列可输入新的类别值或从下拉列表中选择类别值。使用分布图中的值自动生成“重新分类”节点时,这些值将包括在该下拉列表中。这样,您可以将现有值快速映射至已知值集合。例如,医疗保健组织有时会根据网络或语言环境对诊断进行不同分组。经过合并或采集,所有各方都需要采用一致方式对新的或现有数据进行重新分类。可以将值的主列表读入 IBM® SPSS® Modeler,对 Diagnosis 字段运行条形图,然后直接从该图生成字段的重新分类(值)节点,而无需手动键入冗长列表中的每个目标值。此过程将使所有目标 Diagnosis 值显示在“新值”下拉列表中。
  4. 单击获取读取前面选择的一个或多个字段的原始值。
  5. 单击复制针对尚未映射的字段将原始值粘贴至 新值 列。未映射的原始值将添加到下拉列表中。
  6. 单击清除新值将擦除 新值 列中的所有指定值。注意:此操作不会将值从下拉列表中擦除。
  7. 单击自动可自动生成代表每个原始值的连续整数。只能生成整数值,不能生成实数值(如 1.5、2.5 等)。

例如,可以自动生成代表产品名的连续产品标识,或代表大学课程的课程编号。此功能对应于 IBM SPSS Statistics 中集合的自动重新编码转换。

用于未指定的值。此选项用于在新字段中填充未指定的值。可以选择保留原始值(选择原始值),也可以指定缺省值。