指定合并方法和关键字
“合并”节点的“合并”选项卡包含下列字段。
合并方法 请选择用于合并记录的方法。选择键或条件将激活此对话框的下半部分。
- 顺序 按顺序合并记录,以便将每个输入中的第 n 个记录合并到一起,从而生成第 n 个输出记录。当任何记录用完匹配输入记录后,将不会再生成任何输出记录。这意味着,创建的记录数是最小数据集中的记录数。如果使用此选项,务必确保已使用排序节点完成了对数据的排序。
-
键 使用键字段(例如交易标识)将键字段中的值相同的记录合并。此选项等同于数据库的“相等连接”。如果关键值出现多次,那么返回所有可能的组合。例如,如果具有相同键字段值 A 的记录的其他字段中包含不同的值 B、C 和 D,那么合并后的字段对于 A 与值 B、A 与值 C 以及 A 与值 D 的每个组合都将生成一个单独的记录。
注意:在按关键字合并的方法中,空值不会被视为相同的值,因此不会连接。
- 条件 使用此选项可以指定合并条件。有关更多信息,请参阅 指定合并的条件。
- 排名式条件 使用此选项可以指定是否对主数据集与所有辅助数据集中的每一对行进行合并;使用排名表达式可以将任意的多个匹配项按从低到高顺序排列。有关更多信息,请参阅 为“合并”指定排名式条件。
可能的键 仅列出那些在所有输入数据源中都有完全匹配的字段名称的字段。从此列表中选择一个字段,并使用箭头按钮将其添加为用于合并记录的关键字段。可以使用多个键字段。您可以使用“过滤器”节点或者源节点的“过滤器”选项卡对不匹配的输入字段进行重命名。
用于合并的键 根据键字段的值,列出所有用于对来自所有输入数据源的记录进行合并的字段。要从列表中移除关键字段,请选择一个关键字段,然后使用箭头按钮将其返回到“可能的关键字”列表中。如果选择了多个关键字段,那么下面的选项将启用。
组合重复键字段 在上面选择了多个键字段之后,此选项确保只有一个具有该名称的输出字段。缺省情况下,此选项为启用状态,但已从以前版本的 IBM® SPSS® Modeler 导入流的情况下除外。如果禁用了此选项,那么必须使用“合并”节点对话框中的“过滤器”选项卡将重复的键字段重命名或排除。
仅包括匹配的记录(内连接) 选择此项将仅合并完整的记录。
包括匹配的记录和不匹配的记录(全外连接) 选择此项将执行“全外连接”。这意味着,如果不存在所有输入表中所共有的关键字段值,那么将仍然保留不完整记录。未定义的值 ( $null$ ) 会添加到关键字段,并包括在输出记录中。
包括匹配的记录和选定的不匹配记录(部分外连接) 选择此项表示对子对话框中选择的表执行“部分外连接”。单击选择可指定将在合并中为其保留不完整记录的表。
包括第一个数据集中与任何其他记录都不匹配的记录(反连接) 选择此项表示执行某种“反连接”,在此类连接中,只有第一个数据集中的不匹配记录将传递到下游。您可以使用“输入”选项卡上的箭头指定输入数据集的顺序。这种连接类型在输出数据集中不包括完整记录。有关更多信息,请参阅 连接类型。