为“合并”指定排名式条件

您可以将“已排名的条件”合并视为按条件进行的左侧外连接合并;此合并的左侧是主数据集,其中的每个记录都是一个事件。例如,对于用来在罪案数据中查找模式的模型,主数据集中的每个记录都是一项罪案及其相关信息(地点和类型等等)。在此示例中,右侧可能包含相关的地理空间数据集。

此合并同时使用合并条件和排名表达式。合并条件可以使用 withinclose_to 之类的地理空间函数。在合并期间,右侧数据集中的所有字段都将添加到左侧数据集,但是多项匹配将产生列表字段。例如:

  • 左侧:罪案数据
  • 右侧:城镇数据集和道路数据集
  • 合并条件:城镇内 (within) 且邻近 (close_to) 道路的罪案数据,以及所谓“邻近”(close_to) 的定义。

在此示例中,如果罪案发生在三条道路(要返回的匹配项数至少设置为 3)的所需邻近 close_to 距离内,那么将全部三条道路作为列表项返回。

通过将合并方法设置为排名式条件,可以指定执行合并前必须满足的一项或多项条件。

主数据集 请选择用于合并的主数据集;所有其他数据集中的字段都将添加到您选择的数据集中。您可以将其视为外连接合并的左侧。

您选择主数据集时,所有其他连接到“合并”节点的输入数据集都将自动列示在合并表中。

向重复字段名添加标记以避免合并冲突 如果两个或两个以上要合并的数据集包含相同的字段名,那么通过选中此复选框,可以在字段列标题开头添加另一个前缀标记。例如,如果存在两个名为 Name 的字段,那么合并结果将包含 1_Name2_Name。如果在数据源中将该标记重命名,那么将使用新名称,而不是使用进行了编号的前缀标记。如果未选中此复选框,并且数据中存在重复的名称,那么此复选框右侧将显示警告。

合并

数据集
显示作为输入连接到“合并”节点的辅助数据集的名称。缺省情况下,存在多个辅助数据集时,这些数据集将按它们连接到“合并”节点的顺序列出。
合并条件

请输入用于将表中各个数据集与主数据集合并的唯一条件。您可以直接在单元格中输入条件,也可以单击此单元格右侧的计算器图标以借助表达式构建器构建条件。例如,您可以使用地理空间谓词来创建合并条件,用于将一个数据集中的罪案数据放入另一个数据集的城镇数据。缺省合并条件取决于地理空间测量级别,如以下列表所示。

  • “点”、“线串”、“多点”和“多线串”- close_to 的缺省条件。
  • “多边形”和“多多边形”- within 的缺省条件。

有关这些级别的更多信息,请参阅地理空间测量子级别

如果一个数据集包含多个不同类型的地理空间字段,那么使用的缺省条件取决于按以下降序在数据中找到的第一个测量级别。

  • 线串
  • 多边形
注: 仅当辅助数据库中存在地理空间数据字段时,缺省值才可用。
排名表达式

请指定一个表达式,用于对数据集的合并进行排名;此表达式将根据排名条件对多个匹配项进行排序。您可以直接在单元格中输入条件,也可以单击此单元格右侧的计算器图标以借助表达式构建器构建条件。

距离和面积的缺省排名表达式在表达式构建器中提供,这两种表达式都从低到高排名,例如,这表示顶部的距离匹配是最小的值。下面是按距离进行排名的一个示例:主数据集包含罪案及其相关地点,另外每个数据集都包含具有地点的对象;在这种情况下,罪案与对象之间的距离可以用作排名条件。缺省排名表达式取决于地理空间测量级别,如以下列表所示。

  • “点”、“线串”、“多点”和“多线串”- 缺省表达式为 distance
  • “多边形”和“多多边形”- 缺省表达式为 area
注: 仅当辅助数据库中存在地理空间数据字段时,缺省值才可用。
匹配项数
根据条件和排名表达式,指定返回的匹配项数。缺省匹配项数取决于辅助数据集中的地理空间测量级别,如以下列表所示;但是,您可以在单元格中双击以输入自己的值,最大为 100。
  • “点”、“线串”、“多点”和“多线串”- 缺省值为 3。
  • “多边形”和“多多边形”- 缺省值为 1。
  • 不包含地理空间字段的数据集 - 缺省值为 1。

例如,如果您设置了基于合并条件 close_to排名表达式 distance 的合并,那么主数据集中的每个记录在辅助数据集中的前三个(最邻近)匹配项将作为结果列表字段中的值返回。