匹配您的数据以创建主数据实体( Match 360IBM 作为服务)
对您的数据运行匹配操作,让即服务 Match 360IBM (as a Service)确定您的记录是否可被收集到主数据实体中。 每个主数据实体包含一个或多个被识别为匹配的记录。
- 所需许可权
- 要在主数据实例中配置和运行匹配操作,您必须是作为服务提供的 Match 360IBM 服务对应 DataEngineer 用户组的成员。
对数据进行匹配通常有两个常见原因:
- 对于记录去重和实体解析 ,匹配过程会分析您的数据以确定其中是否存在重复记录。 疑似重复记录将合并至主数据实体中,从而建立单一、可信赖的360度数据视图。
- 要创建其他类型的实体关联 ,匹配过程会分析您的数据,将记录归集到代表不同类型群组的实体中,例如家庭或亲属关系。
有关匹配算法及其如何匹配数据并创建实体的更多信息,请参阅 Match 360IBM 匹配算法。
准备运行匹配
在运行匹配算法之前,请确保将您的数据类型和资产发布到 as a IBMMatch 360 Service 服务数据库中。 有关更多信息,请参阅添加数据并将其映射到数据类型。
数据类型定义中描述的每种实体类型都有其独立的匹配算法,用于创建该类型的实体。 例如,Person记录类型可以包含多个实体类型,如Person和Household。
- "人员"实体类型可用于人员记录数据的去重和实体解析。
- 家庭实体类型可用于创建关联记录,这些记录均属于同一家庭。
设置匹配算法
设置匹配算法:
从主数据导航菜单中,点击数据类型
。
点击实体类型。
实体类型列表中可能包含尚未发布到系统的实体类型。 在这种情况下,匹配将无法开始。 每次进行更改(例如添加新实体类型)后,请务必发布您的数据类型。
点击要配置匹配算法的实体类型名称,然后点击编辑图标
。
转到比赛设置选项卡。
在侧边栏中选择 “属性选择 ”,以选择用于匹配此实体类型内记录的属性。 首次打开此页面时,作为服务的 Match 360IBM 服务会自动根据您的数据类型定义生成一些建议属性,用于匹配操作。
复查匹配属性的列表。 这些属性将用作比较的基础,以匹配记录和创建主数据实体。 要向列表中添加或移除属性,请点击 “编辑属性 ”,然后根据需要选择或取消选择属性及其组件字段。
选择匹配属性时,请使用匹配强度指示器来查看更改对匹配算法的影响程度的估算。
若您为数据类型添加了任何自定义属性,这些属性默认不会被选中用于匹配操作。 若要在匹配中使用自定义属性类型,必须先选择该类型,然后指定要考虑的具体字段。 若未指定任何字段,则匹配算法将无法使用该属性。
对于预定义(非自定义)属性类型,若未指定要考虑的字段,匹配算法将使用默认字段集。
当您对匹配属性满意时,请点击保存。
选择哪些记录将被纳入匹配范围
可选地,您可以配置条件来定义服务将哪些 IBMMatch 360 记录纳入匹配考虑范围。
默认情况下,所有与所选实体类型关联的记录均可参与匹配。 要缩小可匹配记录的范围,您可以指定筛选条件,这些条件可包含或排除具有特定属性值的记录。
定义哪些记录将被选中用于匹配:
从主数据导航菜单中,点击数据类型
。
点击实体类型 ,然后选择要配置匹配算法的实体类型,并点击编辑图标
。
在侧边栏中选择 “记录选择 ”以访问记录选择设置。
若要为该实体类型启用记录选择筛选器,请单击 “启用记录选择 ”。
若需后续禁用记录筛选器,请选择“禁用记录筛选”。
定义记录选择条件:
a. 点击 “+ ”,然后选择您想要考虑的属性。
b. 点击 “+”号 ,然后选择您想要选中的对应属性值。
c. 重复这些步骤以添加条件。
定义条件后, 操作设置即刻可用。
定义与该条件相关的操作。 点击 + ,然后选择 “用于匹配 ”或 “不用于匹配 ”。
- 若选择 “用于匹配 ”,则仅满足条件的记录才能参与此实体类型的匹配操作。
- 若选择 “不参与匹配 ”,则任何符合条件的记录均无法参与此实体类型的匹配操作。
匹配您的数据并审查结果
对记录数据执行匹配操作以创建主数据实体:
从主数据导航菜单中,点击数据类型
。
点击实体类型 ,然后选择要进行匹配的实体类型。
点击操作栏中的运行
匹配图标。
匹配过程需要一段时间才能完成。 此过程会在后台运行,因此您可以继续工作。 完成后您将收到通知。
如果匹配过程在完成前终止(无论是因失败还是您取消了该过程),那么下次运行匹配时,系统会提示您选择:从中断阶段继续匹配,还是从头开始重新启动该过程。 若您已对正在匹配的数据进行修改,请选择 “重新开始匹配 ”。 否则,选择 “继续匹配 ”以跳过已成功完成的匹配阶段,从而节省时间。
匹配完成时,转至匹配结果选项卡以查看包含统计信息和可视化内容的仪表板,它会提供有关您的主数据的洞察。
提示: 若匹配完成后记录数据发生变更,匹配结果屏幕上的统计数据可能失效。 要更新统计数据,请点击刷新匹配结果或重新运行匹配。 刷新比赛结果可能需要一些时间才能完成。
您可以随时通过选择不同的匹配属性或更改自动链接的阀值来调整匹配算法
当您向您的 Match 360IBM 即服务实例添加更多数据源和资产并重新运行匹配时,新数据既会在自身内部进行匹配,也会与系统中的现有数据进行匹配。 通过此方式,您可为整个企业的客户构建单个统一的 360 度视图。