在 IBM 中定义属性组合规则 Master Data Management

创建并管理规则,以确定实体的属性值如何从其成员记录中被选取。 您可以在数据类型定义中为每种实体类型定义和自定义属性组合规则集。

例如,考虑一个由名为"Joe Howell"和"Joseph Howell"的两个成员记录组成的个人实体。 该系统采用人员实体类型的属性组合规则,确定应选择哪个名字值("Joe"或"Joseph")作为实体的显示名字。

属性组合规则的作用域限定为实体类型级别或属性级别。 数据类型定义中的每个实体类型仅包含一条实体类型级别规则。 属性级规则以逐个属性为基础覆盖实体类型规则。 属性级规则也可配置为仅应用于属性内特定字段子集。

重要提示: 某些属性的值(称为实体属性 )直接在实体中定义,而非从其成员记录中继承而来。 实体属性在实体类型定义中定义。 实体属性值不受属性组合规则的影响。 要更改实体属性的值,必须编辑该实体。 编辑成员记录不会改变实体的属性值。

所需许可权
要配置属性组合规则,您必须是“ IBM ” Master Data Management 服务中 DataEngineer 用户组的成员。

通过筛选和排序来定义属性组合

要配置 IBM ( Master Data Management )如何选择用于表示每个实体的属性值,您可以为每种实体类型定义属性组合规则。 每条属性组合规则都包含筛选和排序条件,您可以根据贵组织的要求对其进行优先级排序。 对于高级属性组合,请定义条件逻辑规则,以便根据上下文动态选择值。

某些规则使用简单的筛选和排序条件,例如来源偏好、最新或最频繁。 您还可以定义更复杂的字段级筛选和排序逻辑,从而实现更精准且符合业务需求的实体组合。

通过定义高质量的属性组合规则,您可以:

  • 提高数据的准确性和一致性。
  • 以精细的精度在字段级别控制属性的组合。
  • 从实体组合视图中过滤掉质量较低或不相关的数据。
  • 构建高质量且与业务目标相契合的复合实体。

过滤器条件

此外,您还可以定义一个筛选条件,以缩小实体属性组合过程中所考虑的记录及记录值的范围。

您可以根据以下条件定义筛选条件:

  • 源偏好 - 定义可信记录源列表,这些源可用于属性组合。 未列入本清单的来源所提供的记录将不予考虑。
  • 允许的值 - 定义一个允许的字段值列表,这些值可用于属性组合。 IBM Master Data Management 仅允许您定义的值显示在实体级别。
  • 不允许的值 - 定义一个不允许的字段值列表,这些值不能用于属性组合。 例如,您可以禁止使用占位符、未知值或虚拟值,例如 xxx, unknown, TBD, 或 N/A

排序条件

应用任何筛选条件后,排序条件将根据剩余值进行优先级排序并从中进行选择。 排序完成后,优先级最高的值将被映射到复合实体的属性中。

您可以根据以下标准定义排序条件:

  • 源优先级 - 使用最可信记录源中的属性值,并按您定义的优先级顺序进行排序。
  • 最新 - 使用最近一次更新的属性值。
  • 最频繁 - 使用在成员记录中出现频率最高的属性值。
  • 字段值优先级 - 定义首选字段值的优先级顺序。 例如,您可能希望信用卡状态的取值按以下顺序排列: Active > Hold > Inactive
  • 字段值比较 ——将各字段值的特征相互比较,以确定如何对属性进行排序。 例如,您可以按“最长值”排序,以选择最完整的 first.name 字段。

条件逻辑

若需对实体属性的组合进行高级控制,您可以定义更复杂的条件逻辑规则。 通过使用条件逻辑,您可以根据数据条件动态调整排序和筛选逻辑,从而实现基于上下文的决策。

重要提示: 条件逻辑总是在筛选和排序条件应用之后才生效。

在定义条件逻辑时, IBM Master Data Management 会评估指定的字段,并根据该字段的值应用不同的属性组合规则。 条件逻辑采用以下流程:

  1. 评估 - 检查指定字段的值。
  2. 匹配 ——依次检查每条条件规则,直到找到匹配项。
  3. 应用 - 当满足某个条件时,应用相应的排序规则。
  4. 备用方案 ——如果没有条件匹配,则使用默认排序规则。

例如,对于一个 mailing_address.state 字段,您可以配置以下条件:

  • 如果 state 等于 CA,则优先处理来自 的 California offices记录。
  • 如果 以 state N开头,则应用 Northeast regional 规则。
  • 否则,请遵循标准 national sorting 规则。

仲裁配置

作为最终的决胜条件,若已定义的规则条件无法确定唯一结果,则该实体的属性值取自剩余成员记录中记录号最小的记录。 最低记录编号通常表示该实体中的最早记录。

编辑默认实体类型作用域规则

数据类型定义中的每个实体类型都包含一条默认的实体类型作用域规则。 您可以编辑默认规则的条件,但无法删除该规则,也无法定义其他实体类型的规则。 实体类型规则决定了系统如何为所选类型的所有实体组合属性。

要编辑实体类型规则:

  1. “主数据 ”导航菜单中,单击 “数据类型 ”图标 数据类型图标,然后单击 “实体类型与匹配 ”。 选择您要操作的实体类型。

  2. 在实体类型页面中,转到 “匹配设置 ”选项卡,然后选择 “属性组合”

  3. 请确保在实体类型选择菜单中选择了来自您的数据类型定义的正确实体类型。

  4. 在属性组合规则列表中,找到" 作用域 "列中包含"实体类型"的规则。

  5. 将鼠标悬停在规则上,然后点击 “编辑 ”图标 编辑规则图标

  6. “设置最大值数量”下,选择可选中并包含在实体中的最大值数量。 此设置仅适用于可能包含多个值的属性,例如列表。

    配置规则以使用单个值、列表值仅使用单个值。 默认行为( 单个值或列表值 )会在记录中列出多个值时,为实体选择多个值进行包含。

  7. “包含源系统标识符”下,请注明该实体的属性值是否应包含原始记录的源系统标识符。 启用此功能后,每个组合实体的数据值将包含该实体所有成员记录的源系统标识符。

    有关源系统标识符的更多信息,请参阅 IBM 中的“数据概念”部分 : Master Data Management。

  8. 在“定义条件 ”下,选择一个筛选条件(可选)以及最多三个排序条件,供系统在为实体视图选择要使用的值时使用。 您必须至少选择一个排序条件。

  9. 在“筛选条件”(可选) 下,如果您选择定义筛选条件,可以根据来源偏好、允许的值或不允许的值进行筛选。 选择并定义筛选条件:

    过滤器条件
    过滤器类型 详细信息
    源首选项 使用源偏好设置过滤器来选择特定的记录源。 该规则在生成此属性时,仅考虑来自所选数据源的记录。 要定义源偏好过滤器:
    1. 选择 “来源”偏好设置作为筛选条件。
    2. 点击 “+”按钮 ,从您的数据中选择一个或多个您认为是可信来源的记录来源。
    3. 可选:单击 “新建数据源 ”,输入尚未添加到主数据中的自定义记录源的名称。 如果添加自定义数据源,其名称必须与未来数据资产中定义的记录源名称完全一致。
    4. 单击添加
    允许的值 使用“允许的值”筛选器来定义某些允许的字段值。 当您指定允许的值时,系统只会考虑包含指定字段值的记录。 要定义一个允许值过滤器:
    1. 选择 “允许的值 ”作为筛选条件。
    2. 单击 “配置字段-值对”
    3. 点击 “添加条件 ”。
    4. 请指定您要允许的字段和值。 根据需要添加任意数量的允许值条件。
    5. 单击添加
    不允许的值 使用“不允许的值”筛选器来定义某些不允许的字段值。 当您指定了不允许的值时,系统会忽略具有指定字段值的记录。 要定义一个禁止值过滤器:
    1. 选择 “不允许的值 ”作为筛选条件。
    2. 单击 “配置字段-值对”
    3. 点击 “添加条件 ”。
    4. 请指定您希望禁止的字段和值。 根据需要添加任意数量的“不允许的值”条件。
    5. 单击添加
  10. “排序条件 ”下,请定义至少一个排序条件。 点击 “添加排序选项 ”以创建排序条件。 您可以按出现频率最高、最近更新时间、来源偏好、字段值优先级或字段值比较进行排序。

    排序条件
    排序类型 详细信息
    上次更新日期 按记录最近一次更新的时间排序。
    最频繁 按该值在各记录中出现的频率进行排序。
    源首选项 按首选来源排序。
    1. 选择 “源”偏好设置
    2. 单击 “添加” 以从您的数据中选择您认为可信的记录来源。
    3. 如果您还设置了筛选条件,某些源可能无法选择,且无法定义新源。
    4. 在 “源”偏好设置面板中拖放源,以按优先级排序。
    5. 单击添加
    字段值优先级 根据指定的字段值偏好进行排序。
    1. 选择字段值优先级
    2. 定义字段。
    3. 按首选顺序定义一组值。
    4. 要定义其他字段和值,请单击 “设置字段值优先级”, 然后根据需要添加任意数量的条件。
    5. 单击添加
    字段值比较 根据数值特征的比较进行排序。
    1. 选择 “字段值比较 ”。
    2. 选择要排序的字段。
    3. 根据以下比较函数对值进行排序:
    longest - 选择最长的值。
    shortest - 选择最短的值。
    earliest - 选择最早的值。
    latest - 选择最晚的值。
    minimum - 选择最小值。
    maximum - 选择最大值。
    4. 要定义其他字段和值,请单击 “设置字段值比较”, 然后根据需要添加任意数量的条件。
    5. 单击添加
  11. 再次点击 “添加排序选项 ”,即可根据需要添加任意数量的排序条件。

  12. 在“按条件排序 ”下,可选地定义基于字段值和复杂逻辑的排序规则。 您可以定义一个或多个条件来比较字段值,然后根据比较结果动态应用不同的排序方式。 要定义一条条件逻辑规则:

    1. 单击添加条件
    2. 定义触发条件逻辑的字段值比较。 这是“if”语句。
    3. 定义在满足条件时用于排序的优先级顺序。 这是“then”语句。
    4. 要添加另一条规则,请点击 “添加条件 ”。 您可以根据需要添加任意数量的条件。

    IBM Master Data Management 按顺序处理条件规则。

  13. “判定条件 ”区域,请核对规则摘要以确保其符合您的预期。

  14. “属性 ”区域中,查看此实体级规则所适用的属性列表。 默认情况下,它适用于所有属性,除非存在属性级别的规则。

  15. 对规则满意后,单击保存

创建或编辑属性作用域规则

除了默认的实体类型范围规则外,每个实体类型还可以包含属性范围规则,这些规则会覆盖默认规则,但仅适用于一个属性(或该属性内的选定字段)。 若需针对特定属性采用不同的属性组合处理方式,此方法将非常有用。

您还可以使用属性作用域规则,完全排除特定属性在实体详情视图中的显示,同时仍保留成员记录视图中的底层属性值。

要创建属性作用域规则:

  1. “主数据 ”导航菜单中,单击 “数据类型 ”图标 数据类型图标,然后单击 “实体类型与匹配 ”。 选择您要操作的实体类型。

  2. 在实体类型页面中,转到 “匹配设置 ”选项卡,然后选择 “属性组合”

  3. 请确保在实体类型选择菜单中选择了来自您的数据类型定义的正确实体类型。

  4. 点击 “新建属性规则 ”开始定义此规则的条件。

  5. 在“选择属性 ”下,选择您要为其定义规则的属性。

  6. 在实体的“定义包含 ”部分,为该类型的实体定义此属性应被包含还是排除。

  7. “设置最大值数量”下,选择可选中并包含在实体中的最大值数量。 此设置仅适用于可能包含多个值的属性,例如列表。

    配置规则以使用每个成员记录中的单个值、所有值或自定义数量的值,用于为实体组合此属性。

  8. 在“定义条件 ”下,选择一个筛选条件(可选)和最多三个排序条件,系统将在为实体视图选择值时使用这些条件。 您必须至少选择一个排序条件。

  9. 在“筛选条件”(可选) 下,如果您选择定义筛选条件,可以根据来源偏好、允许的值或不允许的值进行筛选。 选择并定义筛选条件:

    过滤器条件
    过滤器类型 详细信息
    源首选项 使用源偏好设置过滤器来选择特定的记录源。 该规则在生成此属性时,仅考虑来自所选数据源的记录。 要定义源偏好过滤器:
    1. 选择 “来源”偏好设置作为筛选条件。
    2. 点击 “+”按钮 ,从您的数据中选择一个或多个您认为是可信来源的记录来源。
    3. 可选:单击 “新建数据源 ”,输入尚未添加到主数据中的自定义记录源的名称。 如果添加自定义数据源,其名称必须与未来数据资产中定义的记录源名称完全一致。
    4. 单击添加
    允许的值 使用“允许的值”筛选器来定义某些允许的字段值。 当您指定允许的值时,系统只会考虑包含指定字段值的记录。 要定义一个允许值过滤器:
    1. 选择 “允许的值 ”作为筛选条件。
    2. 单击 “配置字段-值对”
    3. 点击 “添加条件 ”。
    4. 请指定您要允许的字段和值。 根据需要添加任意数量的允许值条件。
    5. 单击添加
    不允许的值 使用“不允许的值”筛选器来定义某些不允许的字段值。 当您指定了不允许的值时,系统会忽略具有指定字段值的记录。 要定义一个禁止值过滤器:
    1. 选择 “不允许的值 ”作为筛选条件。
    2. 单击 “配置字段-值对”
    3. 点击 “添加条件 ”。
    4. 请指定您希望禁止的字段和值。 根据需要添加任意数量的“不允许的值”条件。
    5. 单击添加
  10. “排序条件 ”下,请定义至少一个排序条件。 点击 “添加排序选项 ”以创建排序条件。 您可以按出现频率最高、最近更新时间、来源偏好、字段值优先级或字段值比较进行排序。

    排序条件
    排序类型 详细信息
    上次更新日期 按记录最近一次更新的时间排序。
    最频繁 按该值在各记录中出现的频率进行排序。
    源首选项 按首选来源排序。
    1. 选择 “源”偏好设置
    2. 单击 “添加” 以从您的数据中选择您认为可信的记录来源。
    3. 如果您还设置了筛选条件,某些源可能无法选择,且无法定义新源。
    4. 在 “源”偏好设置面板中拖放源,以按优先级排序。
    5. 单击添加
    字段值优先级 根据指定的字段值偏好进行排序。
    1. 选择字段值优先级
    2. 定义字段。
    3. 按首选顺序定义一组值。
    4. 要定义其他字段和值,请单击 “设置字段值优先级”, 然后根据需要添加任意数量的条件。
    5. 单击添加
    字段值比较 根据数值特征的比较进行排序。
    1. 选择 “字段值比较 ”。
    2. 选择要排序的字段。
    3. 根据以下比较函数对值进行排序:
    longest - 选择最长的值。
    shortest - 选择最短的值。
    earliest - 选择最早的值。
    latest - 选择最晚的值。
    minimum - 选择最小值。
    maximum - 选择最大值。
    4. 要定义其他字段和值,请单击 “设置字段值比较”, 然后根据需要添加任意数量的条件。
    5. 单击添加
  11. 点击 “添加排序选项 ”以添加所需数量的排序条件。

  12. 在“按条件排序 ”下,可选地定义基于字段值和复杂逻辑的排序规则。 您可以定义一个或多个条件来比较字段值,然后根据比较结果动态应用不同的排序方式。 要定义一条条件逻辑规则:

    1. 单击添加条件
    2. 定义触发条件逻辑的字段值比较。 这是“if”语句。
    3. 定义在满足条件时用于排序的优先级顺序。 这是“then”语句。
    4. 要添加另一条规则,请点击 “添加条件 ”。 您可以根据需要添加任意数量的条件。

    IBM Master Data Management 按顺序处理条件规则。

  13. 在“选择字段 ”下,选择该属性中哪些字段将通过此属性组合规则进行筛选。 默认情况下,所有字段均被选中。

  14. “判定条件 ”区域,请核对规则摘要以确保其符合您的预期。 如果是这样,请点击保存

要编辑规则:

  1. 将鼠标悬停在属性组合规则列表中的行上。
  2. 点击编辑规则图标 编辑规则图标
  3. 根据需要更改条件,然后点击保存

删除属性作用域规则

您只能删除属性作用域规则。 已删除的规则将被永久移除,无法恢复。

要删除规则:

  1. “主数据 ”导航菜单中,单击 “数据类型 ”图标 数据类型图标,然后单击 “实体类型与匹配 ”。 选择您要操作的实体类型。
  2. 在实体类型页面中,转到 “匹配设置 ”选项卡,然后选择 “属性组合”
  3. 在属性组合规则列表中,选择要删除的规则。
  4. 点击 “删除 删除规则图标 ”,然后确认您的操作。

后续步骤

了解更多信息