重要说明:

IBM Cloud Pak® for Data 4.7 版本将于 2025 年 7 月 31 日结束支持(EOS)。 欲了解更多信息,请参阅 IBM Cloud Pak for Data 版本 4.X 的停止服务公告

在 IBM Cloud Pak for Data 4.7 版本支持结束之前,升级到 IBM Software Hub 5.1 版本。 更多信息,请参阅 IBM Software Hub 版本 5.1 文档中的升级 IBM Software Hub。

数据监管教程: 配置 360 度视图

使用本教程来配置客户的 360 度视图,并使用数据光纤网试用的数据监管用例来探索这些客户。 本教程的目标是将客户数据与信用评分数据相结合,以解析数据中的实体,创建客户的整合 360 视图,以及确定要在营销活动中成为目标的最高价值客户,并确定提供这些客户的最佳费率。

以下动画图像提供了到本教程结束时将完成的内容的快速预览。 您将设置资产并将其添加到主数据,映射数据资产属性,发布数据模型并运行匹配,将匹配的数据发布到目录,然后浏览并可视化匹配的数据。 右键单击该图像,并在新选项卡中打开该图像以查看更大的图像。

教程的截屏

金银希望开展一项活动,提供更低的抵押贷款利率。 作为数据工程师,您必须使用 IBM Match 360 为客户的 360 度视图设置,映射和建模数据。

技术预览 这是技术预览,尚不支持用于生产环境。

在本教程中,您可以完成以下任务:

如果您需要本教程的帮助,请在 Cloud Pak for Data 社区讨论区提问或寻找答案。

提示: 为了获得完成本教程的最佳体验,请在一个浏览器窗口中打开 Cloud Pak for Data ,并在另一个浏览器窗口中保持本教程页面处于打开状态,以便在两个应用程序之间轻松切换。 请考虑将两个浏览器窗口并排排列,以便更轻松地进行后续操作。

并排教程和 UI

预览教程

观看视频 观看本视频,预览本教程的步骤。 视频中显示的用户界面可能存在细微差异。 该视频旨在与编写的教程相伴。

此视频提供了一种可视方法来学习本文档中的概念和任务。

先决条件

完成本教程需要以下先决条件。

访问类型 描述 文档
服务 IBM Match 360 with Watson IBM Match 360
Match 360 访问权 数据工程师角色 向用户授予 IBM Match 360 with Watson 访问权
角色和许可权 -数据工程师角色
-"访问目录" 许可权
- 管理角色
- 预定义的角色和权限
其他访问权 缺省目录的编辑者访问权 (可选) 添加合作者
其他配置 禁用 强制独占使用私钥 要求用户使用保密证书

执行以下步骤以验证您的角色和许可权。 如果您的 Cloud Pak for Data 帐户未满足所有先决条件,请与管理员联系。

  1. 单击工具栏中的概要文件图像。

  2. 单击 概要文件和设置

  3. 选择 角色 选项卡。

与您的角色关联的许可权列示在启用的许可权列中。 如果您是任何用户组的成员,那么您将继承分配给该组的角色。 这些角色也会显示在 "角色" 选项卡上,并在 "用户组" 列中指定从中继承角色的组。 如果 " 用户组 "栏显示破折号,则表示该角色直接分配给了你。
角色和许可权

创建样本项目

遵循以下步骤为本教程创建样本项目:

  1. 下载 Data-Governance.zip 文件。

  2. 从 Cloud Pak for Data 导航菜单 导航菜单 ,选择项目 > 所有项目

  3. 项目页面上,单击新建项目

  4. 选择 从文件创建项目

  5. 上载先前下载的 ZIP 文件。

  6. 在 " 创建项目 " 页面上,输入项目名称, Data governance和项目的可选描述。

  7. 单击创建

  8. 单击 查看新项目 以验证是否已成功创建项目和资产。

  9. 单击 资产 选项卡以验证是否已成功创建项目和资产。

检查点图标 检查您的进度

下图显示了样本项目。 现在,您已准备好开始本教程。

样本项目

提示: 如果在 Cloud Pak for Data 用户界面中完成本教程时迂到引导式教程,请关闭窗口。

任务 1: 创建目录

您需要主数据的目录以及对匹配数据的访问权。 您可以使用现有目录,并验证您是否是要使用的目录的编辑者。

选项 1: 使用缺省目录

执行以下步骤以验证您是否具有使用缺省目录的相应访问权:

  1. 从 Cloud Pak for Data 导航菜单 导航菜单 ,选择目录 > 所有目录

  2. 打开要用于本教程的目录。

  3. 单击 访问控制 选项卡。

  4. 验证您的帐户是否具有 编辑者 角色。 如果您的访问权是 查看者,请与管理员联系以请求 编辑者 访问权。

选项 2: 创建新目录

否则,如果您具有相应的角色和许可权来创建目录,那么可以执行以下步骤来创建数据监管目录。

  1. 在 " 目录 " 页面上,单击 创建目录

  2. 对于 名称,复制并粘贴目录名称,如下所示,没有前导或尾部空格:

    Data governance Catalog
    
  3. 选择 强制实施数据保护规则,确认选择并接受其他字段的缺省值。

  4. 单击 创建 以使用缺省设置。 新目录随即打开。

检查点图标 检查您的进度

下图显示了您的目录。 现在有了目录,您可以设置主数据并添加数据资产。

目录

任务 2: 设置资产并将其添加到主数据

您必须将要合并的所有数据资产添加到主数据。 数据源可以来自包含计算机硬盘的源,也可以来自项目或目录的数据资产。

  1. 从 Cloud Pak for Data 导航菜单 导航菜单 ,选择数据 > 主数据

    提示: 如果在 Cloud Pak for Data 用户界面中完成本教程时迂到引导式教程,请关闭窗口。
  2. 如果需要设置主数据,请单击 设置主数据 ,然后执行将所需项目和服务与主数据相关联的步骤。 否则,请单击 转至配置 并继续执行下一步。

    1. 选择 数据监管 项目,然后单击 下一步

    2. 选择名为 数据监管目录的现有目录,然后单击 完成

    3. 单击 继续配置 以完成设置。

  3. 单击 添加数据资产

  4. 单击 添加数据

  5. 在项目中插入所有三个数据资产:

    1. 如果 " 数据资产 "窗格隐藏,单击 " 上传资产到项目 "图标 将资产上载到项目 打开该窗格。

    2. 选择 项目 选项卡。

    3. 将鼠标悬停在项目中的每个文件上,然后单击插入图标 插入 of Campaign Prospects.csvCustomers.csvExperiancc.csv.

  6. 将 "个人" 记录类型分配给数据资产。 "记录类型" 提供有关资产包含的数据类型的信息。 每个资产都需要具有分配的记录类型,以便 IBM Match 360 可以找到最适合数据的模型部分。

    1. 选中 Campaign Prospects.csvCustomers.csvExperiancc.csv 资产的复选框,然后单击 设置资产属性

    2. 对于每个资产,单击 选择数据资产类型 下拉菜单,然后选择 人员 数据资产类型。

    3. 单击保存

检查点图标 检查您的进度

下图显示了添加到主数据的资产。 现在,您已设置主数据并添加了三个数据资产,您已准备好开始映射数据资产属性。

已添加到主数据的资产

任务 3: 映射数据资产属性

要使 IBM Match 360 以匹配所有数据,必须指定将每个数据集的哪些列映射到 IBM Match 360所理解的特定属性。 执行以下步骤以映射数据资产属性。

  1. 单击 映射 选项卡以开始将数据资产的列映射到相应的属性。

  2. 在 " 资产列表 " 面板中,选择 Campaign Prospects.csv

  3. 如果需要对数据进行概要分析,请单击 概要分析 ,在出现提示时,单击 开始概要分析。 对数据进行概要分析是将数据的列自动映射到 IBM Match 360 数据模型的属性的先决条件。 概要分析需要 2-5 分钟。 完成对数据进行概要分析时,将显示一条消息,指示 概要分析已完成

  4. 完成概要分析后,您可以通过在提示中单击 是,自动映射 或从资产的映射菜单中单击 自动映射 来自动映射数据的列。

  5. 请参阅 表 1: 营销活动 Prospects.csv 映射 ,以根据 表 1: 营销活动 Prospects.csv 映射手动映射状态为 未映射 或未正确映射的所有列。 要将列映射到属性,您可以遵循以下示例: 映射现有属性。 要排除列,您可以遵循以下示例: 从映射中排除列

  6. 确保资产中的所有列的状态为 已映射已自动已排除,然后单击 映射并保存到数据模型。 否则,重复 任务 3 步骤 5

  7. 针对 Customers.csv 和 Experiancc.csv 资产重复 任务 3 。 使用相应的表将 Customers.csv 和 Experiancc.csv 资产的列映射到 IBM Match 360 数据模型,如 表 2 中所建议: Customers.csv 建议映射表 3: Experiancc.csv 建议映射。 请参阅说明如何手动映射各个属性的示例。 您可以 将列映射到现有属性 ,也可以从映射中排除列。

示例 1: 映射现有属性

此示例说明如何将 Campaign Prospects.csv 数据资产中的 列映射到现有属性 记录源。 IBM Match 360 提供了一些通常与客户记录相关联的属性,您可以选择将数据集中的列映射到这些客户记录。

  1. 单击列 legal_name.full_name

  2. 从 " 映射目标 " 面板中,在搜索字段中输入 Legal name - Full name

  3. 单击 映射并保存到数据模型 以将列映射到属性。 该列显示为 MappedMapped to: Legal name-Full name

您可以重复这些步骤以将数据资产的其他列映射到先前由 IBM Match 360创建或提供的现有属性。

示例 2: 从映射中排除列

此示例说明如何从数据资产映射中排除列。 如果列在匹配过程中对 IBM Match 360 无用,或者您不希望在匹配的数据输出中包含这些列,那么可以从映射中排除这些列。

  1. 单击名为 的列。

  2. 单击复选框 从映射中排除此列

  3. 单击 映射并保存数据模型 以将列映射到属性。 该列显示为 已排除

您可以重复这些步骤以排除数据资产的其他列。

表 1. Campaign Prospects.csv 建议映射

目标 方法
从映射中排除此列 从映射中排除列
标识 从映射中排除此列 从映射中排除列
birth_date.value 出生日期 映射现有属性
gender.value 性别 映射现有属性
legal_name.full_name Legal Name - Full name 映射现有属性
mobile_telephone.phone_number Mobile telephone - Phone number 映射现有属性
personal_email.email_id Personal email - Email address 映射现有属性
商机质量 从映射中排除此列 从映射中排除列

表 2. Customers.csv 建议的映射

目标 方法
客户号 从映射中排除此列 从映射中排除列
NAME Legal Name - Full name 映射现有属性
国家或地区 从映射中排除此列 从映射中排除列
街道地址 Primary residence - Address line 1 映射现有属性
城市 Primary residence - City 映射现有属性
状态 Primary residence - State/Province value 映射现有属性
ZIP_CODE Primary residence - Postal code 映射现有属性
EMAIL_ADDRESS Personal email - Email address 映射现有属性
PHONE_NUMBER Home telephone - Phone number 映射现有属性
GENDER 性别 映射现有属性
CREDITCARD_NUMBER 从映射中排除此列 从映射中排除列

表 3。 Experiancc.csv 建议映射

目标 方法
从映射中排除此列 从映射中排除列
体验标识 从映射中排除此列 从映射中排除此列
birth_date.value 出生日期 映射现有属性
gender.value 性别 映射现有属性
home_telephone.phone_number Home telephone - Phone number 映射现有属性
legal_name.given_name Legal name - Given name 映射现有属性
legal_name.last_name Legal name - Last name 映射现有属性
mobile_telephone.phone_number Mobile telephone - Phone number 映射现有属性
personal_email.email_id Personal email - Email address 映射现有属性
primary_residence.address_line1 Primary residence - Address line 1 映射现有属性
primary_residence.address_line2 主要住所-地址行 2 映射现有属性
primary_residence.city Primary residence - City 映射现有属性
primary_residence.province_state 从映射中排除此列 从映射中排除列
primary_residence.zip_postal_code Primary residence - Postal code 映射现有属性
信用分数 从映射中排除此列 从映射中排除列
CREDITCARD_NUMBER 从映射中排除此列 从映射中排除列

检查点图标 检查您的进度

下图显示了所有映射的数据资产。 现在,您已映射所有三个数据资产的属性,可以发布数据模型并运行匹配。

映射了所有资产的主数据

任务 4: 发布数据模型并运行匹配

将数据资产中的所有列映射到属性之后,将创建数据模型。 IBM Match 360 使用已发布的数据模型来解析来自所有数据源的单个实体。 执行以下步骤以发布数据模型。

  1. 绘制完最后一个数据集的最后一列后,可以单击显示窗口中的 " 发布模型 "或 " 发布模型 " 图标 发布模型。 完成映射三个数据资产中的所有列之后,将显示此选项。 发布模型最多需要 1 分钟。 成功发布数据模型时,您将收到通知。

  2. 单击发布所有数据图标 发布所有数据 ,然后单击发布数据 ,根据映射将映射的数据资产加载到 IBM Match 360 数据模型中。 资产状态从 发布数据 更改为 准备匹配。 数据需要 5-10 分钟才能装入到服务中。

检查点图标 检查您的进度

下图显示了列示为已装入到服务中的数据资产,指示已成功发布数据模型。 接下来,您可以运行匹配。

已发布的数据模型

完成匹配设置并运行匹配

IBM Match 360 使用已发布的数据模型将数据源的所有记录整合到单个实体中,以创建具有更完整记录的数据资产。 执行以下步骤以运行匹配:

  1. 单击 数据设置 下拉列表,然后从菜单中选择 匹配设置

  2. 单击 匹配设置 选项卡,然后选择 属性选择 页面。 对于本教程,您可以接受已选择的缺省属性。 在这里,您可以选择有助于区分记录的属性,例如出生日期,电子邮件地址或电话号码,以帮助匹配算法。

  3. 选择 匹配结果 选项卡,然后单击 运行匹配。 当匹配过程完成并显示匹配结果时,您将收到通知。

检查点图标 检查您的进度

下图显示了运行匹配后的结果。 现在,您已发布数据模型并运行匹配,您已准备好将匹配的数据发布到目录。

匹配结果

任务 5: 将匹配的数据发布到目录

为 IBM Match 360 创建连接资产

要访问项目中的匹配数据,需要创建与 IBM Match 360的连接资产。 IBM Match 360 连接资产将与 IBM Match 360 服务匹配的数据连接到已连接的数据资产。 执行以下步骤以创建连接资产。

  1. 从 Cloud Pak for Data 导航菜单 导航菜单 ,选择项目 > 所有项目

  2. 选择 数据监管 样本项目。

  3. 单击 资产 选项卡,然后单击 新建资产> 连接

  4. 找到并选择 IBM Match 360 连接器。

  5. 单击 选择 以添加 IBM Match 360 服务实例的连接。

  6. 输入连接资产名称 Match 360 Connection

  7. 路由主机 字段中粘贴 Cloud Pak for Data 主机名。

  8. 找到 IBM Match 360 实例标识。 打开 Cloud Pak for Data 新的浏览器选项卡。 从 Cloud Pak for Data 导航菜单 导航菜单 ,选择服务 > 实例

    1. 单击 Match 360 服务实例名称。

    2. 在浏览器 URL 中,复制 "mdm-"后面的文字。

    3. 返回到 " 创建连接 " 页面,并将文本粘贴到 IBM Match 360 实例标识 字段中。

  9. 返回到 Match 360 服务实例页面以完成 API 密钥 字段。

    1. 单击 实例 API 密钥> 生成 API 密钥

    2. 单击 生成

    3. 单击 复制

    4. 单击 取消 以返回到 Match 360 服务实例页面。

    5. 返回到 " 创建连接 " 页面,并将文本粘贴到 API 密钥 字段中。

  10. 用户名 字段中粘贴 Cloud Pak for Data 用户名。

  11. 单击创建

  12. 如果要求您确认要在不设置位置和主权的情况下创建连接,请单击 创建

检查点图标 检查您的进度

下图显示了 Match 360 连接资产。 现在,您可以从此连接创建已连接的数据资产。

连接资产 (connection asset)

导入已连接的数据资产

现在,使用 IBM Match 360 连接从 IBM Match 360创建合并数据的新连接数据资产。 执行以下步骤以创建已连接的数据资产。

  1. 单击 导入资产

  2. 在 " 导入资产 " 页面上,选择 已连接的数据

  3. 选择 Match 360 连接> person> person_entity

  4. 单击导入

检查点图标 检查您的进度

下图显示了已连接的数据资产。 现在,您为已合并的匹配数据创建了已连接的数据资产,可以将该资产发布到目录。

已连接的数据资产

将已连接的数据资产发布到目录

执行以下步骤以将合并的匹配数据发布到该目录。

  1. 在数据监管项目中,验证您是否在 资产 选项卡上。

  2. 点击溢出菜单 打开和关闭选项列表 为您的连接数据资产人员实体 ,然后选择发布到目录

  3. 从列表中选择要使用的目录。

  4. 单击 发布 以使用缺省值并将已连接的数据资产发布到目录。

  5. 在目录中查看和更新资产。

    1. 从 Cloud Pak for Data 导航菜单 导航菜单 ,选择目录 > 所有目录

    2. 单击将已连接的数据资产发布到的目录。

    3. 在目录中,单击 person_entity 连接的数据资产。

    4. 单击 编辑名称 图标,然后输入已连接数据资产的名称 Golden Bank 360 View

    5. 单击资产选项卡以预览数据。

检查点图标 检查您的进度

下图显示了目录中的数据资产。

目录中的资产

作为 Golden Bank 的数据工程师,您成功使用 IBM Match 360 为客户的 360 度视图设置,映射和建模数据。 然后,您将匹配数据的完整 360 度视图发布到目录中,以供组织中的其他人访问。

任务 6: 预览匹配的数据

现在,您已将模型或数据更改发布到 IBM Match 360,设置匹配的参数并运行匹配,您可以使用主数据资源管理器来查询匹配的数据。 主数据资源管理器支持您查找,查看,比较和编辑匹配结果。 现在,作为 Golden Bank 的数据分析人员,您必须分析,探索和验证 IBM Match 360 结果,以确定并选择最符合条件的客户来确定营销活动商品的目标。 遵循以下步骤来浏览和调整匹配的数据。

  1. 从 Cloud Pak for Data 导航菜单 导航菜单 ,选择数据 > 主数据

  2. 单击搜索主数据

  3. 在搜索栏中,输入 Branden Banks,然后按 Enter 键以添加 Branden Banks 作为搜索条件。 对于此搜索查询,将显示 Branden Banks 的 2 实体。 第一列中的数字 2 指示构成此实体的两个源记录和第一列中的数字 1 表示一个源记录构成另一个实体。

  4. 单击箭头图标以展开这两个实体。 你可以看到,布兰登银行的这些单独实体很可能只有一个人。 要将这些实体连接到单个实体中,可以调整匹配算法。

检查点图标 检查您的进度

下图显示了主数据资源管理器中的搜索结果。 接下来,您可以调整匹配算法并再次运行匹配。

浏览主数据

任务 7: 调整匹配算法并运行匹配

在探索匹配的数据后,有时需要对匹配算法进行微调,再运行匹配,以获得更好的结果。

  1. 单击 主数据资源管理器 下拉列表,然后从菜单中选择 匹配设置

  2. 单击 匹配设置 选项卡,然后选择 算法调整 页面。

  3. 单击 Autolink 阈值 并在文本字段中输入 20 。 将阈值降低到 20 会导致源中记录之间的总体匹配程度更高。

  4. 单击 应用阈值> 下一步> 运行匹配 以运行与已调整算法的匹配。

  5. 单击 匹配结果 选项卡。 匹配完成时将显示结果。

检查点图标 检查您的进度

下图显示了匹配设置的结果。 接下来,您可以再次查看匹配的数据,以了解微调如何更改结果。

"匹配设置" 选项卡

任务 8: 获取有关匹配结果的洞察

您可以返回到主数据资源管理器,以查看算法调整如何更改匹配结果。

  1. 单击 匹配设置 下拉菜单,然后从菜单中选择 主数据资源管理器

  2. 在搜索栏中,输入 Branden Banks,然后按 Enter 键以添加 Branden Banks 作为搜索条件。 与所显示的实体关联的数字 3 表示在实体 Branden Banks 拆分之前,有三个记录组成该实体。

  3. 展开实体第一列中的行以查看记录。 您可以看到与此实体匹配的三个记录。

检查点图标 检查您的进度

下图显示了主数据资源管理器中的搜索结果。 接下来,您可以通过可视化匹配结果来获取洞察。

浏览主数据

任务 9: 将实体的记录可视化

您还可以将调整后的匹配结果可视化为节点,以获取洞察。

  1. 单击 显示图形 以查看哪些记录正在向查询的实体添加内容。

  2. 单击连接到人员实体的任何节点以查看与其关联的详细信息。 从此处,您可以直观显示并手动修改与查询中的每个实体相关联的记录,以根据需要进行更正。

检查点图标 检查您的进度

下图以图形形式显示了搜索结果。

浏览图

作为数据分析人员,您对 IBM Match 360 结果进行了分析,探索和验证,以确定并选择市场营销活动商品的最佳合格客户。

清除(可选)

如果要重新学习 "数据监管" 用例中的教程,请删除以下工件。

工件 如何删除
数据监管目录 删除目录
数据监管样本项目 删除项目

后续步骤

了解更多

父主题: 数据光纤网教程