内容


在 InfoSphere Information Governance Catalog 中建立信息治理策略框架

使用策略和规则

Comments

开始之前

学习如何应用 Information Governance Catalog (IGC) 的预先构建的策略和规则内容来开展信息治理举措。

数据的数量、增长速度和种类正在大幅增加,各种需求也随之而来,这些需求包括:治理和管理该数据的风险、质量和成本,以及为数据的使用提供更高的信心。这就是信息治理领域,也是 InfoSphere Information Server 重点关注的一个领域。这是一个庞大的主题,有关信息治理实践和解决方案的更多细节可以在参考资料部分中找到。

IGC 为受治理的信息提供了一个很有意义的目录。它通过一个元数据存储库来支持此目录,该存储库包含受治理的业务词汇表(一个业务术语表)、语义策略和治理规则、信息领域的管理工作分配、一个信息资产目录、跨词汇表和资产的关系和链接,以及众多帮助理解这些关系的工具,包括影响分析、业务和数据沿袭分析,以及一些查询和报告。

通过利用这些功能,组织能够:

  • 支持信息治理
    • 语义策略和规则促进了治理需求的准确传达。
    • 通用的语言简化了针对业务需求的信息开发。
    • 信息供应链所有层级的管理工作。
    • 端到端的数据沿袭(data lineage)分析和影响分析。
  • 为事后和事前责任提供支持
    • 分配管理人员作为单一联系点。
    • 通过业务元数据与技术元数据之间的关系来确保合规性。
  • 提高信息可访问性
    • 管理员可以针对业务用户的需要来调整工具。
    • 在您需要时访问所需的企业信息。
    • 基于一个通用的语义中心来使用和重用信息资产。
  • 促进协作
    • 捕获注解并在团队成员之间共享这些注解。
    • 对上下文信息的更准确理解。
    • 受信任信息的更广泛的使用和重用。

组织在新的信息治理举措中发现的一大挑战是,为举措的开展建立一种基础和结构,具体地讲,包含足够的组件来理解目录的各个部分如何融合在一起,并被利用来支持其治理举措。

目标

在本教程中,我们将学习如何安装预先构建的 IGC 词汇、策略和治理规则包,以便快速开展信息治理工作。我们还将展示有哪些可用的内容,如何安装该内容供立即使用,以及如何深入剖析该内容的使用情况。

总体上讲,此内容包的目的是提供有关信息治理上下文中的业务信息利用情况的洞察,具体地讲,是为了:

  • 提供基础内容来方便开展工作:
    • 包含相关资产的工作模型。
    • 涵盖各个信息治理组件的工作模型。
    • 一个用于构造和扩展信息治理的框架。
    • 用于在您团队成员中开展教育的示例。
  • 输入和创建策略和规则的推荐方法。
  • 使用策略树和引用的规则,包括浏览和搜索。
  • 合并命名标准与需要或想要的属性。

请注意,该内容包的目的不是用作一个完整的端到端解决方案,无法反映信息治理的所有可能需求。

先决条件

本教程是为正在学习或熟悉 InfoSphere Information Governance Catalog 及其使用的 InfoSphere Information Server V11.3 用户编写的。

系统要求

要利用预先构建的内容,需要一个安装了 Information Governance Catalog 的 InfoSphere Information Server V11.3 平台。在导入预先构建的内容之前,还应该安装 IBM Fix Central 上提供的以下 IGC 补丁版本:is113_IGC_ru5_server_client_multi。

概述

IGC 是一个基于浏览器的交互式工具,支持用户创建、管理和共享一个企业词汇表和分类系统,一个用于理解和管理信息治理策略和需求及数据管理的框架,一个元数据资产(比如包含关键业务数据的数据库表)的存储库,以及一项用于报告目录内的关系的查询功能。

业务术语表旨在帮助用户理解业务语言和信息资产的业务意义,比如数据库、作业、数据库表和列,以及商业智能报告。除了类别和术语之外,该目录还包含其他资产的信息,比如数据库表、作业和元数据存储库中的报告。

信息治理策略和规则的目录,提供了一个交互式环境来传达如何管理信息的完整生命周期的准确意图。这些策略可能表示政府法规、企业标准或广泛层面上的业务线流程。治理规则提供了详细信息来描述具体的需求、治理的术语或资产,以及实现这些需求的资产。

支撑信息治理功能的是元数据资产。这些资产包括所提到的术语表术语、治理策略和规则、包含表和列的数据库表示、逻辑和物理数据模型、应用程序、商业智能报告、数据集成 (ETL) 作业,以及其他许多资产。跨数据源和资产的影响分析和端到端数据沿袭分析,使目录的用户能够理解业务语言与技术实现之间的关系,这是信息治理的一个关键部分。

此包中的材料包括:

  • 一个示例术语表,用于方便理解信息治理概念。
  • 一个信息治理策略结构,包含关联的策略和治理规则。
  • 一组元数据查询,用于检查内容及其关系,允许您定义信息治理策略开发和管理方法。

为 IGC 基础内容包提供的术语表衍生自 IBM 提供的更大的行业独有模型,但它仅关注人员、位置和客户信息的具体主题区域的有限子集。此内容的后续版本可能会在这些维度上进行扩展。

本教程将介绍导入信息治理内容的一些步骤,这些内容的潜在用法将在包含的 PDF 文档中详细介绍(参见 下载 部分)。

IGC 包内容

IGC Base Content 包中包含一个名为 IGC_OOTB_v1.zip 的压缩 (.zip) 文件,该文件包含一系列有关联的资产,包括:

  • POLICIES — 一个组织信息治理策略的策略框架,以及跨 3 个重点领域的治理策略和规则示例:主数据管理主题、数据隐私和信息质量。
  • SUBJECT CONTENT — 一组类别和术语,包含与人员、位置和客户相关的术语,以及与信息治理相关的术语。
  • RELATIONSHIPS — 贯穿上述工件的关系,包括策略到规则,规则到术语和资产的关系。
  • QUERIES — 一组查询,允许您查看工件之间的一些关系和连接。

这些内容被存储为 XML 文件,拥有 IGC 管理员特权的人可以通过 UI 的 Administration 选项卡将它们导入到 IGC 中。这些文件包括:

  • IGC-governance-base-xml-export-terms-2014-09-23.xml
  • IGC-governance-base-xml-export-rulesassets-2014-09-23.xml

导入 IGC 内容

IGC 内容是使用其导入功能来导入的。要导入业务术语表内容,必须拥有 IGC 管理员特权。有关如何将内容导入目录中的更多示例,请参阅 导入和导出目录的术语表内容

后续导入步骤假设您已下载、提取 XML 文件内容并将它保存到 IGC 浏览器可以访问的地方。

要执行 IGC 术语内容的导入:

  1. 打开 IGC 并选择 Administrator 选项卡。
  2. 选择 Tools > Import
  3. 选择 XML 作为要导入的文件类型并单击 Next,如下所示。
  4. 选择 Merge 选项(如果存在其他术语表内容,推荐选择 Ignore 选项以避免覆盖其他人的工作),然后单击 Next
  5. 找到 IGC-governance-base-xml-export-terms-2014-09-23.xml 文件的目录位置并单击 Import
  6. 检查导入摘要,如图 2 所示。应该有 37 个类别和 195 个术语。
  7. 单击 Close
图 1. XML 文件选择
该图显示了导入目录的 XML 文件的界面
该图显示了导入目录的 XML 文件的界面
图 2. 术语导入摘要
该图显示了术语的术语表导入摘要
该图显示了术语的术语表导入摘要

要执行 IGC 策略和规则内容的导入:

  1. 对 IGC-governance-base-xml-export-rulesassets-2014-09-23.xml 文件重复该过程并单击 Import
  2. 检查导入摘要,如下所示。应该有 72 条策略、110 条治理规则和对 62 个术语的更新。
  3. 单击 Close
图 3. 策略导入摘要
该图显示了策略和规则导入摘要
该图显示了策略和规则导入摘要

检查导入的 IGC 内容

在完成导入之后,可以浏览术语表并检查示例内容。

检查类别和术语

Catalog 选项卡,选择 Glossary 选项卡,然后选择 Browse Category Hierarchy。根据您的环境,您的术语表可能包含其他内容,但您应该会找到两个类别:一个叫做 Business Information,另一个叫做 Information Governance。

  • Business Information — 此类别主要包含针对人员、位置和充当客户的人的一般交易的术语,还提供了术语表中的术语关系的示例洞察。
  • Information Governance — 此类别主要包含与信息治理相关的类别和术语,提供有用的信息治理概念的洞察,特别是对辨别关键的治理重点区域至关重要的信息分类。

举例而言,Business Information 类别包含日历、客户、位置、组织、支付卡、人员和交易的示例内容。

图 4. Business Information 类别
该图显示了示例术语表类别内容
该图显示了示例术语表类别内容

展开一个类别的视图,比如位置信息,然后选择一个子类别,比如物理地址。这将突出显示该类别的概述并列出关联的词汇。然后,可以选择一个关联的术语,比如 Street Address,检查所提供的描述和一般信息,如下所示。

图 5. 业务信息术语
该图显示了业务信息术语
该图显示了业务信息术语

业务信息术语提供了术语表中存在的关系类型的示例。关系有助于进一步理解给定术语,比如它是否拥有或包含其他术语;是一个特定类型的术语;或者仅属于一个通用的术语类别。例如,术语 Street Address 演示了其中一些关系:

  • Street Address 是类别 Physical Address 中的一个术语,该类别进而是类别 Location Information 的一部分。类别是相关术语的一种自然的组织结构。
  • Street Address 由两个治理规则来管理(比如,地址必须针对邮局参考来源进行验证和确认)。它是一种双向关系,如果在一个位置设置了它(无论是在术语还是治理规则中),那么它会显示在两个位置中。
  • Street Address 的类型为 Address。这是 has types 关系的反向关系并设置为双向。术语 Address 在此内容集中有两种类型:Street Address 和 Box Address。Address 提供了一个更大的术语,而 Street Address 和 Box Address 为这些互不相同的术语提供了更具体的表示形式。
  • Street Address 还使用 has a 关系。has a 描述一个更大的术语中包含的组件。在本例中,Street Address 拥有一个 City、State、Postal Code 和 Country(以及其他一些组件)。此关系的反方向是 is of 关系。

您可以继续检查其他术语。最初,术语未链接到任何有关联的资产,但随着元数据存储库中提供了这些内容,可以将术语连接或分配到资产,以更全面理解哪些数据与关键业务概念有关联。

检查治理策略和规则

Catalog 选项卡中,选择 Glossary 选项卡,然后选择 Browse Policy Hierarchy。根据您的环境,您的术语表可能包含其他内容,但您应找到 5 个高级策略,如下所示。

图 6. 治理策略分层结构
该图显示了治理策略分层结构
该图显示了治理策略分层结构

策略树中的这些顶级策略,与为一个信息治理计划列出的策略的主要分组保持一致:

  • 信息治理方法
    • 信息治理计划采用的标准,用于提高一致性,减少差异和删除不必要的处理。举例而言,这些方法可能包括用于管理 Information Governance Catalog 或监视术语或资产的数据管理人员分配的实践和流程。
  • 信息治理委托
    • 委托给另一个治理领域(比如审计或风险管理治理领域)的核心策略集。例如,可以将对欺诈报告的验证视为信息治理的一部分,但在您组织中,这可能是欺诈和风险管理部门的职责,所以这些策略被视为委托给该区域。
  • 信息治理领域策略
    • 涵盖业务的基本信息领域(比如客户、员工和产品)的核心策略集。这些信息治理策略可能主要属于某个特定的业务线,但因为它们贯穿业务中的多个点,所以它们被视为必须包含在信息治理计划中的核心信息领域。
  • 信息治理职责
    • 从其他治理重点区域和领域委托给信息治理组织的核心策略集,包括:
      • 企业需求 — 在一个组织内的一个或多个小组之间定义的职责(例如,销售和 IT 或数据存储的安全执行)。
      • 治理法规 — 一个国家实体或它的部门和机构为一个组织规定的法律和要求。
      • 行业标准 — 规范化的标准,通常来自标准机构,它们提供了特定主题的最佳实践,但不是强制性的指南。
      • 服务水平协议 — 满足指定的服务水平(例如在晚上 10 点前交付数据)的职责。
      • 第三方合同 — 一个组织与其他第三方之间的合同职责。
  • 信息治理原则
    • 原则定义信息治理计划的高级目标和方法。这些原则是您的信息治理工作的整体目标和方向,组织内的所有人都应理解。一些原则可能整合了特定的策略和规则,而其他原则没有。

您可以更详细地检查所提供的策略树和策略。使用治理策略来总结某个特定的组织职责和组织目标,无论是在外部还是内部。策略应包含一个短的可识别名称、对其意图的简短描述、公开前的详细描述和公开前的数据管理安排,以及一个自定义属性,比如所包含的 “Link to more information”(提供实际策略的 URL 链接供参考)(许多策略太长,因而无法完整地包含在目录中)。您可能会发现,添加一个标签来关联相关的或过渡性的链接会很有用(比如项目或发行机构)。

许多策略将包含一个或多个治理规则。这些治理规则可能是如何实现策略目标的声明,或者如何处理、评估、监视或修复一些数据来遵守策略目标的具体规范。治理规则提供了策略与关联的术语和数据资产之间的链接。治理规则包含两种关系来支持此链接:Governs 和 Implemented by。前一种关系描述属于该规则或由该规则治理的术语和资产。后一种关系描述用于实际实现治理规则的资产(因为治理规则是描述性的,所以它本身无法用于处理、验证、监视或影响数据)。使用治理规则去描绘策略的具体需求,而不是将这些细节放在策略中。一般而言,您应该避免在策略级别上嵌入规则或需求,因为这些规则或需求无法链接到其他目录资产。通常可使用面向操作的动词来识别这些规则:必须屏蔽、必须验证、必须监视等。

Catalog 选项卡,选择 Glossary 选项卡,然后选择 Browse Policies。向下滚动(或转到下一页),直到找到 Know Your Customer (KYC) 策略,然后单击策略名称来打开它。

图 7. 信息治理策略 — Know Your Customer
该图显示了 Know Your Customer 策略
该图显示了 Know Your Customer 策略

在这个策略示例中,您可看到该策略的一些特性,并检查关联的治理规则:

  • Know Your Customer 是一个特定于客户领域的策略。它的父策略描述它存在于策略分层结构中的何处(它只能拥有一个父策略,所以您需要确定最合理的位置来放置它)。
  • 该策略包含一个名称,以及短和长描述。有一个外部参考信息的链接,在本例中为一条 Wikipedia 参考信息。您可以创建一个组织内部的可访问站点的链接。
  • 该策略引用了 25 条具体的治理规则。这些是该策略的详细信息或需求。例如,列出的第一条规则是,地址必须针对邮政参考来源进行验证和确认。如果单击此治理规则,那么您将找到该规则的详细信息,比如它的名称和描述。它还可能包含对它治理的实现和术语的引用(例如您检查了其术语内容的术语 Street Address)。

您可以继续检查其他治理策略和规则及它们的关系,以更全面地理解 IGC 的组件如何与关键业务概念相联系。要开始专门开发关键决策、流程或信息区域,同时通过您的组织继续扩大对信息治理的理解,这组信息治理内容(包括术语和策略)奠定了基础。

请参阅下载中包含的 PDF 文件,进一步讨论 IGC 内容包的创建、开发和使用。

导入 IGC 查询

IGC 提供了查询或报告其存储库中的所有内容和关系的能力,包括策略、治理规则、术语和资产。这些查询是强大的工具,可以为策略的管理、实现、监视和执行提供帮助。

后续导入步骤要求您已下载、提取查询内容文件 IGC-governance-base-GovQueries-2014-09-24.wbq,并保存到 IGC 浏览器可以访问的地方。要导入目录查询内容,必须拥有 Information Governance Catalog 术语库管理员或信息资产管理员的特权。

要执行 IGC 查询内容的导入:

  1. 打开 IGC 并选择 Catalog 选项卡,然后选择 Queries 选项卡。
  2. 单击 Import
  3. 找到 IGC-governance-base-GovQueries-2014-09-24.wbq 的目录位置并单击 Import
  4. 检查导入的查询列表,如下所示。应该存在至少 10 个查询,但根据您的环境,可能还存在其他查询。
图 8. 导入的查询
该图显示了导入的查询
该图显示了导入的查询

查询提供了搜索和呈现与您的信息治理举措相关的信息的途径。该功能可提供详细信息,既包括类别中的术语的简单信息(词汇分类和条件查询),还包括包含特定过滤器的更复杂输出,比如查找还没有关联的规则的策略(没有关联规则的治理策略的查询)。查询可能是实现信息治理计划和工具来监视环境的一个重要部分。

结束语

在本教程中,您学习了如何导入和检查 InfoSphere Information Governance Catalog 的内容,以帮助您快速开展信息治理举措。您现在可应用此知识,根据您的需要来开发和使用相关的治理术语、策略和规则。有关 IGC 内容的更多用法,请查阅所包含的文档 IBMInfoSphereInformationServer_IGC_OOTB_Usage_v1.pdf(参见 下载)。


下载资源


相关主题


评论

添加或订阅评论,请先登录注册

static.content.url=http://www.ibm.com/developerworks/js/artrating/
SITE_ID=10
Zone=Information Management
ArticleID=1006763
ArticleTitle=在 InfoSphere Information Governance Catalog 中建立信息治理策略框架
publish-date=05282015