定义

什么是数据治理?

数据治理包含支持企业数据管理的策略、流程和组织结构。 数据治理计划的结构有助于利益相关方了解组织数据,确保数据安全,并获得对数据的信任,尤其是随着企业扩大规模并积累更多的数据源和资产。随着新数据的激增,企业需要确定合适的大数据环境(例如数据湖)以用于存储和访问,同时还需要设计一个数据架构来治理和集成这些数据源,使其在整个组织中可用。 由于能对各种团队的工作流程和决策产生影响,这种数据集成变得越来越重要。

数据治理对于组织的数据管理总体战略至关重要,并且是完整 DataOps 实践的一部分。 它有助于您了解自己拥有什么数据、数据位于何处以及数据如何使用。数据治理可为业务就绪数据奠定基础,并通过遵守定义的规则和流程,加快分析和执行业务增长计划。

数据治理和 IBM

具有集成数据目录的数据治理平台可以帮助您的组织查找、整理、分析、准备和共享数据以支持 AI 计划。 IBM 数据治理解决方案有助于确保数据管道准备就绪,帮助对敏感数据进行编目、保护和治理,并跟踪数据沿袭。

为何选择 IBM

IBM Watson Knowledge Catalog

借助以有效的元数据和策略管理为支持的数据目录,激活用于 AI 和分析的业务就绪数据。帮助您的同事找到数据以进行整理、分类、治理、分析和使用。

深入了解数据治理

数据治理的好处

利用强大的数据治理实践,利益相关方可以在保护数据的同时获得更深入的洞察,从而实现跨组织的成功。

更出色的数据安全性与合规性

不同类型的数据可能具有不同的权限和相关规则,特别是在该数据包含个人可识别信息 (PII) 时。 数据治理实践有助于提高安全性与合规性,帮助企业降低违规风险和罚款,并赢得客户信任。 数据治理实践有助于了解存在哪些 PII 以及它们位于何处,同时通过策略和元数据管理可以自动合规。 

隐私法规是随着欧洲通用数据保护条例 (GDPR) 等全球性法规的出台而兴起,该法规旨在为欧洲公民提供数据隐私,尤其是在互联网上。 此外,还出现了越来越多的行业特定法规和区域性法规,比如《健康保险可移植性和责任法案》(HIPAA),旨在保护患者及其个人健康信息。 受数据驱动型市场营销悄然兴起和远程工作方式日渐盛行的影响,合规性法规只会变得越来越普遍,因为客户越来越意识到自己的数据权利,同时企业也在积极应对愈发严峻的声誉风险。

改进的数据质量

商业智能工具的好坏取决于提供给它们的数据。如果没有适当地清理和管理底层数据,这会限制用户制定明智业务决策的能力。 此外,数据往往来自各种各样的数据源,其中的不一致性会阻碍分析和其他关键项目的顺利进行。 数据治理有助于将不同系统间的信息联系起来,确定有意义的关系,以便充分利用组织的数据,同时确保关键数据不会被遗忘。

加速实现自动化

有了维护数据结构和质量的实践和工具,分析团队可以利用机器学习算法开始创新,并使特定任务和流程实现自动化。 例如,可将客户数据输入到模型中,以确定如何在销售管道中对潜在客户划分优先级。 因为数据治理实践有助于确保客户数据的准确性且受到保护,团队就能实现更好的业务增长,并进行更有针对性的销售。

与数据治理有关的角色

一些角色在数据治理实践中至关重要。 有三个角色可以确保随时间推移创建和维护标准,帮助实现数据合规性、安全性、数据质量和自动化目标。

首席数据官

执行发起人(例如首席数据官)通过数据治理计划的优先级向组织传达它的重要性。 这些人员对跨职能委员会的发展起着重要作用,该委员会的成员通常来自各个业务部门,代表不同学科或产品组合的需求和问题。 该委员会可以充当论坛,用于交流新的数据治理计划和分配责任,以便按商定的时间线取得成果。

数据所有者

这些人员负责维护数据的状态。 人员的指定通常是基于所管理的数据类型(如客户或财务数据),他们的角色旨在维护数据准确性和易用性。 常见任务包括对数据问题进行故障诊断、审批数据定义以及提供数据建议,特别是在与任何法规要求相关时。

数据管理员

这些人员是其数据领域的主题专家 (SME),可对数据策略产生影响,并为整个组织的数据治理提供支持。由于能够传达特定数据点对业务流程或决策的重要性,因此他们还可以影响数据库表的结构,确保找到正确的数据以用于报告。 总体而言,数据管理有助于使利益相关方承担起维护数据质量的责任。

数据治理框架

多年来,尤其是随着数字化转型项目的发展,数据治理实践的采用率不断增加。为了让数据治理计划取得有效成果,它们应该包括一些组件,例如:

数据标准

应当开发数据字典、分类法和业务词汇表,以便明确业务和数据定义。 此文档减少了对话中的困惑之处,特别是涉及度量和报告的内容。 它还为利益相关方提供了数据架构可视性,使团队能够自行创新,使其学科中的流程实现自动化。

数据流程和组织结构

数据治理流程为最终用户提供了透明性,使他们能够了解在组织内如何处理数据。这可以包括数据刷新频率、PII 限制、监管数据政策,甚至包括数据访问之类的简单内容。通过明确不同角色在数据管理和维护中的职责,这类文件还支持组织结构。

技术

不同的数据治理工具(例如元数据管理平台)都可支持与数据有关的流程和标准。 这些工具可以存储和保护有关组织所管理的数据的信息。 这可以包括有关业务定义、数据日志、数据所有者、数据库信息(例如数据库和表名称、服务器位置、数据类型等)的文档。 还可以将其提供给自助数据分析工具,使分析人员能够查询和直观查看用于报告或创新项目的不同数据集。

客户现身说法

您可能还对以下内容感兴趣

IBM Cloud Pak® for Data

灵活的多云数据平台可集成您的数据,无论数据是在本地还是云端,同时从源头上提高其安全性。

IBM® DataStage®

高度可扩展的数据集成工具,用于设计、开发和运行移动和转换数据的作业,可部署在本地和任何云中。

IBM InfoSphere Advanced Data Preparation

支持自助访问数据的软件。借助自动转换更快地开始数据分析。

后续步骤

联系 IBM 专家

您可拨打热线 400-669-0260(工作日 9:00-17:00);或填写需求请专家与您联系。