什么是数据治理?

了解数据治理如何确保企业从其数据资产中获得最大收益。

在临床环境中使用平板电脑的医务人员
什么是数据治理?

数据治理通过不同的策略和标准提高组织数据的可用性、质量和安全性。 这些流程确定数据所有者、数据安全措施和数据的预期用途。 总体而言,数据治理的目标是维护安全且易于访问的高质量数据,以获取更深入的业务洞察。

大数据和数字化转型工作是数据治理计划的主要推动力量。 随着来自物联网 (IoT) 技术等新数据源的数据量的增加,组织需要重新考虑其数据管理实践,以扩展其商业智能。 有效的数据治理计划旨在提高数据质量,减少数据孤岛,确保合规性和安全性,并适当地分配数据访问权限。


数据治理和数据管理

数据管理的范围比数据治理更广泛。 它可以定义为采集、处理、保护和存储组织数据的实践,然后将其用于制定战略决策以改善业务成果。 这既包括数据治理,也包括数据管理生命周期的其他方面,例如数据处理、数据存储、数据安全等。 由于数据管理的这些其他方面也可能影响数据治理,因此这些团队需要协同工作以执行数据治理策略。 例如,数据治理团队可能会识别不同数据集之间的共性,但如果想要将这些数据集整合起来,他们需要与数据管理团队合作来定义数据模型和数据架构,从而促进这些联系。 再比如数据访问,数据治理团队可以围绕对特定类型数据(例如个人身份信息 (PII))的数据访问设置策略,但数据管理团队将直接提供这种访问权限,或者设置适当的机制以提供这种访问权限(例如,利用内部定义的用户角色来批准访问)。  


数据治理的好处

实施数据治理框架可以增加组织内数据的价值。 由于数据治理有助于提高整体数据的准确性,它还会影响基于该数据的结果,包括较为简单的日常业务决策以及较为复杂的自动化计划。 一些关键好处包括:

  • 扩大规模和提升数据素养 – 组织内有限的数据访问可能会限制创新,并在业务流程中产生对主题专家 (SME) 的依赖。 数据治理实践为跨职能团队创造了一条途径,使他们能够聚集在一起以形成对跨系统数据的共同理解(例如,协调与领域无关的数据差异)。 然后,这种共同理解可以通过数据标准体现出来,其中数据定义和元数据记录在一个集中的位置,例如数据目录。 反过来,这种文档又会成为自助服务解决方案(例如 API)的基础,这些解决方案支持整个组织中的一致数据和对数据的联合访问。   
  • 确保安全、数据隐私和合规 – 数据治理策略提供了一种方法来满足政府关于敏感数据和隐私的法规要求(例如欧盟通用数据保护条例 (GDPR) 和美国健康保险可移植性和责任法案 (HIPAA))以及行业要求(例如支付卡行业数据安全标准 (PCI DSS))。 违反这些法规要求可能导致高昂的政府罚款和引起公众的不满。 为避免这种情况,企业采用数据治理工具来设置护栏,防止数据泄露和数据滥用。
  • 高质量数据 – 数据治理可确保数据完整性、数据准确性、完备性和一致性。 良好的数据可以让企业更好地了解他们的工作流程和客户,以及如何优化他们的整体业务绩效。 然而,绩效指标中的错误可能会将组织引向错误的方向,但数据治理工具可以纠正潜在的不准确之处。 例如,数据沿袭工具可以帮助数据所有者在整个生命周期中跟踪数据;这包括任何来源数据以及在任何 ETL 或 ELT 过程中应用的数据转换。 这样就可以仔细检查任何数据错误的根本原因。
  • 促进数据分析 – 高质量的数据为更先进的数据分析和数据科学计划奠定了基础;这包括商业智能报告或更复杂的预测性机器学习项目。 只有当主要利益相关者信任底层数据时,才能对这些数据划分优先级;否则,它们可能不会被采用。

数据治理的挑战

尽管数据治理的好处显而易见,但数据治理计划要取得成功还需要克服许多障碍。 其中的一些挑战包括:

  • 组织一致性:在数据治理计划开始时,最大的挑战之一是让整个组织的利益相关者围绕什么是关键数据资产以及它们各自的定义和格式达成一致。 监管政策可以针对基于客户数据的对话制定一些结构,但要对属于主数据管理 (MDM) 范围的其他数据集达成一致可能会更加困难,例如更特定于产品的数据。
  • 缺乏相应的支持:有效的数据治理计划通常需要两个级别的支持 — 高管级别和个人贡献者级别 首席数据官 (CDO) 和数据管理员对于组织内数据治理的沟通和优先级划分至关重要。 首席数据官可以对数据团队进行监督和实施问责制,确保数据治理策略得到采用。 数据管理员可以帮助提高数据生产者和数据使用者对这些策略的认识,以鼓励整个组织遵守这些策略。
  • 相关数据架构和流程 - 如果没有合适的工具和数据架构,企业将难以部署有效的数据治理计划。 例如,团队可能会发现跨不同职能部门的冗余数据,但数据架构师需要开发适当的数据模型和数据架构,以合并和集成跨存储系统的数据。 团队可能还需要采用数据目录来创建整个组织的数据资产清单,或者如果他们已经有了一个清单,他们可能需要建立一个元数据管理流程,以确保底层数据是相关且最新的数据。

IBM 解决方案

IBM Cloud Pak for Data

使用基于数据架构构建的平台,更快地预测结果。 无论数据位于何处,都可以收集、组织和分析数据。


IBM Watson Knowledge Catalog

在主动元数据和策略管理的支持下,通过智能编目为 AI 和分析激活业务就绪数据。



采取下一步行动

IBM Cloud Pak for Data 利用微服务及其领先的数据和 AI 功能,实现分布式系统数据智能集成的自动化,为企业提供全面的业务绩效视图。 这有助于更快地收集、组织和洞察企业数据,支持企业进行大规模决策。 数据管理团队相信,具有竞争优势的 IBM 安全框架能够保护他们的数据安全,确保遵守监管政策,降低合规性风险。 了解 IBM Cloud Pak® for Data 和 IBM Streams 如何帮助您了解和管理企业跨多个环境的数据治理。