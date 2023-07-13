为了实现高水平的数据完整性，组织需要实施管理数据收集、存储、访问、编辑和使用的流程、规则和标准。这些流程、规则和标准协同工作，以实现以下目标：

验证数据及其输入

删除重复数据

提供数据备份并确保业务连续性

通过访问控制保护数据安全

保持审计跟踪以确保问责和合规性

组织可以在数据生命周期的各个阶段使用多种工具以及私有云或公有云环境，通过所谓的数据治理来维护数据完整性。数据治理是一种实践，旨在创建、更新并持续执行流程、规则和标准，以防止错误、数据丢失、数据损坏、敏感或受监管数据的误用，以及数据泄露。

数据完整性的优势

具有高水平数据完整性的组织能够：

在发生数据泄露或非计划停机时，提高数据恢复的可能性和速度

防止未经授权的访问和数据篡改

更有效地实现和维持合规性

良好的数据完整性还可以通过提高组织分析的准确性来改善业务决策结果。数据集越完整、准确和一致，业务智能和业务流程就越可靠。因此，领导者能够更好地设定和实现有利于组织的目标，同时提升员工和用户的信心。

数据科学任务（如机器学习）也极大地受益于良好的数据完整性。当用于训练基础机器学习模型的数据记录是可信且准确的，该模型在进行业务预测或自动化任务时的表现也会更出色。

不同类型的数据完整性

数据完整性主要分为两大类：物理数据完整性和逻辑数据完整性。

物理数据完整性指在数据存储或传输过程中，保护数据的完整性（即数据未丢失重要信息）、可访问性和准确性。自然灾害、停电、人为错误和网络攻击都可能威胁数据的物理完整性。

逻辑数据完整性指在不同部门、学科和地点的利益相关者及应用访问数据时，保护数据的一致性和完整性。逻辑数据完整性可通过以下方式实现：

防止重复（实体完整性）

规定数据的存储和使用方式（参照完整性）

以可接受的格式保留数据（域完整性）

确保数据满足组织的独特或行业特定的需求（用户定义的完整性）

数据完整性与数据安全的区别

数据安全是数据完整性的一个子组成部分，指采取的防止未经授权访问或防范篡改数据的措施。有效的数据安全协议和工具有助于实现强有力的数据完整性。换句话说，数据安全是手段，而数据完整性是目标。在发生数据泄露、攻击、停电或服务中断时的数据可恢复性属于数据安全的范畴。

数据完整性差的后果

人为错误、传输错误、恶意行为、安全防护不足以及硬件故障都会导致“坏数据”，从而对组织的数据完整性产生负面影响。面临上述一项或多项问题的组织可能会面临以下风险：

数据质量差

低质量数据会导致分析不准确、不充分，从而引发错误的决策。数据质量下降可能带来生产力损失、收入下降以及声誉受损。

数据安全不足

如果数据未得到妥善保护，其遭受数据泄露或因自然灾害或其他非计划事件丢失的风险将增加。缺乏对数据安全的适当洞察和控制，组织也更容易违反地方、区域和全球的法规，例如欧盟的《通用数据保护条例》。