什么是数据生命周期管理?

交通圈的俯视图。

什么是数据生命周期管理?

数据生命周期管理 (DLM) 是一种在数据输入到数据销毁的整个生命周期中管理数据的方法。 根据不同的标准,将数据分入数个阶段,并在完成不同的任务或满足某些要求时出现在这些阶段。 好的 DLM 流程为企业数据提供结构和组织,还可以实现流程中的关键目标,例如数据安全性和数据可用性。  

这些目标对于企业成功非常关键,重要性也在逐渐增加。 DLM 策略和流程帮助企业做好准备,让他们有能力应对数据泄露、数据丢失或系统故障的破坏性后果。 好的 DLM 策略优先考虑数据保护和灾难恢复,尤其是随着数据的快速增长,越来越多的恶意行为者进入市场。 通过这种方式,企业在发生灾难时可以使用有效的数据恢复计划,减少对品牌收益和整体声誉的破坏性影响。

数据生命周期管理与信息生命周期管理

信息生命周期管理 (ILM) 通常与数据生命周期管理互换使用,虽然 ILM 也是数据管理实践的一部分,但它与 DLM 截然不同。  

数据生命周期管理监督文件级数据;也就是说,它根据类型、大小和时间来管理文件。 而 ILM 管理文件中的各个数据片段,确保数据准确性和及时更新。 这包括用户信息,例如电子邮件地址或帐户余额。  


数据生命周期管理的阶段

数据生命周期由使用过程中的一系列阶段组成。 每个阶段都由一组策略控制,这些策略可在每个生命周期阶段实现数据价值最大化。 随着合并到业务工作流中的数据量的增长,DLM 变得越来越重要。 

阶段 1:数据创建

新的数据生命周期始于数据收集,但是数据来源非常丰富。 Web 和移动应用程序、物联网 (IoT) 设备、表单、调研等不同来源的数据多种多样。 虽然数据可以通过多种方式来生成,但收集所有可用数据并不是企业成功的必要条件。 应始终根据数据质量及其与企业的相关性来评估新数据的合并。 

阶段 2:数据存储

数据的组织方式也可能不同,影响企业使用的数据存储类型。 结构化数据倾向于利用关系数据库,而非结构化数据通常使用 NoSQL 或非关系数据库。 一旦确定了数据集的存储类型,就可以评估基础架构是否存在任何安全漏洞,并且数据可以经过不同类型的数据处理(例如数据加密和数据转换),以保护企业免受恶意行为者的侵害。 这种类型的数据处理还可以确保敏感数据符合 GDPR 等政府政策的隐私要求和政府要求,帮助企业避免因违反这些法规而支付昂贵的罚款。 

数据保护的另一个方面是关注数据冗余。 任何存储数据的副本都可以在数据删除或数据损坏等情况下作为备份,防止意外更改数据和恶意软件攻击等更加蓄意的更改。  

第 3 阶段:数据共享和使用

在此阶段,数据可供业务用户使用。 DLM 支持组织定义谁可以使用数据及其使用目的。 一旦数据可用,就可以将其用于一系列的分析,从基本的探索性数据分析和数据可视化到更高级的数据挖掘和机器学习技术。 所有这些方法都在业务决策和与各种利益相关者的沟通中发挥作用。 

此外,数据使用不一定仅限于内部使用。 例如,外部服务提供商可以将数据用于营销分析和广告。 内部使用包括日常业务流程和工作流程,例如仪表板和演示文稿。

第 4 阶段:数据归档

一段时间后,日常操作中不再使用数据。 但是,维护在潜在的诉讼和调查需求中不经常访问的组织数据副本非常重要。 然后,如果需要,可以将归档数据恢复到活动生产环境中。 

组织的 DLM 策略应明确定义数据归档的时间、地点和数据应归档多长时间。 在这个阶段,数据会经历一个一定会出现冗余的归档过程。

第 5 阶段:数据删除 

在生命周期的最后阶段,数据将从记录中清除并安全销毁。 企业将删除不再需要的数据,来为活动数据创建更多存储空间。 在此阶段,当数据超过所需的保留期或不再对组织有用时,将从档案中删除数据。


数据生命周期管理的优点

数据生命周期管理有几个重要的优点好处,包括: 

• 流程改进:数据在推动组织的战略计划方面发挥着至关重要的作用。 DLM 有助于在整个数据生命周期内保持数据质量,从而改进流程并提高效率。 好的 DLM 策略确保用户可用的数据准确可靠,让企业能够最大限度地发挥数据的价值。

• 控制成本:DLM 流程在数据生命周期的每个阶段都重视数据。 一旦数据不再对生产环境有用,组织可以利用一系列解决方案来降低数据备份、复制和归档等成本。 例如,可以将数据迁移到位于本地、云或网络连接存储中成本较低的存储位置。

• 数据可用性:借助 DLM 策略,IT 团队可以制定策略和程序,确保一致地标记所有元数据,以在需要时提高可访问性。 建立可执行的治理策略,可确保在需要保留的时间内的数据价值。 干净、有用的数据的可用性提高企业流程的敏捷性和效率。

• 合规性和治理:每个行业部门都有自己的数据保留规则和规定,完善的 DLM 策略有助于企业保持合规性。 DLM 使组织能够以更高的效率和安全性处理数据,同时遵守有关个人数据和组织记录的数据隐私法规。


数据生命周期管理与 IBM

IBM 提供的业务解决方案可帮助组织在需求到淘汰的过程中管理数据,从而在降低成本的同时提高业务敏捷性。 IBM Cloud Pak for Data 利用微服务及其领先的数据和 AI 功能,实现跨分布式系统的数据智能集成,为企业提供业务绩效的整体视图。 这有助于更快地收集、组织和洞察企业数据,并支持企业进行大规模决策。 借助 IBM 具有竞争力的安全框架,数据管理团队还可以保证数据安全性,确保遵守监管政策并降低任何合规风险。