什么是数据生命周期管理?
交通圈的俯视图
什么是数据生命周期管理?

数据生命周期管理 (DLM) 是一种在从数据输入到数据销毁的整个生命周期内管理数据的方法。 数据根据不同的条件分处不同的阶段,随着其完成不同的任务或满足特定要求而逐次经历这些阶段。 一个出色的 DLM 流程提供针对企业数据的结构和组织,帮助实现流程中的关键目标,包括数据安全性和数据可用性。  

这些目标对于企业成功非常关键,而且随着时间的推移越来越凸显出其重要性。 DLM 策略和流程帮助企业做好准备应对因数据泄露、数据丢失或系统故障而带来的灾难性后果。 出色的 DLM 战略会划分数据保护和灾难恢复任务的优先顺序,尤其是在越来越多的恶意行为实施者利用快速增长的数据进入市场的形势下。 这样,当发生灾难时,企业可借助业已实施的有效的数据恢复计划从容应对,减轻对企业品牌的利润和总体声誉的灾难性影响。

数据生命周期管理与信息生命周期管理之对比

信息生命周期管理 (ILM) 通常可与数据生命周期管理互换使用,虽然它也是数据管理实践的一部分,但与 DLM 并不相同。  

数据生命周期管理主要监管文件级数据;也就是说,它根据类型、大小和存在时间长度来管理文件。 而 ILM 负责管理文件中的各种数据,确保数据准确性和及时更新。 这包括用户信息,例如电子邮件地址或账户余额。  

数据生命周期管理的各个阶段

数据生命周期由覆盖其有用生命周期的一系列阶段构成。 每个阶段都由一组策略管理,目的是在生命周期的每个阶段最大程度发挥数据的价值。 随着进入企业工作流的数据量不断增长,DLM 也变得越来越重要。 

第 1 阶段:数据创建

新的数据生命周期始于数据收集,但数据来源实在太丰富了。 数据可以来自 web 和移动应用、物联网 (IoT) 设备、表单、调研等。 虽然数据可能是通过各种不同的方式生成的,但并非所有可用数据对于企业的成功都是必不可少的。 因此,必须始终根据数据质量及其与贵企业的相关性,评估是否需要整合新数据。 

第 2 阶段:数据存储

数据所采用的结构也可能各不相同,这会对企业使用的数据存储类型产生影响。 结构化数据一般使用关系型数据库,而非结构化数据通常使用 NoSQL(即非关系型)数据库。 确定适用于数据集的存储类型后,就可以评估基础架构是否存在任何安全漏洞,以及是否可对数据进行各种不同类型的处理,例如数据加密和数据转换,以保护企业免受恶意行为实施者的威胁。 这种类型的数据整理还可确保敏感数据遵守隐私和政府政策的要求(例如 GDPR),帮助企业避免因违反此类法规而导致的代价高昂的罚款。 

数据保护的另一个方面主要聚焦于数据冗余。 任何所存储数据的副本都作为备份,以防出现数据删除或数据损坏等情况,防止对数据的意外更改以及包括恶意软件攻击在内的蓄意破坏。  

第 3 阶段:数据共享与使用

在此阶段,数据可供业务用户使用。 DLM 支持组织定义数据的使用者以及数据的用途。 数据可用后,就可以用于进行一系列分析,包括基本的探索性数据分析、数据可视化以及更高级的数据挖掘和机器学习方法。 所有这些方法都在业务决策以及与各利益相关方的沟通中发挥重要作用。 

此外,数据使用并不一定限于使用内部。 例如,外部服务提供商可出于营销分析和广告等目的使用数据。 内部使用包括日常业务流程和工作流程,例如仪表板和演示等。

第 4 阶段:数据归档

经过一段时间后,数据对于日常运维不再有用。 但是,必须保留不经常访问的组织数据的副本,以用于满足可能的诉讼和调查要求。 如果需要,可将归档的数据恢复到活动的生产环境中。 

组织的 DLM 战略应明确定义何时归档数据、归档到何处以及归档多长时间。 在这个阶段,数据经历归档过程以确保冗余。

第 5 阶段:数据删除 

在生命周期的这个最终阶段,数据被从记录中清除并安全销毁。 企业将删除不再需要的数据,以便为活跃的数据腾出更多存储空间。 在此阶段,当数据超过要求的保留期或不再对组织具有有意义的用途时,将被从归档中删除。

数据生命周期管理的优点

数据生命周期管理具有几个重要优点,包括: 

• 流程改进:数据在推动组织的战略计划方面发挥着至关重要的作用。 DLM 能够在数据的整个生命周期中保证其质量,从而帮助改进流程和提高效率。 出色的 DLM 战略可确保供用户使用的数据准确而可靠,帮助企业最大程度发挥数据的价值。

• 控制成本:DLM 流程在数据生命周期的每个阶段实现其价值。 一旦数据对于生产环境不再有用,组织可利用一系列解决方案以降低成本,包括数据备份、复制和归档。 例如,可将数据转移到本地、云或网络连接存储中低成本的存储位置。

• 数据易用性:借助 DLM 战略, IT 团队可以制定策略和规程,确保以一致的方式标记所有元数据,以便在需要时提高数据的可访问性。 建立可执行的治理策略,确保数据在其保留期内一直发挥价值。 清洁有用的数据的可用性有助于提高企业流程的敏捷性和效率。

• 合规与治理:每个行业领域都有自身的数据保留规则和法规,因此强有力的 DLM 战略可以帮助企业保持合规。 DLM 使企业能够以更高的效率和安全性来处理数据,同时确保遵守有关个人数据和组织记录的数据隐私法律。

资源 IBM 安全框架和发现研讨会

在一场时长 3 小时、虚拟或面对面的设计思维免费对话中,与 IBM 的资深安全架构师和顾问一起了解贵组织的网络安全形势,确定各种计划的优先顺序。

为混合环境制定数据集成和生命周期管理战略

在这本电子书中,了解如何为混合环境制定和执行数据集成和生命周期管理战略。 (1.4 MB)

信息生命周期治理解决方案

在这本电子书中,了解各种不同的信息生命周期治理解决方案。 (446 KB)

印度国家银行

了解印度国家银行如何使用多个 IBM 解决方案和 IBM Garage™ 方法开发一个综合在线银行平台。

数据差异化:领导者指南

探索设计和实施扩大业务优势的数据策略的战略性步骤。

阅读 IBM 研究出版物

IBM 研究成果会定期集成到 IBM Cloud Pak for Data 的新功能中

数据生命周期管理与 IBM

IBM 提供业务解决方案,帮助组织管理覆盖从需求到淘汰的整个数据生命周期,以提高业务敏捷性,同时降低成本。 IBM Cloud Pak for Data 利用微服务及其领先的数据和 AI 功能,智能集成分布式系统的数据,为企业提供全面的业务绩效视图。 这有助于更快地收集、组织和洞察企业数据,并支持企业进行大规模决策。 数据管理团队还相信,通过使用具有竞争力的 IBM 安全框架,他们的数据是安全的,能够确保遵守法规政策,降低合规风险。

IBM Cloud Pak for Data