O que é o gerenciamento de ciclo de vida de dados?
Vista aérea do trânsito da cidade.
O que é o gerenciamento de ciclo de vida de dados?

O gerenciamento de ciclo de vida de dados (DLM) é uma abordagem para o gerenciamento de dados ao longo de seu ciclo de vida, desde a entrada de dados até a sua destruição. Os dados são separados em fases com base em diferentes critérios e passam por esses estágios à medida que concluem diferentes tarefas ou atendem a requisitos específicos. Um bom processo de DLM oferece estrutura e organização aos dados de uma empresa, que por outro lado viabiliza objetivos importantes do processo, como a segurança e a disponibilidade de dados.  

Essas metas são essenciais para o sucesso dos negócios e sua importância aumenta com o tempo. As políticas e processos permitem que as empresas se preparem para lidar com consequências devastadoras caso uma organização enfrente violações de dados, perda de dados ou falha do sistema. Uma boa estratégia de gerenciamento de ciclo de vida de dados prioriza a proteção de dados e recuperação de desastres, especialmente à medida que os agentes maliciosos entram no mercado e que o volume de dados cresce rapidamente. Desta forma, um plano eficaz de recuperação dados deve estar pronto no caso de um desastre, minimizando alguns dos efeitos devastadores sobre os resultados de negócios e o estado geral da reputação.

Gerenciamento de ciclo de vida dos dados vs gerenciamento de ciclo de vida de informações

O gerenciamento de ciclo de vida de informações (ILM) é muitas vezes usado de forma intercambiável com gerenciamento de ciclo de vida de dados e, embora também seja parte da prática de gerenciamento de dados, há algumas diferenças.  

O gerenciamento de ciclo de vida supervisiona os dados no nível do arquivo, ou seja, gerencia os arquivos com base em tipo, tamanho e idade. Por outro lado, o gerenciamento de ciclo de vida de informações lida com partes individuais de dados em um arquivo, garantindo precisão de dados e atualizações regulares. Isso inclui informações sobre o usuário, como e-mail ou saldos de conta.  

Fases do gerenciamento de ciclo de vida de dados

Um ciclo de vida de dados consiste em uma série de fases ao longo do curso de sua vida útil. Cada fase é regida por um conjunto definido de políticas que maximiza o valor dos dados durante cada etapa do ciclo de vida. O DLM torna-se cada vez mais importante à medida que cresce o volume de dados incorporados aos fluxos de trabalho de negócios. 

Fase 1: Criação de dados

A novo ciclo de vida de dados começa com a coleta de dados, mas as fontes de dados são abundantes. Eles podem variar de aplicativos móveis e da web, dispositivos de Internet das Coisas (IoT), formulários, pesquisas e muito mais. Embora os dados possam ser gerados de várias maneiras, a coleção de todos os dados disponíveis não é essencial para o sucesso de seus negócios. A incorporação de novos dados deve ser sempre avaliada com base em sua qualidade e relevância para seus negócios. 

Fase 2: Armazenamento de dados

Os dados também podem diferir na forma como são estruturados, o que tem implicações no tipo armazenamento de dados usado pela empresa. Dados estruturados tendem a usar bancos de dados relacionais, enquanto dados não estruturados tipicamente fazem uso de bancos de dados NoSQL e não relacionais. Após identificar o tipo de armazenamento necessário para o conjunto de dados, é feita uma avaliação da infraestrutura quanto a possíveis vulnerabilidades de segurança e os dados podem passar por diferentes tipos de processamento de dados, como criptografia e transformação de dados a fim de proteger a empresa contra agentes maliciosos. Esse tipo de manipulação de dados também assegura que os dados sensíveis atendam aos requisitos de privacidade de políticas governamentais, como o GDPR, permitindo que as empresas evitem multas caras provenientes deste tipo de regulamentação. 

Outro aspecto da proteção de dados é um foco na redundância de dados. A cópia de quaisquer dados armazenados pode atuar como um backup em algumas situações, como exclusão ou distorção de dados, proteção contra alterações acidentais dos dados, ou propositais, como em ataques de malware.  

Fase 3: Compartilhamento e uso de dados

Durante esta fase, os dados tornam-se disponíveis para os usuários de negócios. O DLM permite que as organizações definam quem pode usar os dados e a finalidade para a qual eles podem ser usados. Uma vez que os dados são disponibilizados, eles poderão ser usados em diferentes análises, como uma análise de dados exploratória básica, visualizações de dados ou a mineração de dados e técnicas de machine learning. Todos estes métodos possuem um papel importante na tomada de decisões das empresas e na comunicação com vários stakeholders. 

Além disso, o uso de dados não está necessariamente restrito apenas ao uso interno. Por exemplo, provedores de de serviços externos podem usar os dados para fins como análise de dados de marketing e publicidade. Os usos internos incluem processos de negócios de rotina e fluxos de trabalho diários, como dashboards e apresentações.

Fase 4: Arquivamento de dados

Após um certo período, os dados não são mais úteis para operações do dia a dia. No entanto, é importante manter cópias dos dados da organização que não são acessados com frequência para possíveis necessidades relacionadas a processos judiciais e investigação. Então, se necessário, os dados arquivados podem ser restaurados para um ambiente de produção ativo. 

A estratégia de DLM de uma organização deve definir claramente quando, onde e por quanto tempo os dados devem ser arquivados. Nesta etapa, os dados passam por um processo de arquivamento que garante a redundância.

Fase 5: Exclusão de dados 

Nesta etapa final do ciclo de vida, os dados são eliminados dos registos e destruídos de forma segura. As empresas devem excluir os dados que não são mais necessário para liberar mais espaço de armazenamento para dados ativos. Durante esta fase, os dados são removidos dos archives quando excedem os período de retenção ou já não servem a um propósito significativo da organização.

Benefícios do gerenciamento de ciclo de vida de dados

O gerenciamento de ciclo de vida tem vários benefícios importantes que incluem: 

• Melhoria de processos: os dados desempenham um papel importante em promover as iniciativas estratégicas de uma organização. A DLM ajuda a manter a qualidade de dados em todo o seu ciclo de vida, o que resulta em melhoria dos processos e aumento da eficiência. Uma boa estratégia de DLM assegura que os dados disponíveis aos usuários sejam precisos e confiáveis, permitindo que as empresas maximizem o valor de seus dados.

• Controle de custos: o processo de DLM agrega valor aos dados em todas as etapas de seu ciclo de vida. Quando os dados deixam de ser úteis em ambientes de produção, as organizações podem usar diversas soluções para reduzir os custos, como backup de dados, replicação e arquivamento. Por exemplo, os dados podem ser transferidos para um armazenamento local de menor custo, na cloud ou em uma área de armazenamento anexada à rede.

• Usabilidade dados: com uma estratégia de DLM, as equipes de TI podem desenvolver políticas e procedimentos que asseguram que todos os metadados sejam marcados de forma consistente para melhorar o acesso quando necessário. Estabelecer políticas de controle aplicável agrega valor aos dados ao longo de todo período que permanecerem retidos. A disponibilidade de dados limpos e úteis aumenta a agilidade e a eficiência dos processos da empresa.

• Conformidade e controle: todos os setores da indústria possuem suas próprias regras e regulamentações para retenção de dados e uma estratégia concreta de DLM ajuda as empresas a permanecerem em conformidade. O gerenciamento de ciclo de vida de dados permite gerenciar dados com eficiência e segurança, mantendo a conformidade com as leis de privacidade de dados relacionadas aos dados pessoais e registros da organização.

Recursos Workshop de Enquadramento e Descoberta de Segurança da IBM

Entenda seu cenário de segurança cibernética e priorize iniciativas em conjunto com arquitetos e consultores de segurança sênior da IBM em uma sessão de design thinking de três horas, sem custo, virtual ou presencial.

Desenvolvimento de uma estratégia de integração e de gerenciamento de ciclo de vida de dados para um ambiente híbrido

Neste e-book, descubra como desenvolver e executar uma estratégia integração e gerenciamento de ciclo de vida de dados em um ambiente híbrido. (1,4 MB)

Soluções de Information Lifecycle Governance

Conheça as diferentes soluções de governança de ciclo de vida de informações neste e-book. (446 KB)

State Bank of India

Saiba como o State Bank of India usou diversas soluções IBM, com a metodologia IBM Garage™, para desenvolver uma plataforma bancária on-line abrangente.

O diferenciador de dados: um guia para líderes

Saiba mais sobre as etapas estratégicas para criar e implementar uma estratégia de dados que promove a vantagem de negócios.

Veja as publicações do IBM Research

A pesquisa da IBM é regularmente integrada a novos recursos do IBM Cloud Pak for Data

Gerenciamento do ciclo de vida de dados e a IBM

A IBM oferece soluções de negócios que ajudam as organizações a gerenciar dados de a partir de requisitos por meio de remoção de dados para melhorar a agilidade de negócios e reduzir custos. O IBM Cloud Pak for Data utiliza microsserviços e os principais recursos de dados e IA oferecidos por eles para permitir a integração inteligente de dados em sistemas distribuídos, fornecendo às empresas uma visão abrangente do desempenho dos negócios. Isso ajuda a acelerar a coleta, a organização e a geração de insights a partir dos dados corporativos, o que permite uma tomada de decisões em escala nas empresas. As equipes de gerenciamento de dados também podem confiar que seus dados estão seguros com as estruturas de segurança competitivas da IBM, que garantem a adesão às políticas regulamentares e a redução dos riscos de conformidade.

IBM Cloud Pak for Data