O gerenciamento de ciclo de vida de dados (DLM) é uma abordagem para o gerenciamento de dados ao longo de seu ciclo de vida, desde a entrada de dados até a sua destruição. Os dados são separados em fases com base em diferentes critérios e passam por esses estágios à medida que concluem diferentes tarefas ou atendem a requisitos específicos. Um bom processo de DLM oferece estrutura e organização aos dados de uma empresa, que por outro lado viabiliza objetivos importantes do processo, como a segurança e a disponibilidade de dados.
Essas metas são essenciais para o sucesso dos negócios e sua importância aumenta com o tempo. As políticas e processos permitem que as empresas se preparem para lidar com consequências devastadoras caso uma organização enfrente violações de dados, perda de dados ou falha do sistema. Uma boa estratégia de gerenciamento de ciclo de vida de dados prioriza a proteção de dados e recuperação de desastres, especialmente à medida que os agentes maliciosos entram no mercado e que o volume de dados cresce rapidamente. Desta forma, um plano eficaz de recuperação dados deve estar pronto no caso de um desastre, minimizando alguns dos efeitos devastadores sobre os resultados de negócios e o estado geral da reputação.
O gerenciamento de ciclo de vida de informações (ILM) é muitas vezes usado de forma intercambiável com gerenciamento de ciclo de vida de dados e, embora também seja parte da prática de gerenciamento de dados, há algumas diferenças.
O gerenciamento de ciclo de vida supervisiona os dados no nível do arquivo, ou seja, gerencia os arquivos com base em tipo, tamanho e idade. Por outro lado, o gerenciamento de ciclo de vida de informações lida com partes individuais de dados em um arquivo, garantindo precisão de dados e atualizações regulares. Isso inclui informações sobre o usuário, como e-mail ou saldos de conta.
Um ciclo de vida de dados consiste em uma série de fases ao longo do curso de sua vida útil. Cada fase é regida por um conjunto definido de políticas que maximiza o valor dos dados durante cada etapa do ciclo de vida. O DLM torna-se cada vez mais importante à medida que cresce o volume de dados incorporados aos fluxos de trabalho de negócios.
Fase 1: Criação de dados
A novo ciclo de vida de dados começa com a coleta de dados, mas as fontes de dados são abundantes. Eles podem variar de aplicativos móveis e da web, dispositivos de Internet das Coisas (IoT), formulários, pesquisas e muito mais. Embora os dados possam ser gerados de várias maneiras, a coleção de todos os dados disponíveis não é essencial para o sucesso de seus negócios. A incorporação de novos dados deve ser sempre avaliada com base em sua qualidade e relevância para seus negócios.
Fase 2: Armazenamento de dados
Os dados também podem diferir na forma como são estruturados, o que tem implicações no tipo armazenamento de dados usado pela empresa. Dados estruturados tendem a usar bancos de dados relacionais, enquanto dados não estruturados tipicamente fazem uso de bancos de dados NoSQL e não relacionais. Após identificar o tipo de armazenamento necessário para o conjunto de dados, é feita uma avaliação da infraestrutura quanto a possíveis vulnerabilidades de segurança e os dados podem passar por diferentes tipos de processamento de dados, como criptografia e transformação de dados a fim de proteger a empresa contra agentes maliciosos. Esse tipo de manipulação de dados também assegura que os dados sensíveis atendam aos requisitos de privacidade de políticas governamentais, como o GDPR, permitindo que as empresas evitem multas caras provenientes deste tipo de regulamentação.
Outro aspecto da proteção de dados é um foco na redundância de dados. A cópia de quaisquer dados armazenados pode atuar como um backup em algumas situações, como exclusão ou distorção de dados, proteção contra alterações acidentais dos dados, ou propositais, como em ataques de malware.
Fase 3: Compartilhamento e uso de dados
Durante esta fase, os dados tornam-se disponíveis para os usuários de negócios. O DLM permite que as organizações definam quem pode usar os dados e a finalidade para a qual eles podem ser usados. Uma vez que os dados são disponibilizados, eles poderão ser usados em diferentes análises, como uma análise de dados exploratória básica, visualizações de dados ou a mineração de dados e técnicas de machine learning. Todos estes métodos possuem um papel importante na tomada de decisões das empresas e na comunicação com vários stakeholders.
Além disso, o uso de dados não está necessariamente restrito apenas ao uso interno. Por exemplo, provedores de de serviços externos podem usar os dados para fins como análise de dados de marketing e publicidade. Os usos internos incluem processos de negócios de rotina e fluxos de trabalho diários, como dashboards e apresentações.
Fase 4: Arquivamento de dados
Após um certo período, os dados não são mais úteis para operações do dia a dia. No entanto, é importante manter cópias dos dados da organização que não são acessados com frequência para possíveis necessidades relacionadas a processos judiciais e investigação. Então, se necessário, os dados arquivados podem ser restaurados para um ambiente de produção ativo.
A estratégia de DLM de uma organização deve definir claramente quando, onde e por quanto tempo os dados devem ser arquivados. Nesta etapa, os dados passam por um processo de arquivamento que garante a redundância.
Fase 5: Exclusão de dados
Nesta etapa final do ciclo de vida, os dados são eliminados dos registos e destruídos de forma segura. As empresas devem excluir os dados que não são mais necessário para liberar mais espaço de armazenamento para dados ativos. Durante esta fase, os dados são removidos dos archives quando excedem os período de retenção ou já não servem a um propósito significativo da organização.
O gerenciamento de ciclo de vida tem vários benefícios importantes que incluem:
• Melhoria de processos: os dados desempenham um papel importante em promover as iniciativas estratégicas de uma organização. A DLM ajuda a manter a qualidade de dados em todo o seu ciclo de vida, o que resulta em melhoria dos processos e aumento da eficiência. Uma boa estratégia de DLM assegura que os dados disponíveis aos usuários sejam precisos e confiáveis, permitindo que as empresas maximizem o valor de seus dados.
• Controle de custos: o processo de DLM agrega valor aos dados em todas as etapas de seu ciclo de vida. Quando os dados deixam de ser úteis em ambientes de produção, as organizações podem usar diversas soluções para reduzir os custos, como backup de dados, replicação e arquivamento. Por exemplo, os dados podem ser transferidos para um armazenamento local de menor custo, na cloud ou em uma área de armazenamento anexada à rede.
• Usabilidade dados: com uma estratégia de DLM, as equipes de TI podem desenvolver políticas e procedimentos que asseguram que todos os metadados sejam marcados de forma consistente para melhorar o acesso quando necessário. Estabelecer políticas de controle aplicável agrega valor aos dados ao longo de todo período que permanecerem retidos. A disponibilidade de dados limpos e úteis aumenta a agilidade e a eficiência dos processos da empresa.
• Conformidade e controle: todos os setores da indústria possuem suas próprias regras e regulamentações para retenção de dados e uma estratégia concreta de DLM ajuda as empresas a permanecerem em conformidade. O gerenciamento de ciclo de vida de dados permite gerenciar dados com eficiência e segurança, mantendo a conformidade com as leis de privacidade de dados relacionadas aos dados pessoais e registros da organização.
Entenda seu cenário de segurança cibernética e priorize iniciativas em conjunto com arquitetos e consultores de segurança sênior da IBM em uma sessão de design thinking de três horas, sem custo, virtual ou presencial.
Neste e-book, descubra como desenvolver e executar uma estratégia integração e gerenciamento de ciclo de vida de dados em um ambiente híbrido. (1,4 MB)
Conheça as diferentes soluções de governança de ciclo de vida de informações neste e-book. (446 KB)
Saiba como o State Bank of India usou diversas soluções IBM, com a metodologia IBM Garage™, para desenvolver uma plataforma bancária on-line abrangente.
Saiba mais sobre as etapas estratégicas para criar e implementar uma estratégia de dados que promove a vantagem de negócios.
A pesquisa da IBM é regularmente integrada a novos recursos do IBM Cloud Pak for Data