Cos'è la gestione del ciclo di vita dei dati?

Vista dall'alto di una rotatoria.

Cos'è la gestione del ciclo di vita dei dati?

La gestione del ciclo di vita dei dati (DLM) è un approccio alla gestione dei dati durante tutto il loro ciclo di vita, dall'immissione alla distruzione. I dati sono suddivisi in fasi in base a criteri diversi e si spostano attraverso queste fasi man mano che completano attività diverse o soddisfano determinati requisiti. Un processo DLM efficace fornisce struttura e organizzazione ai dati di un'azienda, che a sua volta consente di raggiungere obiettivi chiave all'interno del processo, come la sicurezza e la disponibilità dei dati.  

Questi obiettivi sono fondamentali per il successo aziendale e aumentano di importanza con il tempo. Le politiche e i processi DLM consentono alle aziende di prepararsi alle devastanti conseguenze in caso di violazione dei dati, perdita di dati o guasto del sistema in un'organizzazione. Una strategia DLM efficace dà la priorità alla protezione dei dati e al disaster recovery, soprattutto quando più attori malintenzionati entrano nel mercato con la rapida crescita dei dati. In questo modo, in caso di disastro è già in atto un efficace piano di ripristino dei dati, che riduce alcuni degli effetti devastanti sui profitti e sulla reputazione generale di un marchio.

Gestione del ciclo di vita dei dati e gestione del ciclo di vita delle informazioni

La gestione del ciclo di vita delle informazioni (ILM) viene spesso utilizzata in modo intercambiabile con la gestione del ciclo di vita dei dati e, sebbene faccia anch'essa parte di una pratica di gestione dei dati, è diversa da DLM.  

La gestione del ciclo di vita dei dati controlla i dati a livello di file; ovvero, gestisce i file in base a tipo, dimensione ed età. ILM, invece, gestisce i singoli dati all'interno di un file, garantendo l'accuratezza dei dati e aggiornamenti tempestivi. Questi aggiornamenti includono le informazioni sull'utente, come indirizzi e-mail o saldi del conto.  


Fasi della gestione del ciclo di vita dei dati

Un ciclo di vita dei dati è costituito da una serie di fasi nel corso della sua vita utile. Ogni fase è governata da una serie di politiche che massimizzano il valore dei dati durante ogni fase del ciclo di vita. DLM diventa sempre più importante con l'aumento del volume di dati incorporato nei flussi di lavoro aziendali. 

Fase 1: Creazione dei dati

Un nuovo ciclo di vita dei dati inizia con la raccolta dei dati, ma le fonti dei dati sono molteplici. Possono variare da applicazioni Web e mobili, dispositivi Internet of Things (IoT), moduli, sondaggi e altro ancora. Sebbene i dati possano essere generati in vari modi, la raccolta di tutti i dati disponibili non è necessaria per il successo dell'azienda. L'incorporazione di nuovi dati dovrebbe essere sempre valutata in base alla loro qualità e rilevanza per l'azienda. 

Fase 2: Archiviazione dei dati

I dati possono anche differire nel modo in cui sono strutturati, il che ha implicazioni sul tipo di archiviazione dei dati utilizzata da un'azienda. I dati strutturati tendono a sfruttare i database relazionali mentre i dati non strutturati utilizzano in genere database NoSQL o non relazionali. Una volta identificato il tipo di archiviazione per il set di dati, l'infrastruttura può essere valutata per eventuali vulnerabilità di sicurezza e i dati possono essere sottoposti a diversi tipi di elaborazione, come la crittografia e la trasformazione, per salvaguardare l'azienda da attori malintenzionati. Questo tipo di scambio di dati garantisce inoltre che i dati sensibili soddisfino la privacy e i requisiti governativi per le politiche governative, come il GDPR, consentendo alle aziende di evitare costose multe per questi tipi di normative. 

Un altro aspetto della protezione dei dati è l'attenzione alla ridondanza dei dati. Una copia di tutti i dati archiviati può fungere da backup in situazioni come l'eliminazione o il danneggiamento dei dati, la protezione da alterazioni accidentali dei dati e quelle più deliberate, come gli attacchi di malware.  

Fase 3: Condivisione e utilizzo dei dati

Durante questa fase, i dati diventano disponibili per gli utenti dell'azienda. DLM consente alle organizzazioni di definire chi può utilizzare i dati e a quale scopo. Una volta resi disponibili, i dati possono essere sfruttati per una serie di analisi, dall'analisi esplorativa di base dei dati e dalle visualizzazioni dei dati a tecniche di data mining e machine learning più avanzate. Tutti questi metodi svolgono un ruolo nel processo decisionale dell'azienda e nella comunicazione con le varie parti interessate. 

Inoltre, l'utilizzo dei dati non è necessariamente limitato al solo uso interno. Ad esempio, provider di servizi esterni potrebbero utilizzare i dati per scopi quali analisi di marketing e pubblicità. Gli usi interni includono processi aziendali e flussi di lavoro quotidiani, come dashboard e presentazioni.

Fase 4: Archiviazione dei dati

Dopo un certo periodo di tempo, i dati non sono più utili per le operazioni quotidiane. Tuttavia, è importante conservare le copie dei dati dell'organizzazione a cui non si accede di frequente per potenziali esigenze di contenzioso e indagine. Quindi, se necessario, i dati archiviati possono essere ripristinati in un ambiente di produzione attivo. 

La strategia DLM di un'organizzazione dovrebbe definire chiaramente quando, dove e per quanto tempo devono essere archiviati i dati. In questa fase, i dati subiscono un processo di archiviazione che ne garantisce la ridondanza.

Fase 5: Eliminazione dei dati 

In questa fase finale del ciclo di vita, i dati vengono eliminati dai record e distrutti in modo sicuro. Le aziende elimineranno i dati di cui non hanno più bisogno per creare più spazio di archiviazione per i dati attivi. Durante questa fase, i dati vengono rimossi dagli archivi quando superano il periodo di conservazione richiesto o non servono più a uno scopo significativo per l'organizzazione.


Vantaggi della gestione del ciclo di vita dei dati

La gestione del ciclo di vita dei dati presenta diversi importanti vantaggi che includono: 

• Miglioramento dei processi: i dati svolgono un ruolo cruciale nel favorire le iniziative strategiche di un'organizzazione. DLM aiuta a mantenere la qualità dei dati durante tutto il loro ciclo di vita, il che a sua volta consente il miglioramento dei processi e aumenta l'efficienza. Una strategia DLM efficace garantisce che i dati disponibili per gli utenti siano accurati e affidabili, consentendo alle aziende di massimizzare il valore dei propri dati.

• Controllo dei costi: un processo DLM attribuisce valore ai dati in ogni fase del suo ciclo di vita. Quando i dati non sono più utili per gli ambienti di produzione, le organizzazioni possono sfruttare una gamma di soluzioni per ridurre i costi, come il backup, la replica e l'archiviazione dei dati. Ad esempio, i dati possono essere spostati in uno spazio di archiviazione meno costoso on-premise, nel cloud o in un NAS (network attached storage).

• Usabilità dei dati: con una strategia DLM, i team IT possono sviluppare politiche e procedure che assicurano che tutti i metadati siano contrassegnati in modo coerente, in modo da poter migliorare l'accessibilità quando necessario. La definizione di politiche di governance applicabili garantisce il valore dei dati per tutto il tempo necessario a conservarli. La disponibilità di dati puliti e utili aumenta l'agilità e l'efficienza dei processi aziendali.

• Conformità e governance: ogni settore industriale ha le proprie regole e normative per la conservazione dei dati e una solida strategia DLM aiuta le aziende a rimanere conformi. DLM consente alle organizzazioni di gestire i dati con maggiore efficienza e sicurezza, pur mantenendo la conformità alle leggi sulla privacy dei dati in merito ai dati personali e ai record organizzativi.


IBM e la gestione del ciclo di vita dei dati

IBM offre soluzioni di business che aiutano le organizzazioni a gestire i dati dall'inizio alla fine in modo da migliorare l'agilità di business riducendo i costi. IBM Cloud Pak for Data utilizza in modo efficace i microservizi e le relative funzioni di dati e AI ai vertici del settore per consentire un'integrazione intelligente dei dati nei sistemi distribuiti, fornendo alle aziende una visione olistica delle prestazioni aziendali. Ciò facilita una raccolta, un'organizzazione e insight dei dati aziendali più rapidi e consente alle aziende di prendere decisioni su vasta scala. I team di gestione dei dati possono anche contare sul fatto che i loro dati siano al sicuro grazie ai competitivi framework di sicurezza di IBM, garantendo il rispetto delle politiche normative e riducendo qualsiasi rischio di conformità.