My IBM Accedi Iscriviti
Cos'è l'integrità dei dati?

Cos'è l'integrità dei dati?

Esplora IBM Databand Abbonati per ricevere gli aggiornamenti sull'AI
Illustrazione con collage di pittogrammi di nuvole, grafico a torta, pittogrammi grafici

Data di pubblicazione: 5 aprile 2024
Autori: Tim Mucci, Cole Stryker

Cos'è l'integrità dei dati?

Cos'è l'integrità dei dati?

L'integrità dei dati è la garanzia che i dati di un'organizzazione siano accurati, completi e coerenti in qualsiasi momento del loro ciclo di vita. Mantenere l'integrità dei dati implica la necessità di proteggere i dati di un'organizzazione da perdite, fughe di informazioni e influenze negative.

Le organizzazioni si affidano a dati puliti per prendere decisioni, prevedere il comportamento dei consumatori, valutare le tendenze del mercato e proteggersi dalle violazioni dei dati. Man mano che i volumi di dati all'interno delle organizzazioni aumentano in maniera esponenziale e tali dati vengono utilizzati per prendere decisioni sul futuro delle aziende, massimizzare l'integrità dei dati diventa sempre più importante. 

Per garantire l'integrità dei dati, le organizzazioni si attengono a processi che includono controllo degli errori, procedure di convalida e misure di sicurezza rigorose come la crittografia, il controllo degli accessi e i backup. L'obiettivo dell'integrità dei dati è contribuire a garantire che la data analytics sia basata su informazioni affidabili supportate da framework normativi come il GDPR e che le informazioni sensibili siano protette da accessi o utilizzi non autorizzati.

L'integrità dei dati non si limita a un singolo strumento o piattaforma, ma è un approccio completo che coinvolge lo sforzo collettivo dell'infrastruttura tecnologica di un'organizzazione, delle politiche e delle persone che lavorano con il sistema di dati per garantire che i dati rimangano un asset affidabile.

Il Total Economic Impact (TEI) di IBM Data Management

Forrester Consulting ha condotto uno studio Total Economic Impact™ commissionato da IBM. Scarica il report per scoprire il potenziale ritorno sull’investimento che le organizzazioni possono realizzare utilizzando IBM Data Management.

Contenuti correlati 12 esempi di integrità dei dati: tipi, utilizzo nel settore e rischi
Perché l'integrità dei dati è importante?

Perché l'integrità dei dati è importante?

L'integrità dei dati è simile al controllo di qualità nelle aziende tradizionali orientate al prodotto e garantisce che la materia prima sia corretta, sicura e adatta all'uso previsto.

Fare affidamento su dati validi nella business analytics, nelle interazioni con i clienti e nella conformità evidenzia l'importanza dell'integrità dei dati in tutta l'organizzazione. Il detto "garbage in, garbage out" è molto rilevante quando si utilizzano i dati per prendere decisioni aziendali valide, trattare i clienti in modo equo e corretto e facilitare report aziendali accurati e conformi alle normative del settore. Dati non validi, una volta resi operativi, portano a risultati indesiderati.

Le organizzazioni devono mantenere i dati completi, accurati, coerenti e sicuri durante il loro intero ciclo di vita. L'integrità dei dati contribuisce a promuovere questa completezza mantenendo tutti gli elementi dei dati intatti, senza alterazioni, troncamenti o perdite e impedendo modifiche che potrebbero distorcere l'analisi e compromettere la coerenza delle condizioni di test. Senza processi di integrità dei dati, le organizzazioni non sarebbero in grado di verificare che i dati futuri corrispondano a quelli passati, indipendentemente dai pattern di accesso. Inoltre, l'integrità dei dati serve a rafforzare la sicurezza dei dati controllando l'accesso e proteggendo dallo sfruttamento non autorizzato tramite strategie di autenticazione, autorizzazione, crittografia e protezione completa dei dati, inclusi backup e registrazione degli accessi.

Al di là dei processi decisionali, l'integrità dei dati è fondamentale per proteggere le informazioni personali e sensibili dei soggetti interessati. Errori nella gestione dei dati dei clienti, dovuti a errori umani o attacchi informatici, possono portare a violazioni della privacy e della fiducia, false dichiarazioni e danni reputazionali potenzialmente gravi. Questo vale anche per i dati proprietari meno sensibili, dove le imprecisioni possono alterare la comprensione e il trattamento degli utenti da parte dell'azienda, influenzando la loro inclusione nelle tendenze e nelle interazioni con il marchio. Garantire l'integrità dei dati, quindi, non è solo un problema operativo o di conformità, ma un imperativo strategico che influisce su ogni aspetto della relazione di un'organizzazione con i propri clienti e sulla sua posizione sul mercato.

Cinque tipi di integrità dei dati

Il concetto centrale dell'integrità dei dati consiste nel garantire l'utilizzabilità di un set di dati per scopi di business analytics. È alla base della stabilità, delle prestazioni, della recuperabilità e della sicurezza dei dati.

Il problema è che i dati possono essere compromessi in vari modi: da errori umani, errori di trasferimento involontari, virus, bug del software, malware, violazione, danni hardware e fisici ai dispositivi. Le organizzazioni possono raggiungere l'integrità utilizzando vincoli di integrità e definendo le regole e le procedure relative all'utilizzo dei dati. I vincoli di integrità riguardano azioni quali l'eliminazione, l'inserimento e l'alterazione delle informazioni, che consentono l'applicazione dell'integrità in sistemi comuni come database di pianificazione delle risorse aziendali (ERP), sistemi di gestione delle relazioni con i clienti (CRM) e sistemi di gestione della supply chain.

Cinque tipi di integrità dei dati aiutano le organizzazioni a verificare e mantenere la qualità dei loro dati:

Integrità dell'entità

Una funzione dei sistemi di database relazionali che memorizza i dati all'interno di tabelle, che possono essere utilizzate e collegate in vari modi. L'integrità dell'entità si basa su chiavi e valori univoci creati per identificare i dati, garantendo che gli stessi dati non vengano elencati più volte e che i campi delle tabelle siano compilati correttamente.

Integrità fisica

Protegge l'accuratezza, la correttezza e la completezza dei dati durante l'archiviazione e il recupero. L'integrità fisica può essere compromessa da interruzioni di corrente, erosione dello storage, hacker e disastri naturali.

Integrità referenziale

Una serie di processi che garantiscono l'archiviazione e l'utilizzo uniforme dei dati. Le strutture di database incorporano regole che impongono la presenza di record corrispondenti nelle tabelle collegate, evitando record orfani e mantenendo la coerenza dei dati in tutto il database.

Integrità del dominio

Un dominio è definito da un insieme specifico di valori per le colonne di una tabella, incluse restrizioni e regole che regolano la quantità, il formato e i dati che possono essere immessi. L'integrità del dominio aiuta a garantire la precisione degli elementi dei dati all'interno di un dominio.

Integrità definita dall'utente

Si ha quando gli utenti creano regole e vincoli sui dati per allinearli alle loro specifiche univoche. Questo metodo viene generalmente impiegato con altri processi che non garantiscono la sicurezza dei dati.

Le differenze tra integrità dei dati, qualità dei dati e sicurezza dei dati

Le differenze tra integrità dei dati, qualità dei dati e sicurezza dei dati

L'integrità, la qualità e la sicurezza dei dati sono concetti fondamentali nella gestione dei dati aziendali e vengono spesso erroneamente usati in modo intercambiabile.

La qualità dei dati si concentra sulle condizioni dei dati in base a fattori quali accuratezza, completezza, unicità e tempestività.

La sicurezza dei dati riguarda la protezione dei dati da accessi non autorizzati, violazioni e altre forme di cattiva condotta. Comprende le tecnologie, le politiche e le pratiche implementate per salvaguardare i dati durante il loro intero ciclo di vita, garantendo che solo il personale autorizzato possa accedere alle informazioni sensibili per garantire riservatezza e fiducia.

L'integrità dei dati è il principio generale che include elementi di qualità e sicurezza dei dati. Serve a verificare l'accuratezza e la coerenza dei dati durante il loro intero ciclo di vita, dalla creazione all'archiviazione, fino al recupero e all'eliminazione, applicando regole e standard che impediscono l'alterazione non autorizzata dei dati. I meccanismi di integrità dei dati aiutano a garantire che i dati non solo siano corretti e accessibili, ma anche protetti da manomissioni non autorizzate, supportando così la conformità alle normative di settore e governative.

Esempi di applicazione dell'integrità dei dati in diversi settori

Esempi di applicazione dell'integrità dei dati in diversi settori

L'integrità dei dati è una preoccupazione in tutti i settori, ognuno dei quali adotta pratiche e standard unici per salvaguardare i propri dati. L'industria farmaceutica deve rispettare le rigorose linee guida stabilite da organismi di regolamentazione come la Food and Drug Administration (FDA) degli Stati Uniti. La bozza di linee guida della FDA (link esterno a ibm.com) per i produttori farmaceutici pone l'accento sulla conformità ai codici e alle normative federali per certificare che i farmaci siano prodotti in modo coerente e siano tracciabili, sicuri per il consumo ed efficaci. Allo stesso modo, standard internazionali come ISO 13485 (link esterno a ibm.com) per i dispositivi medici sottolineano l'importanza globale dell'integrità dei dati nella produzione, per garantire che i prodotti soddisfino i più elevati standard di sicurezza e qualità.

Nel settore finanziario, la Financial Industry Regulatory Authority (FINRA) ha riconosciuto la necessità di solide misure di integrità dei dati, in particolare nei sistemi di trading automatizzato e di sorveglianza dei movimenti di denaro. Le iniziative della FINRA (link esterno a ibm.com) per sviluppare ed espandere i programmi di integrità dei dati riflettono uno sforzo più ampio del settore nel proteggere le transazioni finanziarie e le informazioni sensibili dei clienti, che è fondamentale per mantenere la fiducia e la conformità in un ambiente fortemente regolamentato.

Anche le industrie minerarie e manifatturiere si stanno concentrando sempre di più sull'integrità dei dati all'interno dei loro sistemi di automazione e monitoraggio della produzione. L'obiettivo è garantire che i dati che guidano le decisioni operative e i miglioramenti dell'efficienza siano accurati e affidabili e che evitino errori costosi e migliorino la competitività.

I provider di database di cloud storage devono affrontare sfide uniche nel mantenere l'integrità e la provenienza dei dati dei clienti. Con la crescente dipendenza dai servizi cloud per l'archiviazione e l'elaborazione dei dati, questi fornitori devono implementare misure sofisticate per tracciare e prevenire le violazioni dei dati, garantendo che le informazioni dei loro clienti rimangano protette e inalterate.

Esempi specifici di applicazioni per l’integrità dei dati includono anche l’assistenza sanitaria, dove gli errori nelle cartelle cliniche elettroniche possono avere conseguenze disastrose. Nel settore finanziario, l'accuratezza dei dati delle transazioni è fondamentale per la valutazione del rischio e il rilevamento delle frodi, con pratiche come i protocolli KYC (know-your-customer) che svolgono un ruolo critico nella verifica delle informazioni sui clienti e nel mantenimento della conformità normativa. Le istituzioni scolastiche dipendono dalla precisione dei dati degli studenti per la gestione delle iscrizioni, il monitoraggio dei percorsi accademici e l'allocazione delle risorse.

Strategie di gestione dei dati all'interno di un'organizzazione 

Strategie di gestione dei dati all'interno di un'organizzazione 

Garantire l'integrità dei dati nelle organizzazioni aziendali non è un'attività una tantum, ma un impegno continuo che richiede una strategia olistica che coinvolga tecnologia, processi e persone per convalidare al meglio i dati. Le seguenti strategie e best practice proteggono gli asset di dati e consentono alle organizzazioni di sfruttare i dati con sicurezza per il processo decisionale e l'innovazione.

Inserimento dati

L'implementazione di controlli sull'integrità dei dati il più vicino possibile al punto di ingresso dei dati, ad esempio un essere umano alla tastiera o un'applicazione che trasmette dati, limita e specifica il tipo di informazioni che possono entrare nel database.

Vincoli di integrità

Il grande numero di vulnerabilità dei dati sottolinea l'importanza di un approccio completo alla protezione dei dati. La gestione dell'integrità dei dati all'interno di un'organizzazione è garantita da un ampio spettro di politiche, linee guida e regole chiamate vincoli di integrità, che coprono i diversi aspetti della gestione dei dati, dalla conservazione alle relazioni tra i diversi dati e le persone che lavorano con essi.

I vincoli di integrità sono legati ai tipi di modello di dati relazionali: entità, referenziale, dominio e definito dall'utente. Ad esempio, i vincoli di dominio limitano il tipo di valori che una colonna può contenere, quindi una colonna "età" potrebbe accettare solo numeri interi compresi tra 1 e 120.

L'integrità dell'entità fornisce istruzioni in modo che ogni riga di una tabella sia unica e identificabile, in genere applicata da una chiave primaria, il che significa che esiste un identificatore univoco per ogni riga di una tabella di database. 

I vincoli di integrità garantiscono anche che le relazioni tra le tabelle siano chiaramente definite e mantenute tramite chiavi esterne, che sono colonne o gruppi di colonne di una tabella che fanno riferimento alla chiave primaria di un'altra tabella. 

Questi vincoli confermano che i dati di ciascun campo sono conformi ai formati e ai valori specificati e che sono rispettate tutte le regole aggiuntive adattate alle specifiche esigenze dell'organizzazione.

Conservazione dei dati

Le linee guida e le politiche di conservazione specificano per quanto tempo i dati devono essere conservati in un database per garantire la coerenza e minimizzare gli errori derivanti da informazioni datate. Il data backup può proteggere dalla perdita di dati e fornire una soluzione di sicurezza in caso di guasti del sistema, danneggiamento dei dati o altri incidenti imprevisti che potrebbero compromettere l'integrità dei dati. Una strategia backup efficace dovrebbe includere snapshot regolari dei dati archiviati in posizioni sicure e geograficamente distribuite per confermare che i dati possano essere ripristinati con una perdita minima.

Accesso, sicurezza e integrità fisica

Anche la connettività e l’accesso ai dati svolgono un ruolo fondamentale nel mantenere l’integrità dei dati. Garantire una connettività perfetta tra le diverse origini dati e i diversi sistemi consente un flusso coerente di informazioni all'interno dell'organizzazione. 

La gestione dell'accesso ai dati aiuta a garantire che solo il personale autorizzato possa modificare o interagire con i dati per ridurre il rischio di manomissione accidentale o intenzionale dei dati.

Inoltre, anche una vigilanza continua all’interno dell’organizzazione aiuta a preservare l’integrità dei dati. Altri fattori importanti sono un controllo regolare degli errori, la consapevolezza in materia di cybersecurity e una comunicazione chiara tra i membri del team sull'importanza di disporre di dati accurati.

Le organizzazioni devono garantire l'integrità fisica dei dati, utilizzando misure come gruppi di continuità e hardware ridondante.  

Strumenti

Una volta raccolti i dati, pratiche rigorose di gestione dei database possono far rispettare regole che impediscono la creazione di dati duplicati. Sfruttare tecnologie come gli strumenti di data lineage, che tracciano l'origine e le trasformazioni dei dati, per le prove di audit, i cataloghi di dati che offrono funzioni di sicurezza per il controllo degli accessi, rigorosi processi di convalida dell'input e un moderno sistema di database per aiutare a prevenire le violazioni dell'integrità. 

I sistemi di database sono dotati di funzioni che supportano i vincoli di integrità, scaricando la responsabilità di verificare l'accuratezza al database stesso. Ad esempio, meccanismi come le relazioni principale/secondario illustrano come i processi di integrità referenziale gestiti a livello di database possano salvaguardare automaticamente l'integrità dei dati, contribuendo a garantire che le relazioni tra i record siano preservate, evitando record orfani e cancellazioni non autorizzate.

Strumenti di convalida dei dati come IBM Databand e Ataccama sono un passo essenziale per ottenere accuratezza, coerenza e completezza. Gli strumenti di convalida aiutano a identificare discrepanze o anomalie che potrebbero indicare problemi. Una volta integrati in un sistema di gestione dei dati, questi strumenti verificano continuamente la qualità e l'integrità dei dati.

Questo approccio centralizzato aiuta a mantenere stabili i sistemi di gestione dei dati, garantendo il riutilizzo e la facilità di manutenzione dei dati tra le diverse applicazioni.

Formazione e cultura

Un'azienda desiderosa di promuovere una cultura che dia priorità all'accuratezza e alla sicurezza dei dati deve educare i leader aziendali e i dipendenti sui rischi dell'utilizzo di dati non sicuri o non validi.

Soluzioni correlate

Soluzioni correlate

IBM Databand

IBM Databand è un software di osservabilità per pipeline di dati e warehouse che raccoglie automaticamente i metadati per creare linee di base cronologiche, rilevare anomalie e valutare gli avvisi per correggere i problemi di qualità dei dati.

Esplora Databand

IBM DataStage

Supportando i modelli ETL ed ELT, IBM DataStage offre un'integrazione dati flessibile e quasi in tempo reale, sia on-premise che nel cloud.

Esplora DataStage

IBM Knowledge Catalog

Catalogo intelligente di dati per l'era dell'AI, IBM Knowledge Catalog ti consente di accedere, rendere accurati, categorizzare e condividere i dati, gli asset di conoscenza e le loro relazioni, ovunque si trovino.

Esplora il catalogo conoscenze
Risorse correlate

Risorse correlate

Cos'è la gestione dei dati

Scopri di più sulla pratica di acquisire, elaborare, proteggere e archiviare i dati della tua organizzazione per renderli utilizzabili con l’obiettivo di ottenere migliori risultati aziendali.

Cos'è il data lineage?

Scopri in che modo gli strumenti di lineage forniscono un record dei dati durante il loro intero ciclo di vita, consentendo alle organizzazioni di convalidarne l’accuratezza e la coerenza.

Che cos'è la governance dei dati?

La governance dei dati favorisce la disponibilità, la qualità e la sicurezza dei dati di un’organizzazione attraverso politiche e criteri diversi. Questi processi determinano i responsabili dei dati, le misure di sicurezza e gli usi previsti per i dati.

Fai il passo successivo

Implementa oggi stesso l'osservabilità proattiva dei dati con IBM Databand, in modo da individuare un problema di integrità dei dati prima che lo facciano i tuoi utenti.

Esplora Databand Prenota una demo live