Home
topics
Qualità dei dati
La qualità dei dati stabilisce in che misura un set di dati soddisfa i criteri di accuratezza, completezza, validità, coerenza, unicità, tempestività e idoneità allo scopo ed è fondamentale per tutte le iniziative di governance dei dati all'interno di un'organizzazione.
Gli standard di qualità dei dati garantiscono che le aziende prendano decisioni basate sui dati per raggiungere i propri obiettivi aziendali. Se i problemi relativi ai dati, come dati duplicati, missing values e outlier, non vengono risolti correttamente, le aziende aumentano il rischio di risultati aziendali negativi. Secondo un report di Gartner, una scarsa qualità dei dati costa alle organizzazioni una media di 12,9 milioni di dollari all'anno 1. Proprio per questo motivo, sono emersi strumenti di qualità dei dati per mitigare l'impatto negativo associato alla scarsa qualità dei dati.
Quando la qualità dei dati soddisfa gli standard per l'uso previsto, i consumatori di dati possono fidarsi dei dati e sfruttarli per migliorare il processo decisionale, portando allo sviluppo di nuove strategie aziendali o all'ottimizzazione di quelle esistenti. Tuttavia, quando uno standard non viene soddisfatto, gli strumenti di qualità dei dati forniscono un valore aggiunto aiutando le aziende a diagnosticare i problemi di fondo dei dati. Un'analisi delle cause principali consente ai team di risolvere i problemi di qualità dei dati in modo rapido ed efficace.
La qualità dei dati non è solo una priorità per le operazioni aziendali quotidiane: man mano che le aziende integrano le tecnologie di intelligenza artificiale (AI) e di automazione nei loro flussi di lavoro, i dati di alta qualità saranno fondamentali per l'adozione efficace di questi strumenti. Come dice il vecchio detto: "garbage in, garbage out". E questo vale anche per gli algoritmi di apprendimento automatico. Se l'algoritmo sta imparando a prevedere o classificare in base a dati errati, possiamo aspettarci che produca risultati imprecisi.
Scopri gli elementi costitutivi e le best practice per aiutare i tuoi team ad accelerare l’AI responsabile.
La qualità, l'integrità e la profilazione dei dati sono tutte correlate tra loro. La qualità dei dati è una categoria più ampia di criteri che le organizzazioni utilizzano per valutare l'accuratezza, la completezza, la validità, la coerenza, l'unicità, la tempestività e l'idoneità allo scopo dei loro dati. L'integrità dei dati si concentra solo su un sottoinsieme di questi attributi, in particolare accuratezza, coerenza e completezza. Inoltre, si concentra maggiormente su questo aspetto dal punto di vista della sicurezza dei dati, implementando misure di protezione per prevenire la corruzione dei dati da parte di soggetti malintenzionati.
La profilazione dei dati, invece, si concentra sul processo di revisione e pulizia dei dati per mantenere gli standard di qualità dei dati all'interno di un'organizzazione. Ciò può comprendere anche la tecnologia che supporta questi processi.
La qualità dei dati viene valutata in base a diverse dimensioni, che possono variare a seconda della fonte delle informazioni. Queste dimensioni vengono utilizzate per categorizzare le metriche della qualità dei dati:
Queste metriche aiutano i team a condurre valutazioni della qualità dei dati all'interno delle loro organizzazioni per valutare il livello di informazione e utilità dei dati per un determinato scopo.
Nell'ultimo decennio, gli sviluppi nell'ambito del cloud ibrido, dell'intelligenza artificiale, dell'Internet of Things (IoT) e dell'edge computing hanno portato a una crescita esponenziale dei big data. Di conseguenza, la pratica del master data management (MDM) è diventata più complessa e richiede più amministratori dei dati e garanzie rigorose per assicurare una buona qualità dei dati.
Le aziende si affidano alla gestione della qualità dei dati per supportare le loro iniziative di analisi dei dati, come le dashboard di business intelligence. In caso contrario, le conseguenze possono essere devastanti, anche dal punto di vista etico, a seconda del settore (ad esempio, quello sanitario). Le soluzioni per la qualità dei dati servono ad aiutare le aziende a massimizzare l'uso dei propri dati e hanno apportato vantaggi chiave, come:
Consulta una guida IBM sugli elementi costitutivi della governance e della privacy dei dati.
Grazie agli esperti che hanno redatto questa guida, imparerai passo dopo passo come adottare un approccio valoriale alla qualità dei dati e alle pratiche di AI.
IBM è stata nominata Leader per il diciottesimo anno consecutivo nel Gartner Magic Quadrant™ 2023 nella categoria Data Integration Tools
1 Gartner, "How to Improve Your Data Quality" (link esterno a ibm.com), 14 luglio 2021