Che cos'è la governance dei dati?

Che cos'è la governance dei dati?

La governance dei dati è la disciplina di gestione dei dati che si concentra sulla qualità, la sicurezza e la disponibilità dei dati di un'organizzazione. La governance dei dati contribuisce a garantire l'integrità e la sicurezza dei dati definendo e implementando politiche, standard e procedure per la raccolta, la proprietà, lo storage, l'elaborazione e l'utilizzo dei dati.

L'obiettivo della governance dei dati è mantenere dati sicuri e di alta qualità, che siano facilmente accessibili per la data discovery, le iniziative di business intelligence e i progetti di AI. Agendo un po' come un hub per il controllo del traffico aereo, la funzione di governance dei dati aiuta a garantire che i dati verificati fluiscano attraverso pipeline sicure verso endpoint affidabili.

Le attività di intelligenza artificiale (AI), big data e trasformazione digitale sono le principali forze trainanti dei programmi di governance dei dati. Con l'aumento del volume di dati provenienti da nuove fonti come le tecnologie Internet of Things (IoT), le organizzazioni stanno riconsiderando le pratiche di gestione e i principi di governance dei dati. Adottare le pratiche e i principi giusti può aiutare le organizzazioni a scalare gli sforzi di business intelligence (BI) e a prendere decisioni più informate.

I rapidi sviluppi dell'AI aziendale hanno richiesto anche nuove strategie per la governance dei dati. Sempre più, i programmi di governance devono considerare i dati strutturati e non strutturati che fungono da input o output dei sistemi RAG, dei database vettoriali e degli agenti AI.

I programmi di governance dei dati robusti possono aiutare le organizzazioni a proteggere e gestire grandi quantità di dati migliorandone la qualità, riducendo i silo, applicando le politiche di conformità e sicurezza e distribuendo l'accesso in modo appropriato.

Governance dei dati vs. gestione dei dati

La governance dei dati è un sottoinsieme della gestione dei dati, che è la pratica generale di raccolta, elaborazione e utilizzo dei dati in modo sicuro ed efficiente per supportare il processo decisionale strategico e migliorare i risultati aziendali.

La gestione dei dati include non solo la loro governance, ma comprende anche altre aree del loro ciclo di vita come il trattamento, lo storage e la sicurezza. Inoltre, i vari aspetti del processo di gestione dei dati si influenzano a vicenda.

Poiché anche queste altre aree della gestione dei dati possono influire sulla governance dei dati, vari team devono collaborare per progettare e seguire una strategia di governance dei dati.

Ad esempio, un team di governance dei dati potrebbe identificare le somiglianze tra set di dati eterogenei. Se vogliono integrare quei dati, di solito collaborano con un team di gestione dei dati per definire il modello e l'architettura dei dati per facilitare tali collegamenti. Strategie diverse potrebbero essere appropriate per i dati cloud rispetto a quelli in hosting on-premise.

Un altro esempio è l'accesso ai dati, in cui un team di governance dei dati potrebbe stabilire le politiche relative all'accesso a tipi specifici di dati, come le informazioni di identificazione personale (PII). Quindi, un team di gestione dei dati fornirà direttamente tale accesso o creerà il meccanismo per fornire tale accesso, spesso tramite il controllo degli accessi basato sui ruoli (RBAC). Ottenere le giuste autorizzazioni di accesso è ancora più importante in un'epoca in cui, sempre più spesso, un agente AI piuttosto che un dipendente umano accede ai dati.

Framework di governance dei dati

Un framework di governance dei dati illustra le strutture e i processi di un'organizzazione per la gestione degli asset di dati critici. Definisce la proprietà e le responsabilità dei dati e specifica il modo in cui i dati devono essere gestiti per mantenere gli standard di qualità, la sicurezza e la conformità dei dati.

Non esiste un framework valido per tutti, in quanto i framework sono in genere roadmap su misura per i sistemi di dati, le fonti di dati, i protocolli di settore e le normative del governo unici di una particolare organizzazione.
E i vecchi framework possono diventare obsoleti rapidamente. I framework devono tenere sempre più conto dell'AI, dei sistemi multicloud e degli ambienti di dati in rapida evoluzione.

I framework di governance dei dati riguardano di solito elementi come:

  • Obiettivi, ruoli e doveri del programma
  • Standard, politiche e processi dei dati
  • Procedure di revisione
  • Strumenti di governance dei dati

Obiettivi, ruoli e doveri del programma

I programmi di governance dei dati in genere definiscono un obiettivo o una serie di obiettivi specifici, come migliorare la qualità dei dati, sostenere la conformità o consentire un processo decisionale basato sui dati. Selezionano inoltre metriche per misurare i progressi verso questi obiettivi. Le metriche di governance chiave possono includere:

  • Riduzione degli errori e della ridondanza dei dati.

  • Riduzione dei costi grazie a una maggiore efficienza e a un time-to-market più rapido.

  • Coerenza e completezza dei dati.

  • Il livello di alfabetizzazione dei dati e la conformità dei processi dei dipendenti.

I programmi di governance definiscono anche i ruoli e le responsabilità di tutte le parti coinvolte: comitato direttivo, proprietari dei dati, responsabili dei dati e stakeholder.

  • I membri del comitato direttivo, o consiglio di governance, supervisionano la strategia di governance dei dati e la direzione generale del framework. Questo comitato include spesso dirigenti di alto livello, come dirigenti di livello C o VP, che supervisionano vari dipartimenti.

  • I proprietari dei dati supervisionano i domini di dati specifici delle unità di business. Queste persone sono responsabili del mantenimento dell'accuratezza, della qualità e della coerenza dei dati, e offrono input sulle soluzioni di governance dei dati, sulle politiche dei dati e sui requisiti normativi.

  • I data steward si occupano della gestione quotidiana di domini di dati specifici.

  • Gli stakeholder e i team aziendali sono i consumatori dei dati aziendali.

Standard, politiche e processi dei dati

I framework di governance stabiliscono i parametri relativi ai dati da governare e ai risultati desiderati. Questo processo include la definizione di linee guida per formati di dati, modelli di dati, gestione dei dati principale (MDM), metadati, convenzioni di denominazione e altro ancora. 

I framework di governance spesso mappano i flussi di dati e definiscono il modo in cui i dati verranno raccolti, memorizzati, duplicati, spostati e archiviati. Possono anche individuare l'hardware, il software e i servizi che supporteranno le attività di governance e la più ampia architettura dei dati dell'organizzazione.

Alcuni framework di governance potrebbero definire degli ambiti di dati, che sono parametri di accesso per asset di dati specifici, come dati master, metadati e dati storici. L'accesso ai dati può contribuire a garantire che utenti e applicazioni abbiano accesso solo ai dati di cui hanno bisogno e che nessuno abbia accesso a dati a cui non dovrebbe.

Procedure di revisione

I framework di governance delineano le procedure di test, revisione e conservazione dei registri per mantenere la trasparenza e la spiegabilità del programma di governance.

Audit regolari o continui possono aiutare a verificare in tempo reale che gli utenti rispettino il framework di governance dei dati. Gli audit possono inoltre aiutare a individuare i modi in cui il programma di governance deve evolversi per tenere conto di nuovi dati, processi o tecnologie.

Infine, gli audit possono anche aiutare le organizzazioni a raggiungere e dimostrare la conformità normativa.

Strumenti di governance dei dati

La tecnologia svolge un ruolo importante per un'efficace governance dei dati. Gli strumenti di governance dei dati aziendali possono variare da piattaforme complete a soluzioni puntuali specializzate. Le organizzazioni scelgono strumenti diversi a seconda dei propri framework e delle proprie architetture dati.

Alcune delle funzionalità più comuni delle soluzioni di governance dei dati includono:

  • Data discovery e classificazione automatica dei dati.

  • Regole di protezione dei dati e controllo di accesso basato sul ruolo.

  • Soddisfa i requisiti di conformità e privacy.

  • Automazione della gestione dei metadati, della catalogazione dei dati e del tracciamento del data lineage.

  • Supporto per un glossario aziendale.

Le soluzioni di governance dei dati possono gestire vari formati di dati. Alcune offrono funzionalità per migliorare la comprensione di relazioni e set di dati complessi, facilitando l'individuazione di tendenze, outlier e aree che richiedono attenzione.
Sempre più spesso, le soluzioni di governance dei dati possono aiutare a gestire i dati utilizzati nelle pipeline di AI.

AI Academy

È la gestione dei dati il segreto dell’AI generativa?

Scopri perché i dati di alta qualità sono fondamentali per un uso efficace dell'AI generativa.

Vantaggi della governance dei dati

L'implementazione di un solido framework di governance dei dati può aiutare le organizzazioni a ottenere un'ampia gamma di benefici:

  • Ottieni più valore dai dati aziendali
  • Promuovi innovazione ed efficienza
  • Fornisci una singola fonte affidabile (SSOT)
  • Aiuta a garantire la sicurezza, la conformità e la privacy dei dati
  • Utilizza i dati in modo sicuro per le iniziative di AI
  • Abilita analytics di più accurata

Ottieni più valore dai dati aziendali

Le organizzazioni non possono prendere decisioni aziendali efficaci se tali decisioni si basano su dati errati. La governance dei dati può aiutare a garantire l'integrità, l'accuratezza, la completezza e la coerenza dei dati attraverso la creazione di un framework che supporti una solida gestione dei dati, un solido processo di gestione dei dati end-to-end.

Dati affidabili aiutano le organizzazioni a scoprire nuove opportunità, conoscere meglio i propri clienti e workflow e ottimizzare le prestazioni complessive.

L'assenza di governance dei dati potrebbe portare a errori nelle metriche delle prestazioni, indirizzando un'organizzazione nella direzione sbagliata. Nel frattempo, gli strumenti di governance dei dati possono aiutare a correggere le inesattezze prima ancora che influenzino la strategia aziendale.

Ad esempio, gli strumenti di data lineage possono aiutare i proprietari dei dati a tracciare i dati durante tutto il loro ciclo di vita, incluse le trasformazioni subite durante i processi di estrazione, trasformazione, caricamento (ETL) o di estrazione, caricamento, trasformazione (ELT). Questa funzione consente alle organizzazioni di identificare e risolvere le cause principali degli errori nei dati.

Promuovi innovazione ed efficienza

Quando all'interno di un'organizzazione l'accesso ai dati è limitato, questo può limitare l'innovazione, creare dipendenze dagli esperti in materia (SME) e rallentare i processi aziendali.

I programmi di governance dei dati distribuiscono l'accesso ai dati in modo appropriato, dando a ciascun dipartimento o individuo l'accesso solo ai dati di cui ha bisogno. Questo processo consente ai team interfunzionali di lavorare insieme in modo più stretto ed efficiente, mantenendo i dati al sicuro. 

Fornisci una singola fonte affidabile (SSOT)

Un sistema di dati governati può garantire una singola fonte affidabile per l'intera organizzazione. Il processo decisionale può essere migliorato quando tutte le parti lavorano con gli stessi set di dati.

Centralizzare i metadati e le definizioni dei dati in un unico catalogo di dati può aiutare a ridurre la confusione e le inefficienze. Questa documentazione, a sua volta, diventa la base per soluzioni self-service che consentono dati e accesso ai dati coerenti in tutta l'organizzazione.

Aiuta a garantire la sicurezza, la conformità e la privacy dei dati

Le politiche di governance dei dati spesso includono operazioni per soddisfare più facilmente i requisiti delle normative governative in materia di dati sensibili e privacy, come il Regolamento generale sulla protezione dei dati (GDPR) dell'UE, l'Health Insurance Portability and Accountability Act (HIPAA) degli Stati Uniti e i requisiti del settore come i Payment Card Industry Data Security Standards (PCI DSS). Negli ultimi anni si è assistito anche all'avvento di normative incentrate sull'AI che includono componenti con caratteristiche relative ai dati; ne sono esempi l'EU AI Act, l'EU Data Act e il DORA. La violazione di questi requisiti normativi può comportare pesanti sanzioni da parte delle autorità governative e ripercussioni sull'opinione pubblica.

Gli strumenti di governance dei dati aiutano le organizzazioni a stabilire guardrails in grado di prevenire fughe, usi impropri e violazioni, dei dati.I framework di governance aiutano a costruire sistemi di dati che sono chiari, spiegabili, equi e inclusivi. A loro volta, questi sistemi di dati salvaguardano la privacy e la sicurezza e mantengono la fedeltà e la fiducia dei clienti.

Utilizza i dati in modo sicuro per le iniziative di AI

In un sondaggio IDC, solo il 45,3% degli intervistati ha dichiarato di avere regole e processi per far rispettare i principi di AI responsabile per proteggere da violazioni di sicurezza, problemi di responsabilità e rischi normativi.1

La governance dei dati implica la conoscenza dell'origine, della sensibilità e del ciclo di vita di tutti i dati utilizzati da un'organizzazione. Questa comprensione è la base di qualsiasi pratica di governance dell'AI ed è fondamentale per mitigare vari rischi aziendali.

La governance dei dati aiuta le organizzazioni a portare dati di alta qualità alle iniziative di AI e apprendimento automatico (ML), tutelando al contempo i dati e conformandosi alle norme e ai regolamenti pertinenti. Ad esempio, gli strumenti di governance possono aiutare a garantire che i dati personali sensibili non vengano forniti a un'AI quando non dovrebbero.

Abilita analytics di più accurata

Avere i dati giusti è la base per iniziative avanzate di analytics dei dati e data science. I dati governati con cura consentono iniziative preziose come i report di business intelligence o progetti di apprendimento automatico (ML) più complessi.

Ad esempio, una corretta profilazione dei dati, ovvero la revisione e la pulizia dei dati per capire meglio come sono strutturati, può aiutare a dare un senso migliore alla relazione tra diversi set di dati e fonti.

Le sfide della governance dei dati

Le iniziative di governance dei dati possono incontrare molti ostacoli nell'implementazione. Alcune di queste sfide includono:

  • Mancanza di sponsorizzazione adeguata
  • Architettura dati incoerente
  • Visibilità e controllo sui dati
  • Aumento della richiesta di accesso
  • Requisiti in materia di dati AI

Mancanza di sponsorizzazione adeguata

Efficaci programmi di governance dei dati richiedono generalmente la sponsorizzazione a due livelli: dirigenti e singoli collaboratori. I Chief data officer (CDO) e i data steward sono fondamentali per la comunicazione e la prioritizzazione della governance dei dati all'interno di un'organizzazione.

I CDO possono fornire una supervisione e imporre la responsabilità ai team di dati per aiutare a garantire l'adozione delle politiche di governance dei dati. I data steward possono contribuire a promuovere la consapevolezza di queste politiche presso i produttori e i consumatori di dati per incoraggiare la conformità in tutta l'organizzazione.

Senza una sponsorizzazione adeguata, gli utenti dei dati potrebbero non essere a conoscenza o non essere interessati alle politiche di governance. Questa situazione può portare a non conformità, scarsa integrità dei dati e compromissione della sicurezza dei dati.

Architettura dati incoerente

Senza gli strumenti e l'architettura dei dati corretti, le organizzazioni potrebbero avere difficoltà nell'implementazione di un efficace programma di governance dei dati.

Ad esempio, i team potrebbero scoprire dati ridondanti in diverse funzioni. Per consentire una governance efficace, i data architect devono sviluppare modelli e architetture di dati appropriati per unire e integrare i dati tra i sistemi di storage.

I team potrebbero anche dover adottare un catalogo di dati per creare un inventario degli asset di dati in un'organizzazione. Oppure, se ne hanno già uno, potrebbe essere necessario creare un processo per la gestione dei metadati, che aiuti a garantire che i dati sottostanti siano pertinenti e aggiornati.

Visibilità e controllo sui dati

La governance dei dati, specialmente negli ambienti ibridi e multicloud, spesso coinvolge dati memorizzati in più formati su più provider e sedi. Inoltre, i dati potrebbero risiedere in diversi tipi di archivi dati, come data lake, data lakehouse e data warehouse.

Shadow IT può offrire un'ulteriore chiave al processo. In uno studio di TechTarget, la seconda sfida più comune segnalata in materia di sicurezza dei dati era che i dipendenti si iscrivevano ad applicazioni e servizi cloud senza l'approvazione dell'IT.2

Questa distribuzione dei dati può rendere difficile tenere traccia e monitorare i flussi di dati e l'utilizzo dei dati. La governance dei dati richiede una chiara conoscenza delle fonti di dati, delle destinazioni, delle trasformazioni, delle dipendenze, della proprietà, dei diritti di accesso e delle responsabilità.

L'applicazione delle politiche di governance dei dati in più ambienti potrebbe richiedere il coordinamento tra i diverse stakeholder, come proprietari dei dati, data steward, consumatori di dati e regolatori dei dati.

Aumento della richiesta di accesso

La crescita dell'analytics self-service e della business intelligence presenta nuove sfide per la governance dei dati.

Le richieste di accesso da parte di un maggior numero di utenti arrivano più velocemente di prima, ma i team di governance devono bilanciare velocità e accessibilità con problemi di privacy e sicurezza. Inoltre, i sistemi e le procedure di streaming dei dati devono essere finemente regolati per evitare la perdita di dati.

Requisiti in materia di dati AI

Quando si forniscono i dati che alimentano l'addestramento e le operazioni di AI, numerosi strumenti di data storage e governance dei dati non sono all'altezza.

Dopotutto, l'AI è intrinsecamente più complessa rispetto ai processi e alle funzionalità IT standard, il che aumenta l'importanza di una governance dei dati attiva e informata. Un report di KPMG evidenzia il divario nella governance dell'AI come uno dei principali rischi che attualmente minacciano le aziende.3Ad esempio, senza guardrail adeguati, l'AI potrebbe inavvertitamente esporre PII sensibili o segreti aziendali. Tali esposizioni possono essere tanto più costose in un'epoca di crescente regolamentazione relativa all'AI (come l'AI Act dell'UE, adottato nel giugno 2024).

Per ridurre i rischi e le complessità dell'AI, le organizzazioni possono combinare funzionalità ottimizzate di data storage per l'AI con programmi di governance dei dati ideati pensando all'AI.

Best practice di governance dei dati

La pianificazione e la creazione di un framework di governance dei dati richiedono tempo e impegno tra più stakeholder e team. Le pratiche comuni utilizzate dalle organizzazioni per l'implementazione dei programmi di governance includono:

  • Automatizzazione per una maggiore efficienza
  • Bilanciamento di comodità e sicurezza dei dati
  • Creazione di un catalogo dati
  • Utilizzo di modelli di maturità
  • Monitoraggio e miglioramento costanti

Automatizzazione per una maggiore efficienza

L'automazione di alcune parti del processo di governance dei dati può aiutare a migliorare l'efficienza e ridurre gli errori. Gli strumenti di gestione e governance dei dati possono aiutare ad automatizzare le attività di routine come:

  • Costruire data lineage per aiutare a visualizzare il flusso di dati attraverso i sistemi senza la necessità di soluzioni complesse codificate a mano.

  • Propagazione delle politiche per assegnare tag di metadati a elementi di dati specifici, come colonne o tabelle, per individuarli come informazioni sensibili.

  • Generazione di registri di audit per registrare le interazioni con i dati, per scoprire in che modo i dipendenti utilizzano i dati.

La classificazione dei dati si basa su categorie predefinite come PII, dati finanziari, proprietà intellettuale o informazioni riservate.

Bilanciamento di comodità e sicurezza dei dati

Una solida sicurezza dei dati e controlli di accesso sono fondamentali per qualsiasi framework di governance dei dati. Allo stesso tempo, le organizzazioni vogliono che l'accesso ai dati sia il più semplice possibile per gli utenti autorizzati a vedere e utilizzare specifici set di dati. Senza questo facile accesso alle informazioni self-service, la collaborazione e i nuovi insight risultano ostacolati.

Creazione di un catalogo dati

Numerose organizzazioni hanno difficoltà a gestire i propri dati a causa della mancanza di visibilità. Un catalogo centrale di dati può avere funzione di singola fonte affidabile, consentendo iniziative di integrazione e governance dei dati.

Secondo un report di Gartner, la domanda di cataloghi di dati è in aumento in quanto le organizzazioni hanno difficoltà a trovare, inventariare e analizzare asset di dati distribuiti e diversificati. Con un solido catalogo di dati, le organizzazioni possono individuare e classificare più facilmente le informazioni su larga scala, consentendo una migliore applicazione delle politiche di governance dei dati.

Utilizzo di modelli di maturità

Numerose organizzazioni trovano utile creare una chiara roadmap per la governance. I modelli di maturità possono offrire questa roadmap.

Un modello di maturità per la governance dei dati è uno strumento che aiuta le organizzazioni a valutare lo stato attuale del proprio programma di governance, fissare obiettivi e monitorare i progressi nel tempo.

Monitoraggio e miglioramento costanti

Le organizzazioni possono stabilire meccanismi regolari di valutazione e reporting per monitorare i dati e le metriche di governance nel tempo. Queste valutazioni possono aiutare l'organizzazione a individuare i problemi e a migliorare i processi di governance.

Rivedere regolarmente il framework e adattarlo in base al feedback, alle nuove normative o alle modifiche nella strategia aziendale aiuta il framework a rimanere pertinente ed efficace.

Inoltre, le valutazioni possono promuovere una cultura che valorizzi i dati come asset strategico, supportando una business intelligence efficace e l'uso quotidiano dei dati in tutta l'organizzazione.

Autori

Jim Holdsworth

Staff Writer

IBM Think

Matthew Kosinski

Staff Editor

IBM Think

David Zax

Staff Writer

IBM Think

Soluzioni correlate
IBM watsonx.governance

Metti all'opera un'AI affidabile monitorando i modelli, gestendo i rischi e facendo rispettare la governance in tutto il ciclo di vita dell'AI.

Esplora watsonx.governance
Soluzioni di governance dei dati

Acquisisci il controllo dei tuoi dati con strumenti di governance che migliorano la qualità, garantiscono la conformità e abilitano analytics e AI.

Esplora le soluzioni di governance dei dati
Consulenza sulla governance dell'AI

Stabilisci pratiche di AI responsabile con la guida degli esperti per gestire i rischi, rispettare le normative e rendere operativa un'AI affidabile su larga scala.

Esplora la consulenza sulla governance dell'AI
Fasi successive

Dirigi, gestisci e monitora la tua AI attraverso un portfolio unificato, accelerando risultati responsabili, trasparenti e spiegabili.

  1. Esplora watsonx.governance
  2. Esplora le soluzioni di governance dell'AI
Note a piè di pagina

1 IDC MarketScape: valutazione dei fornitori 2023 delle piattaforme di governance dell'AI a livello mondiale. IDC.  2023. 

2 The Need for Data Compliance in Today’s Cloud Era, Enterprise Strategy Group de TechTarget, abril 2023. (PDF).

3 Top risk forecast, KPMG, 2024.