Che cosa sono i metadati?

Immagine geometrica di piccole scatole grigie, blu e bianche di varie dimensioni

Autori

Annie Badman

Staff Writer

IBM Think

Matthew Kosinski

Staff Editor

IBM Think

Che cosa sono i metadati?

I metadati sono informazioni, come l'autore, la data di creazione o le dimensioni del file, che descrivono un punto dati o un set di dati. I metadati possono migliorare le funzioni di un sistema di dati e facilitare la ricerca, l'organizzazione e l'utilizzo dei dati.

La definizione semplice di metadati è "dati sui dati". Questo significa che offre dettagli sui dati separati dal contenuto dei dati stessi. Ad esempio, una tabella di ordini recenti dei clienti costituisce un set di dati, mentre le informazioni su tale set di dati, ad esempio chi lo possiede o di che tipo di file si tratta, sono i metadati.

Diversi tipi di metadati svolgono funzioni diverse. Ad esempio, i metadati descrittivi di un documento possono includere l'autore, la data di creazione, le dimensioni del file e le parole chiave. I metadati tecnici per un database relazionale possono descrivere la struttura delle tabelle, i tipi di dati e le relazioni tra le tabelle.

Dato l'enorme volume di dati che le aziende gestiscono oggi, i metadati sono indispensabili. Migliora l'accessibilità dei dati, facilitando la navigazione in set di dati di grandi dimensioni e la conversione di informazioni non elaborate in insight attuabili. Ad esempio, un'azienda retail può utilizzare i metadati per trovare rapidamente i dati di vendita per un mese specifico, filtrati per categorie e regione, senza cercare tra tutti i dati.

I metadati sono fondamentali anche nella governance dei dati e nella gestione dei dati. In effetti, Gartner ha scoperto che le aziende che non adottano un approccio basato sui metadati alla modernizzazione IT possono spendere fino al 40% in più per la gestione dei dati.1

Sistemi come database, librerie digitali e piattaforme di gestione dei contenuti si basano sui metadati per ordinare, recuperare e gestire i dati. Quando i dati sono organizzati meglio, le organizzazioni possono massimizzarne il valore per iniziative aziendali critiche, inclusi progetti di business intelligence (BI), AI e apprendimento automatico (ML).

I metadati inoltre a garantire la qualità dei dati e l'integrità dei dati. Consente le attività di data lineage e supporta la conformità alle normative, come il Regolamento generale sulla protezione dei dati (GDPR) e il California Consumer Privacy Act (CCPA).

Visualizzazione dei metadati

A volte i metadati possono sembrare un po' meta. Per renderli più concreti, prendiamo in considerazione un libro. I metadati in questo caso sarebbero l'autore, il titolo, la data di pubblicazione e il sommario. Questi elementi non forniscono i dati effettivi, il testo del libro, ma offrono dettagli fondamentali per classificare il libro e comprenderne le origini.

Proprio come un bibliotecario o un ricercatore potrebbe analizzare migliaia di titoli utilizzando il nome di un autore, i data scientist o altri utenti possono cercare set di dati di grandi dimensioni utilizzando i metadati.

Senza queste informazioni, gli utenti si troverebbero di fronte a enormi quantità di dati, simili a centinaia di migliaia di pagine di testo non categorizzate, senza la possibilità di ordinarle oppure organizzarle. In altre parole, i dati, come i libri, perderebbero tutto il contesto e la funzione.

Donna di colore che lavora al laptop

Rimani aggiornato sulle ultime novità dal mondo della tecnologia

Insight, ricerche e opinioni di esperti su AI, sicurezza, cloud e molto altro nella newsletter settimanale Think.

Tipi di metadati

Esistono diversi tipi di metadati, che descrivono tutti aspetti diversi dei dati. Ad esempio, diversi tipi di metadati possono descrivere il contenuto di un file informatico, la sua struttura o le sue autorizzazioni.

Alcuni dei tipi più comuni di metadati includono:

  • Metadati descrittivi
  • Metadati strutturali
  • Metadati amministrativi
  • Metadati tecnici
  • Metadati di conservazione

Metadati descrittivi

I metadati descrittivi forniscono informazioni di base sui dati, come il titolo del file, l'autore, le parole chiave e il riepilogo.

I metadati descrittivi vengono utilizzati comunemente nelle piattaforme dei social, nei motori di ricerca e nei cataloghi di dati, in quanto aiutano a rendere i dati ricercabili. Su LinkedIn, ad esempio, i metadati descrittivi, come il titolo professionale, il livello di istruzione e le competenze di un utente, possono aiutare a ordinare e individuare i profili.

I metadati semantici, pur rappresentando tecnicamente più un framework che un tipo di metadato, possono integrare i metadati descrittivi. I metadati semantici definiscono le relazioni tra i punti dati e aggiungono un significato contestuale.

Ad esempio, se un set di dati contiene il termine "automobile", i metadati semantici possono fornire chiarezza su come "automobile" si relaziona ad altri termini come "veicolo" oppure "SUV".

Metadati strutturali

I metadati strutturali definiscono il modo in cui gli elementi dei dati sono organizzati e correlati tra loro. Ad esempio, in un sito Web, i metadati strutturali stabiliscono il modo in cui la home page si collega ad altre sottopagine e le categorizza in sezioni.

I metadati strutturali aiutano inoltre i sistemi a organizzare dati complessi, in modo simile a come un sommario aiuta a guidare i lettori attraverso un libro.

Le tassonomie, ovvero i sistemi organizzati per la categorizzazione dei dati, spesso guidano i metadati strutturali. Ad esempio, un rivenditore potrebbe utilizzare una tassonomia per classificare diversi prodotti, inserendo "cellulari" sotto "elettronica" e le "t-shirt" sotto "abbigliamento".

Metadati amministrativi

I metadati amministrativi forniscono informazioni sui permessi di accesso, sulle politiche di conservazione e sulla proprietà dei dati. Ad esempio, potrebbe specificare chi ha creato i dati, chi può modificarli e per quanto tempo memorizzarli.

I metadati amministrativi possono inoltre contribuire a garantire la conformità alle norme legali e organizzative registrando l'accesso ai dati e gestendo i piani di conservazione. Inoltre, svolge un ruolo critico nella gestione dei metadati di conservazione, contribuendo a garantire che i dati rimangano accessibili e utilizzabili nel tempo.

Metadati tecnici

I metadati tecnici descrivono i dettagli tecnici di un file di dati, ad esempio il tipo di file, le informazioni di codifica e lo storage. Ad esempio, i metadati tecnici di un'immagine possono includere la risoluzione, le dimensioni del file, il formato del file e il profilo colore.

I metadati tecnici aiutano anche a garantire che i dati vengano memorizzati, elaborati e visualizzati correttamente su vari sistemi e piattaforme, come i sistemi di gestione dei contenuti o le soluzioni di cloud storage.

Ad esempio, i metadati tecnici includono informazioni fondamentali di cui i diversi sistemi e ambienti hanno bisogno per interpretare e presentare in modo accurato i dati, come la risoluzione corretta per la visualizzazione di un'immagine.

Metadati di conservazione

I metadati di conservazione aiutano a garantire l'usabilità e l'accessibilità a lungo termine dei dati. Include dettagli sull'ultimo backup di un set di dati e strategie per preservare i dati, come il porting dei dati in nuovi formati man mano che la tecnologia si evolve per evitare che diventino obsoleti.

Ad esempio, un'organizzazione potrebbe utilizzare i metadati di conservazione per convertire le cartelle cliniche dei pazienti dai sistemi legacy ai moderni formati di cartelle cliniche elettroniche (EHR) per un accesso e una conformità continua.

I metadati di conservazione sono fondamentali in settori come l'assistenza sanitaria e i servizi legali, in cui le organizzazioni devono conservare i dati per lunghi periodi per rispettare determinate norme e regolamenti.

Il ruolo dei metadati nella gestione dei dati

Dal momento che i metadati sono fondamentali per l'organizzazione, la ricerca e l'accesso ai dati, sono necessari per ogni fase del processo di gestione dei dati, dalla creazione e storage dei dati al recupero e all'archiviazione.

Ecco un'analisi dettagliata del modo in cui i metadati si inseriscono in ogni fase del ciclo di vita della gestione dei dati.

Creazione dei dati

La creazione dei dati è quasi sempre accompagnata dalla creazione di metadati, in modo manuale o automatico.

Ad esempio, quando qualcuno scatta una foto digitale, la maggior parte delle fotocamere digitali registra automaticamente metadati come il modello della fotocamera, la data e l'ora.

Allo stesso modo, quando gli utenti caricano un set di dati in un repository dati, possono anche aggiungere manualmente dei metadati descrittivi per migliorare la ricercabilità.

Organizzazione e data storage

I metadati offrono alle organizzazioni una struttura per categorizzare, descrivere e organizzare grandi volumi di dati. Questo consente alle organizzazioni di memorizzare i dati in un modo più logico e coerente.

Nei database relazionali, ad esempio, i metadati specificano il modo in cui le tabelle vengono collegate, facilitandone l'analisi.

I metadati possono aggiungere etichette, descrizioni o tag ai dati non strutturati per aiutare i sistemi a ordinare file e record in modo più efficiente. I metadati supportano inoltre il controllo della versione tenendo traccia delle modifiche e delle origini dei file.

Recupero e accesso ai dati

I metadati rendono i dati memorizzati più ricercabili e recuperabili. Invece di setacciare manualmente grandi quantità di informazioni, gli utenti possono individuare rapidamente dati specifici utilizzando metadati come parole chiave, descrizioni di file o date di creazione.

Ad esempio, i tag dei metadati in un sistema di gestione dei contenuti possono aiutare gli utenti a ordinare i contenuti in base alla data di pubblicazione, all'autore o all'argomento. I motori di ricerca dipendono dai metadati incorporati nelle intestazioni HTML, come i tag del titolo e le descrizioni, per classificare e fornire pagine Web pertinenti.

Conservazione e archiviazione dei dati

Quando i dati raggiungono la fine del loro utilizzo attivo, i metadati aiutano a garantire un'archiviazione corretta e una conservazione a lungo termine.

I metadati di conservazione documentano dettagli importanti come il formato del file, le autorizzazioni di accesso, la data dell'ultima modifica e la cronologia dei backup.

Tracciando questi dettagli, le organizzazioni possono contribuire a garantire che i dati archiviati rimangano utilizzabili per anni o addirittura decenni pur rimanendo conformi agli standard normativi.

Standard e schemi di metadati

Gli standard e gli schemi di metadati aiutano a garantire la coerenza tra set di dati, facilitando la conoscenza e la condivisione dei dati per sistemi e utenti.

Uno standard di metadati definisce il modo in cui i metadati devono essere strutturati e applicati a diversi sistemi. Due standard di metadati ampiamente riconosciuti sono Dublin Core e ISO 19115.

  • Dublin Core è uno standard semplice e ampiamente utilizzato per descrivere le risorse digitali. Include elementi di metadati di base come "titolo", "autore" e "formato". Questo standard viene spesso utilizzato nelle librerie digitali e negli archivi per aiutare a organizzare le raccolte fisiche e digitali.
  • La norma ISO 19115 si concentra sulla descrizione dei dati geospaziali. Contribuisce a garantire una documentazione coerente dei set di dati geografici, compresi i dettagli sulla qualità dei dati, l'estensione geografica e la metodologia. Questo standard è fondamentale per i settori che si occupano di mappatura, rilevamento del territorio e monitoraggio ambientale.

Uno schema di metadati è un blueprint per l'implementazione degli standard di metadati. Aiuta a garantire che gli elementi dei metadati siano organizzati, formattati e utilizzati in modo coerente. Ad esempio, uno schema basato su Dublin Core determinerebbe il modo in cui elementi come "titolo" e "oggetto" devono essere formattati per coerenza tra le piattaforme.

Perché i metadati sono importanti

I metadati sono fondamentali per i sistemi e le tecnologie su cui le persone fanno affidamento ogni giorno, dai motori di ricerca ai modelli AI. In particolare, i metadati supportano:

  • Accessibilità dei dati
  • Integrazione dei dati
  • Intelligenza artificiale (AI) e machine learning (ML)
  • Architettura dei dati

Accessibilità dei dati

Oggi le organizzazioni possiedono enormi quantità di dati, ma questo non significa molto se le persone non possono utilizzarli. Infatti, l'IBM Data Differentiator riporta che ben il 68% dei dati aziendali non viene mai analizzato. Spesso, questo accade perché le persone non sanno che ci sono o perché i silo impediscono loro l'accesso.

I metadati consentono agli utenti di orientarsi facilmente in paesaggi di dati complessi. I metadati aiutano a organizzare, etichettare, filtrare e ordinare i set di dati in modo che gli utenti e i sistemi possano recuperare rapidamente le informazioni di cui hanno bisogno. Senza un'adeguata gestione dei metadati, trovare i dati giusti su più sistemi sarebbe come cercare un ago in un pagliaio.

Integrazione dei dati

Le organizzazioni raccolgono dati da più fonti: app, siti Web, negozi fisici e digitali, portali per i clienti e altro ancora. Il consolidamento di tutte queste informazioni è noto come integrazione dei dati, che può essere una sfida importante.

I metadati aiutano a standardizzare i formati dei dati e a mappare le relazioni tra set di dati, consentendo ai dati di fluire senza soluzione di continuità tra i sistemi. L'integrazione dei dati è particolarmente importante per le attività di analytics dei dati e business intelligence (BI), in cui insight accurati dipendono dal fatto che i dati provenienti da piattaforme diverse lavorino di concerto.

Ad esempio, un'azienda retail potrebbe utilizzare i metadati per collegare i dati di acquisto dei clienti dalle transazioni online e in negozio. Questo consente all'azienda di analizzare insieme i set di dati per fare previsioni di acquisto più accurate e informate. Può inoltre aiutare a ottimizzare la gestione dell'inventario e a supportare nuove strategie di marketing.

Intelligenza artificiale (AI) e machine learning (ML)

I progetti di AI e apprendimento automatico si basano su dati puliti e ben organizzati per ottenere addestramento e risultati accurati. I metadati supportano questo processo etichettando e classificando i dati, il che aiuta i modelli ad apprendere e fornisce il contesto necessario per gli insight.

Inoltre, la preparazione dei dati per queste tecnologie spesso è un processo lungo. Gartner riporta che i clienti dedicano circa il 90% del loro tempo alla preparazione dei dati, percentuale che sale al 94% nei settori complessi.1 Una gestione efficiente dei metadati può aiutare a semplificare il processo di preparazione dei dati e consentire alle organizzazioni di concentrarsi sull'analisi anziché sulla pulizia dei dati.

Architettura dei dati

Le aziende possiedono grandi quantità di dati su tutto, dalle transazioni dei clienti all'inventario dei prodotti, dai processi interni alle ricerche proprietarie. Questi dati devono essere organizzati in un'architettura di dati coerente per consentire agli utenti e alle app di accedervi quando ne hanno bisogno.

I metadati sono fondamentali per l'architettura dei dati. Hanno funzione di blueprint, guidando il modo in cui i dati vengono organizzati, memorizzati e resi accessibili tra i sistemi. Forniscono informazioni che aiutano le pipeline di dati a funzionare in modo efficiente, standardizzando il modo in cui i dati fluiscono nel sistema e migliorando la scalabilità.

I metadati possono anche ridurre al minimo le ridondanze mappando le relazioni tra i set di dati in modo che le organizzazioni non debbano memorizzare gli stessi dati in più luoghi.

Esempi di utilizzo dei metadati

I metadati sono ampiamente applicati in tutti i settori per migliorare l'organizzazione, l'accessibilità e la governance dei dati. Le applicazioni pratiche del metadata includono:

  • Gestione del database: i metadati aiutano a gestire e organizzare i database offrendo agli utenti un modo per filtrare, etichettare, ordinare e connettere punti dati e set di dati. Un livello di metadati condiviso tra i database può inoltre supportare attività più avanzate, come l'interrogazione di set di dati tra sistemi diversi.
  • Governance dei dati e conformità: i metadati amministrativi tengono traccia di chi può accedere, modificare o eliminare i dati, il che è fondamentale nei settori regolamentati. Questi metadati creano percorsi di verifiche per i dati sensibili, che possono aiutare le organizzazioni a rispettare normative come il GDPR e l'Health Insurance Portability and Accountability Act (HIPAA).
  • Ottimizzazione per i motori di ricerca (SEO): I motori di ricerca dipendono dai metadati incorporati nelle intestazioni HTML, come i tag del titolo e le meta-descrizioni, per classificare le pagine Web. I metadati accurati aiutano a garantire che i contenuti Web vengano indicizzati correttamente e vengano visualizzati nei risultati di ricerca pertinenti, aumentando la visibilità.
  • Social: piattaforme come Facebook e X utilizzano i metadati per organizzare i post e consigliare i contenuti. I metadati come gli hashtag e la geolocalizzazione possono aiutare gli utenti a trovare e condividere informazioni pertinenti.
  • Insight sui consumatori: i rivenditori utilizzano i metadati per tracciare le interazioni con i clienti, generare consigli personalizzati sui prodotti e indirizzare gli annunci. Ad esempio, se un rivenditore digitale vede che un utente visita costantemente pagine di prodotti di bellezza, potrebbe consigliargli più prodotti di bellezza o simili.
  • Gestione dei diritti: i metadati amministrativi contengono informazioni sui diritti di utilizzo e sugli accordi di licenza, che le organizzazioni possono utilizzare per monitorare la conformità alle leggi sul copyright e disciplinare la proprietà intellettuale in modo più ampio. Ad esempio, i metadati amministrativi di un'immagine potrebbero includere informazioni sul fatto che un'altra organizzazione o persona possa utilizzare quell'immagine a fini commerciali.

Gestione metadati

La gestione dei metadati è la pratica di organizzare, ottimizzare e utilizzare i metadati per migliorare l'accessibilità e la qualità dei dati di un'organizzazione. Gli obiettivi comuni della gestione dei metadati includono la standardizzazione dei formati di metadati, la definizione di politiche di governance dei dati e l'automazione della creazione dei metadati.

I repository di metadati sono spesso fondamentali per questo processo. Hanno funzione di unico punto di riferimento per garantire che i metadati siano conformi e aggiornati in tutti i sistemi.

La gestione dei metadati utilizza spesso anche l'automazione attraverso modelli e API per ridurre gli errori manuali e accelerare l'elaborazione dei metadati. L'automazione può inoltre semplificare l'elaborazione di grandi set di dati in modo efficiente e con meno errori.

La gestione dei metadati aiuta ad abilitare e semplificare le attività di gestione dei dati. Inoltre, l'ascesa dell'AI e il ruolo fondamentale dei metadati nei sistemi di apprendimento automatico e AI non fanno che sottolineare la crescente importanza della gestione dei metadati.

Soluzioni correlate
Software e soluzioni per la gestione dei dati

Progetta una strategia dati che elimini i silo, riduca la complessità e migliori la qualità dei dati per esperienze eccezionali di clienti e dipendenti.

Esplora le soluzioni di gestione dei dati
IBM watsonx.data™

Watsonx.data ti consente di scalare l'analytics e l'AI con tutti i tuoi dati, ovunque risiedano, attraverso uno storage dei dati aperto, ibrido e governato.

Scopri watsonx.data
Servizi di consulenza per dati e analytics

Sblocca il valore dei dati enterprise con IBM Consulting, creando un'organizzazione basata su insight in grado di generare vantaggi aziendali.

Esplora i servizi di analytics
Fai il passo successivo

Progetta una strategia dati che elimini i silo, riduca la complessità e migliori la qualità dei dati per esperienze eccezionali di clienti e dipendenti.

Esplora le soluzioni di gestione dei dati Scopri watsonx.data