Basandosi sulla breve definizione di cui sopra, i metadati sono dati che descrivono una risorsa di dati o forniscono informazioni sulla risorsa che la rendono più facile da localizzare, valutare e capire.
L'esempio classico o più comunemente usato di metadati è il catalogo a schede o il catalogo online di una biblioteca. In questi esempi, ogni scheda o elenco contiene delle informazioni su un libro o una pubblicazione (ad esempio, titolo, autore, soggetto, data di pubblicazione, edizione, posizione all'interno della biblioteca e riassunto o sinossi) che rende la pubblicazione più facile da trovare e da valutare per un lettore. Ad esempio: È attuale o obsoleto? Contiene le informazioni che cerco? L'autore è qualcuno di cui mi fido o il cui lavoro mi piace?
Esistono molte classi di metadati, ma un catalogo di dati si occupa principalmente di questi tre: metadati tecnici, metadati di processo e metadati di business.
Metadati tecnici
I metadati tecnici (chiamati anche metadati strutturali) descrivono come sono organizzati i dati e come vengono mostrati agli utenti, descrivendo la struttura degli oggetti relativi ai dati quali tabelle, colonne, righe, indici e collegamenti. I metadati tecnici spiegano ai professionisti dei dati come dovranno lavorare con i dati - per esempio, se possono lavorare con i dati così come sono o se devono trasformarli per l'analisi o l'integrazione.
Metadati di processo
I metadati di processo (chiamati anche metadati di amministrazione) descrivono le circostanze in cui è stata creata la risorsa di dati e quando, come e chi vi ha avuto accesso oppure l'ha usata, aggiornata o modificata. Dovrebbe anche indicare chi ha il permesso di accedere e usare i dati.
I metadati di processo forniscono informazioni sulla storia e le fontidella risorsa, il che può aiutare un analista a decidere se la risorsa è abbastanza recente per il compito da svolgere, se proviene da una fonte affidabile, se è stata aggiornata da persone affidabili e così via. I metadati di processo possono anche essere usati per risolvere problemi con le query. E infine, sempre più spesso, i metadati di processo vengono estratti per ottenere informazioni sugli utenti del software o sui clienti, come, ad esempio, che software stanno usando e che livello di servizio stanno sperimentando.
Metadati di business
I metadati di business (a volte indicati come metadati esterni) descrivono gli aspetti di business della risorsa dati - il valore di business che ha per l'organizzazione, la sua idoneità per uno scopo particolare o per vari scopi, informazioni sulla conformità normativa e altro. I metadati aziendali sono quelli in cui i professionisti dei dati e gli utenti line-of-business parlano la stessa lingua sulle risorse di dati.
Come minimo, un catalogo dati dovrebbe rendere facile trovare (o raccogliere) e organizzare tutti i metadati esistenti associati a qualsiasi risorsa dati della tua organizzazione. Dovrebbe anche fornire degli strumenti che permettano ai data expert di elaborare e arricchire quei metadati con tag, associazioni, valutazioni, annotazioni e qualsiasi altra informazione e contenuto che permetta agli utenti di trovare i dati più velocemente e di usarli con fiducia.