Un data mart è un database relazionale orientato agli oggetti che memorizza i dati transazionali in righe e colonne, rendendone facile l'accesso, l'organizzazione e la comprensione. Dal momento che contiene dati cronologici, questa struttura consente a un analista di determinare le tendenze dei dati più facilmente. I campi di dati tipici includono ordine numerico, valore temporale e riferimenti a uno o più oggetti.
Le aziende organizzano i data mart in uno schema multidimensionale come un modello per soddisfare le esigenze delle persone che usano i database per svolgere attività analitiche. I tre tipi di schemi principali sono a stella, a fiocco di neve e vault.
A stella
Lo schema a stella è una formazione logica di tabelle in un database multidimensionale che ricorda la forma di una stella. In questo modello, una tabella dei fatti, ossia un insieme di metriche che si riferisce a un evento o processo aziendale specifico, risiede al centro della stella, circondata da diverse tabelle di dimensioni associate.
Non esiste alcuna dipendenza tra le tabelle di dimensione, quindi uno schema a stella richiede un numero inferiore di join quando si scrivono le query. Questa struttura rende più facile la creazione di query, quindi gli schemi a stella sono altamente efficienti per gli analisti che desiderano accedere e muoversi in grandi insiemi di dati.
A fiocco di neve
Uno schema a fiocco di neve è un'estensione logica di uno schema a stella, ampliando il modello con ulteriori tabelle delle dimensioni. Le tabelle delle dimensioni sono normalizzate per proteggere l'integrità dei dati e ridurre al minimo la ridondanza dei dati.
Anche se questo metodo richiede meno spazio per memorizzare le tabelle delle dimensioni, si tratta di una struttura complessa che può essere difficile da gestire. Il vantaggio principale derivante dall'utilizzo dello schema a fiocco di neve è la ridotta esigenza di spazio su disco, ma lo svantaggio è un possibile impatto negativo sulle prestazioni a causa delle tabelle aggiuntive.
Vault
Il data vault è una moderna tecnica di modellazione di database che permette ai professionisti IT di progettare dei data warehouse aziendali agili. Questo approccio implementa una struttura a livelli ed è stato sviluppato specificamente per contrastare i problemi di agilità, flessibilità e scalabilità che sorgono quando si usano gli altri modelli di schemi.
Il data vault elimina la necessità di pulizia dello schema a stella e semplifica l'aggiunta di nuove fonti di dati senza interrompere lo schema esistente.