La democratizzazione dei dati richiede un abbandono della tradizionale architettura dei "dati a riposo", pensata per memorizzare dati statici. Tradizionalmente, i dati erano visti come informazioni da mettere in riserva, richiamate solo durante le interazioni con i clienti o l'esecuzione di un programma. Oggi, il modo in cui le aziende utilizzano i dati è molto più fluido; i dipendenti esperti in materia di dati utilizzano i dati in centinaia di app, analizzano i dati per un migliore processo decisionale e accedono ai dati da numerose località.
La democratizzazione dei dati utilizza un'architettura di dati adatta allo scopo progettata per il modo in cui operano le aziende odierne, in tempo reale. È distribuita sia on-premise che nel cloud, consentendo un ampio utilizzo e spostamento tra cloud, app e reti, nonché la memorizzazione di dati a riposo. Un'architettura progettata per la democratizzazione dei dati mira a essere flessibile, integrata, agile e sicura per consentire l'uso dei dati e dell'intelligenza artificiale (AI) su larga scala. Di seguito sono riportati alcuni esempi dei tipi di architetture adatte alla democratizzazione dei dati.
Data fabric
Le architetture data fabric sono progettate per connettere le piattaforme di dati con le applicazioni dove gli utenti interagiscono con le informazioni per un accesso semplificato ai dati in un'organizzazione e consumo di dati self-service. Sfruttando i servizi di dati e le API, un data fabric può anche riunire dati provenienti da sistemi legacy, data lake, data warehouse e SQL Database, fornendo una visione olistica delle prestazioni aziendali.
I dati all'interno di un data fabric sono definiti utilizzando metadati e possono essere archiviati in un data lake, un ambiente di storage a basso costo che ospita grandi memorizzazioni di dati strutturati, semistrutturati e dati non strutturati per analytics, machine learning e altre applicazioni.
Data mesh
Un altro approccio alla democratizzazione dei dati utilizza un data mesh, un'architettura decentralizzata che organizza i dati in base a uno specifico dominio aziendale. Utilizza grafici di conoscenza, semantica e tecnologia AI/ML per scoprire modelli in vari tipi di metadati. Quindi, applica questi insight per automatizzare e orchestrare il ciclo di vita dei dati. Invece di gestire le operazioni di estrazione, trasformazione e caricamento (ETL) all'interno di un data lake, un data mesh definisce i dati come un prodotto in più repository, ognuno con il proprio dominio per la gestione della propria pipeline di dati.
Come l'architettura dei microservizi in cui i servizi leggeri sono accoppiati insieme, un data mesh utilizza domini funzionali per impostare i parametri relativi ai dati. Ciò consente agli utenti di tutta l'organizzazione di trattare i dati come un prodotto con accesso diffuso. Ad esempio, i team di marketing, vendita e servizio clienti avrebbero i propri domini, fornendo maggiore proprietà ai produttori di un determinato set di dati, pur consentendo la condivisione tra diversi team.
Le architetture data fabric e data mesh non si escludono a vicenda; possono persino essere utilizzate per completarsi a vicenda. Ad esempio, un data fabric può rafforzare il data mesh perché può automatizzare i processi chiave, come la creazione più rapida di prodotti di dati, l'applicazione della governance globale e l'orchestrazione più semplice della combinazione di più prodotti di dati.
Approfondimenti: Data fabric vs data mesh: qual è la scelta giusta per te?