Gli strumenti di gestione dei dati sono iniziati con i database e si sono evoluti in data warehouse e data lake sul cloud e on-premise a misura che emergevano problematiche aziendali più complesse. Ma le aziende sono costantemente costrette a gestire i workload in data warehouse e data lake inefficienti dal punto di vista delle prestazioni e dei costi, e in più sono inibite dalla loro capacità di eseguire analytics e casi d'uso di AI.
L'avvento di nuove tecnologie open source e la volontà di ridurre la duplicazione dei dati e le pipeline ETL complesse sta portando a un nuovo approccio architettonico noto come data lakehouse, che offre la flessibilità di un data lake con le prestazioni e la struttura di un data warehouse, oltre a metadati condivisi e governance, controlli di accesso e sicurezza integrati.
Tuttavia, per accedere a tutti questi dati, ora ottimizzati e governati localmente dalla lakehouse in tutta l'organizzazione, è necessario un data fabric che semplifichi la gestione dei dati e faccia rispettare gli accessi a livello globale. Un data fabric aiuta a ottimizzare il potenziale dei dati, così come a promuoverne la condivisione e ad accelerare le iniziative che li coinvolgono, automatizzandone l'integrazione, incorporando la governance e facilitando il consumo di dati self-service in un modo che sarebbe impossibile agli archivi di storage.
Un data fabric è il prossimo passo nell'evoluzione di questi strumenti. Con questa architettura, puoi continuare a utilizzare gli archivi eterogenei di data storage in cui hai investito, semplificando al tempo stesso la gestione dei dati.