Ogni giorno, le organizzazioni creano e raccolgono enormi quantità di dati. Ogni dipartimento o unità di business genera set di dati che spesso vengono archiviati in depositi eterogenei e tipicamente gestiti da un team dati centralizzato.
Questa separazione crea silos di dati, cioè raccolte isolate di dati operativi e analitici che ostacolano la condivisione dei dati, riducono la qualità dei dati e indeboliscono il processo decisionale basato sui dati. I silos dei dati limitano inoltre l'efficacia delle iniziative di big data, machine learning (ML) e intelligenza artificiale (AI).
In effetti, secondo l' IBM Data Differentiator, l'82% delle aziende riferisce che i silos di dati interrompono i workflow critici e che il 68% dei dati aziendali rimane non analizzato.
Le architetture distribuite di mesh di dati affrontano queste sfide decentralizzando la proprietà e la gestione dei dati. Invece di affidarsi a un team dati centralizzato e alle pipeline tradizionali, la proprietà dei dati viene trasferita ai team di dominio. Questi team gestiscono i propri dati e li forniscono come prodotto al resto dell'organizzazione tramite un'infrastruttura dati self-service.
Questo approccio dei dati come prodotto enfatizza accessibilità, governance e utilità. È basato sul principio che i dati, proprio come qualsiasi prodotto di consumo di alta qualità, devono essere gestiti e organizzati per soddisfare le esigenze specifiche dei loro utenti.