La démocratisation des données nécessite de déplacer l’architecture traditionnelle des « données au repos », qui est destinée au magasin de données statiques. Traditionnellement, les données étaient considérées comme des informations à mettre en réserve, auxquelles on ne faisait appel que lors des interactions avec les clients ou de l’exécution d’un programme. Aujourd’hui, l’utilisation des données par les entreprises est beaucoup plus fluide. Les employés qui maîtrisent les données les utilisent dans des centaines d’applications, les analysent pour mieux prendre des décisions et y accèdent à partir de nombreux endroits.
La démocratisation des données repose sur une architecture de données adaptée au fonctionnement des entreprises d’aujourd’hui, en temps réel. Il est distribué à la fois dans le cloud et sur site, ce qui permet une utilisation et une mobilité intensives entre les clouds, les applications et les réseaux, ainsi que des magasins de données au repos. Une architecture conçue pour la démocratisation des données se veut flexible, intégrée, agile et sécurisée afin de permettre l’utilisation des données et de l’intelligence artificielle (IA) à l’échelle. Voici quelques exemples de types d’architectures bien adaptées à la démocratisation des données.
Data fabric
Les architectures de data fabrics sont conçues pour connecter les plateformes de données à l’application où les utilisateurs interagissent avec les informations pour un accès simplifié aux données dans une entreprise et l’utilisation des données en fonction de ses besoins. En exploitant les services de données et les API, un site data fabric peut également rassembler des données provenant de systèmes hérités, de data lakes, d’entrepôts de données et de SQL Database, ce qui permet d’obtenir une vue d’ensemble de l’activité de l’entreprise performance.
Les données d’un data fabric sont définies à l’aide de métadonnées et peuvent être stockées dans un data lake, un environnement de stockage à faible coût qui héberge de grandes quantités de données structurées, semi-structurées et non structurées pour l’analytique, le machine learning et d’autres applications.
Data mesh
Une autre approche de la démocratisation des données utilise un data mesh, une architecture décentralisée qui organise les données par domaine d’activité spécifique. Elle utilise des graphiques de connaissances, la sémantique et la technologie IA/ML pour découvrir des modèles dans différents types de métadonnées. Elle applique ensuite ces informations pour automatiser et orchestrer le cycle de vie des données. Au lieu de gérer les opérations d’extraction, de transformation et de chargement (ETL) au sein d’un data lake, un data mesh définit les données en tant que produit dans plusieurs référentiels, chacun disposant de son propre domaine pour gérer son pipeline de données.
À l’instar de l’architecture des microservices où des services légers sont couplés, un maillage de données utilise des domaines fonctionnels pour définir des paramètres autour des données. Cela permet aux utilisateurs de l’entreprise de traiter les données comme un produit avec un accès étendu. Par exemple, les équipes marketing, commerciales et de service client auraient leurs propres domaines, ce qui renforcerait la propriété des producteurs d’un jeu de données spécifique, tout en permettant de le partager entre différentes équipes.
Les architectures data fabric et data mesh ne s’excluent pas mutuellement. Ils peuvent même être utilisés en complément l’un de l’autre. Par exemple, un data fabric peut renforcer le data mesh; car il permet d’en automatiser les principaux processus : accélérer la création des produits de données, renforcer globalement la gouvernance et faciliter l’orchestration des produits de données combinés.
En savoir plus : Data fabric ou data mesh : laquelle vous convient le mieux ?