Une solution supérieure pour les entreprises est l’intégration de l’entrepôt de données existant sur site à des solutions de data lakehouse utilisant la technologie de data fabric et de data mesh. Cette approche permet de créer une solution d’entreposage de données moderne et pérenne.

Un data lakehouse contient les données d’une entreprise dans une forme non structurée, structurée, semi-structurée, qui peuvent être stockées indéfiniment pour un usage immédiat ou futur. Ces données sont utilisées par les data scientists et les ingénieurs qui les étudient pour en extraire des informations métier. Les coûts de stockage d’un data lake ou d’un data lakehouse sont moins élevés que ceux d’un entrepôt de données d’entreprise. De plus, leur gestion est moins chronophage, ce qui réduit les coûts opérationnels. IBM propose une solution de data lakehouse de nouvelle génération pour répondre à ces besoins.

Le data fabric est une plateforme d’analyse de données de nouvelle génération qui résout les défis avancés de sécurité des données grâce à la propriété décentralisée. En règle générale, les entreprises disposent de plusieurs sources de données provenant de différents secteurs d’activité qui doivent être intégrées pour l’analytique. Une architecture de data fabric unit efficacement des sources de données disparates et les relie via des directives de partage de données et de gouvernance gérées de manière centralisée.

De nombreuses entreprises recherchent une solution flexible, hybride et multicloud basée sur des fournisseurs de cloud. La solution de data mesh transfère les requêtes SQL (langage de requêtes structurées) vers le SGBDR (système de gestion de bases de données relationnelles) ou le data lakehouse concerné en gérant le catalogue de données, offrant ainsi aux utilisateurs des tables et des données virtualisées. Selon les principes du data mesh, les données métier ne sont jamais stockées localement, ce qui constitue un avantage pour une entreprise. Une solution de data mesh réussie réduit les dépenses d’investissement et d’exploitation d’une entreprise.

IBM Cloud Pak for Data est un excellent exemple de data fabric et de solution de data mesh pour l’analytique. La technologie cloud est devenue la plateforme privilégiée pour les capacités d’intelligence artificielle (IA), les services intelligents en périphérie, la connectivité sans fil avancée, etc. De nombreuses entreprises s’appuieront sur une stratégie hybride et multicloud pour améliorer leurs performances opérationnelles et assurer leur prospérité dans le monde des affaires.