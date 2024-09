Les data lakes et les data lakehouses fournissent un référentiel centralisé pour gérer de gros volumes de données. Ils servent de base à la collecte et à l’analyse de données structurées, semi-structurées et non structurées dans leur format natif dans le cadre d’un stockage à long terme et pour générer des informations et des prévisions. Contrairement aux entrepôts de données traditionnels, ils peuvent traiter des vidéos, de l’audio, des journaux, des textes, des réseaux sociaux, des données de capteurs et des documents pour alimenter les applications, l’analyse et l’IA. Ils peuvent également être créés dans le cadre d’une architecture data fabric pour fournir les bonnes données, au bon moment, et ce où qu’elles soient stockées.

Les data lakes basés sur Hadoop visaient à gérer ces nouveaux workloads, mais nécessitaient des compétences difficiles à trouver pour développer des applications et gérer les plateformes. Les data lakes sont largement supplantés par une nouvelle approche architecturale appelée data lakehouse.



Comment relever les défis liés aux données d’aujourd’hui grâce à une architecture de lakehouse