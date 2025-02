Les data lakes ont été créés pour aider les entreprises à gérer le flot de big data (dont une grande partie est non structurée) généré par les applications et les services connectés à Internet à la fin des années 2000 et au début des années 2010.

Contrairement aux bases de données et aux entrepôts de données traditionnels, les data lakes ne nécessitent pas que toutes les données suivent un schéma défini. Ils peuvent au contraire stocker différents types de données dans des formats variés au sein d’un référentiel centralisé. Les data lakes tirent également parti du cloud computing pour rendre le stockage des données plus évolutif et plus abordable.

Les data lakes sont aujourd’hui des composants essentiels des architectures de données de nombreuses organisations. Selon l’étude IBM auprès des directeurs des données (CDO), 75 % des principaux CDO investissent dans les data lakes.

Grâce à leur stockage flexible, ces derniers peuvent aider les entreprises à éliminer les silos de données et à créer des data fabrics holistiques. Ils sont également utiles aux data scientists et aux ingénieurs de données, qui les emploient souvent pour gérer les énormes jeux de données non structurées nécessaires aux workloads d’intelligence artificielle (IA) et de machine learning (ML).