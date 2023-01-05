Une architecture de données adéquate peut aider votre entreprise à améliorer la qualité des données, car elle fournit le cadre qui définit la manière dont les données sont recueillies, transportées, stockées, sécurisées, employées et partagées pour des cas d’utilisation liés à la business intelligence et à la science des données.

La première génération d’architectures de données, représentée par les entrepôts de données d’entreprise et les plateformes de business intelligence, se caractérisait par des milliers de tâches ETL, de tableaux et de rapports que seul un petit groupe d’ingénieurs de données spécialisés comprenait, ce qui se traduisait par un impact positif sous-estimé sur l’activité. La nouvelle génération de plateformes de big data et de tâches par lots longue durée gérées par une équipe centrale d’ingénieurs de données a souvent conduit à des marécages de data lakes.

Ces deux approches étaient généralement des architectures monolithiques et centralisées, organisées autour de fonctions mécaniques d’ingestion, de traitement, de nettoyage, d’agrégation et de livraison des données. Cela a créé un certain nombre de goulets d’étranglement organisationnels et technologiques qui ont empêché l’intégration et la mise à l’échelle des données à plusieurs niveaux : changement constant du paysage des données, prolifération des sources et des consommateurs de données, diversité des transformations et des traitements de données requis par les cas d’utilisation, et rapidité de réponse aux changements.