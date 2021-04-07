Bien que les trois types de référentiels de données cloud contiennent des données, il existe des différences très nettes entre eux. Par exemple, un entrepôt de données et un data lake sont tous deux de grandes agrégations de données, mais un data lake est généralement plus économique à implémenter et à gérer, car il est en grande partie non structuré.

L’architecture des data lakes a évolué au cours des dernières années pour prendre en charge de plus grands volumes de données, ainsi que l’informatique basée sur le cloud. De grandes quantités de données sont recueillies auprès d’un certain nombre de sources de données et transférées vers un emplacement central.

Un entrepôt de données peut être structuré de trois manières :

En tant que service géré proposé par les fournisseurs de cloud. En tant que solution logicielle qui fournit un contrôle interne et des protocoles de sécurité stricts, ce qui est utile pour assurer la conformité réglementaire. En tant qu’appliance : il s’agit généralement d’une solution logicielle et matérielle prête à l’emploi.

Les données d’un entrepôt de données peuvent être plus facilement utilisées à diverses fins que les données d’un data lake. En effet, un entrepôt de données est structuré et peut être plus facilement exploré et analysé.

Le datamart, quant à lui, contient moins de données qu’un data lake ou un entrepôt de données, et les données sont classées par utilisation, par démographie ou par unité commerciale. Les datamarts peuvent avoir divers formats (étoile, flocon de neige ou coffre-fort) définis par la structure logique des données. Le coffre-fort est plus agile, plus flexible et plus évolutif que les autres formats.

Il existe trois types de datamarts :

Un datamart dépendant, composé de partitions d’entrepôt de données d’entreprise. Il s’agit d’un sous-ensemble de données primaires dans un entrepôt. Un datamart indépendant, c’est-à-dire un système autonome, cloisonné dans une partie spécifique de l’entreprise. Un datamart hybride, composé de données provenant d’un entrepôt et de sources indépendantes. Ce type offre généralement un accès plus rapide aux données et une interface conviviale.

Le type de référentiel de données que vous choisissez, et sa structure, dépendent fortement des besoins et des exigences de votre entreprise. Si cela convient à votre activité, profitez des avantages du stockage hybride basé sur le cloud qui offre flexibilité et évolutivité, ainsi qu’une approche plus globale et éclairée de la résolution de problèmes et de la prise de décision.