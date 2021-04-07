Aunque los tres tipos de repositorios de datos en la nube contienen datos, existen diferencias muy claras entre ellos. Por ejemplo, un almacén de datos y un data lake son grandes agregaciones de datos, pero un data lake suele ser más rentable de implementar y mantener porque en gran medida no está estructurado.

La arquitectura de data lake ha evolucionado en los últimos años para admitir mayores volúmenes de datos y computación basada en la nube. Se reciben grandes cantidades de datos de varias fuentes de datos en una ubicación central.

Un almacén de datos podría estructurarse de una de estas tres maneras:

Como un servicio gestionado ofrecido por proveedores de servicios en la nube. Como solución de software que proporciona control interno y protocolos de seguridad estrictos, lo que puede ser útil cuando se trata del cumplimiento de la normativa. Como dispositivo, que suele ser una solución de software y hardware plug-and-play.

Los datos de un almacén de datos se pueden utilizar más fácilmente para diversos fines que los datos de un data lake. La razón es que un almacén de datos está estructurado y puede extraerse o analizarse más fácilmente.

Un almacén de datos (data mart), por otro lado, contiene una cantidad menor de datos en comparación con un data lake y un almacén de datos, y los datos se clasifican para un uso específico o por una unidad de negocio específica. Un almacén de datos (data mart) puede existir en muchos formatos diferentes (estrella, copo de nieve o vault) definidos por la estructura lógica de los datos, con una estructura de vault siendo más ágil, flexible y escalable que los otros formatos.

Hay tres tipos de data marts:

Un almacén de datos (data mart) dependiente, que consta de particiones de almacén de datos. Es un subconjunto de datos primarios en un almacén. Un almacén de datos (data mart) independiente, que es un sistema independiente, aislado en una parte específica de la empresa. Un almacén de datos (data mart) híbrido, que consta de datos de un almacén y fuentes independientes. Este tipo suele proporcionar un acceso a datos más rápido y una interfaz fácil de usar.

El tipo de repositorio de datos que elija y su estructura dependen en gran medida de las necesidades y demandas de su negocio. Si tiene sentido para su negocio, benefíciense de las ventajas del almacenamiento basado en cloud híbrido para obtener escalabilidad, flexibilidad y un enfoque más amplio e informado para la resolución de problemas y la toma de decisiones.