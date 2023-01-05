La arquitectura de datos adecuada puede ayudar a su organización a mejorar la calidad de los datos porque proporciona la infraestructura que determina cómo se recopilan, transportan, almacenan, protegen, utilizan y comparten los datos para casos de uso de business intelligence y ciencia de datos.

La primera generación de arquitecturas de datos representada por el almacén de datos empresarial y las plataformas de business intelligence se caracterizó por miles de trabajos, tablas e informes de ETL que solo un pequeño grupo de ingenieros de datos especializados entendía, lo que resultó en un impacto positivo subestimado en el negocio. La próxima generación de plataformas de big data y los trabajos por lotes de larga duración operados por un equipo central de ingenieros de datos a menudo han llevado a pantanos de lagos de datos.

Ambos enfoques eran arquitecturas típicamente monolíticas y centralizadas organizadas en torno a funciones mecánicas de ingesta, procesamiento, limpieza, agregación y servicio de datos. Esto creó una serie de cuellos de botella organizacionales y tecnológicos que prohíben la integración y escala de datos a lo largo de varias dimensiones: cambio constante del ámbito de datos, proliferación de fuentes de datos y consumidores de datos, diversidad de Transformación y procesamiento de datos que los casos de uso requieren, y velocidad de respuesta al cambio.