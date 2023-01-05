La arquitectura de datos adecuada puede ayudar a su organización a mejorar la calidad de los datos, ya que proporciona el marco que determina cómo se recopilan, transportan, almacenan, protegen, utilizan y comparten los datos para los casos de uso de inteligencia empresarial y ciencia de datos.

La primera generación de arquitecturas de datos representada por el almacén de datos empresarial y las plataformas de inteligencia empresarial se caracterizó por miles de trabajos, tablas e informes ETL que solo un pequeño grupo de ingenieros de datos especializados entendía, lo que resultó en un impacto positivo infrautilizado en el negocio. La próxima generación de plataformas de big data y los trabajos por lotes de larga duración operados por un equipo central de ingenieros de datos a menudo han dado lugar a pantanos de data lake.

Ambos enfoques eran arquitecturas típicamente monolíticas y centralizadas, organizadas en torno a funciones mecánicas de ingestión, procesamiento, limpieza, agregación y servicio de datos. Esto creó una serie de cuellos de botella organizativos y tecnológicos que impedían la integración y la ampliación de los datos en varias dimensiones: el cambio constante del panorama de los datos, la

proliferación de fuentes y consumidores de datos, la diversidad de transformación y proceso de datos que requieren los casos de uso y la velocidad de respuesta al cambio.