La democratización de los datos requiere alejarse de la arquitectura tradicional de “datos en reposo”, destinada al almacenamiento de datos estáticos. Tradicionalmente, los datos se consideraban información que debía reservarse, a la que solo se recurría durante las interacciones con los clientes o la ejecución de un programa. Hoy en día, la forma en que las empresas utilizan los datos es mucho más fluida. Los empleados con conocimientos de datos los utilizan en cientos de aplicaciones, los analizan para la toma de decisiones y acceden a ellos desde numerosas ubicaciones.

La democratización de los datos utiliza una arquitectura de datos adaptada y diseñada para la forma en que operan las empresas actuales, en tiempo real. Se distribuye tanto en la nube como on-premises, lo que permite un uso y movimiento extensivos entre nubes, aplicaciones y redes, así como almacenes de datos en reposo. Una arquitectura diseñada para la democratización de los datos pretende ser flexible, integrada, ágil y segura para permitir el uso de datos e inteligencia artificial (IA) a escala. Estos son algunos ejemplos de los tipos de arquitecturas más adecuados para la democratización de los datos.

Data fabric

Las arquitecturas de tejido de datos están diseñadas para conectar las plataformas de datos con las aplicaciones en las que ustedes interactúan con la información, con el fin de simplificar el acceso a los datos en una organización y el consumo de datos de autoservicio. Al aprovechar los servicios de datos y las API, un tejido de datos también puede reunir datos de sistemas heredados, data lakes, almacenes de datos y bases de datos SQL, proporcionando una visión holística del rendimiento empresarial.

Los datos dentro de un tejido de datos se definen utilizando metadatos y pueden almacenarse en un data lake, un entorno de almacenamiento de bajo coste que alberga grandes cantidades de datos estructurados, semiestructurados y no estructurados para el análisis empresarial, el machine learning y otras aplicaciones generales.

Malla de datos

Otro enfoque para la democratización de los datos utiliza una malla de datos, una arquitectura descentralizada que organiza los datos por un dominio empresarial específico. Utiliza grafos de conocimiento, semántica y tecnología de IA/ML para descubrir patrones en varios tipos de metadatos. A continuación, aplica estos conocimientos para automatizar y orquestar el ciclo de vida de los datos. En lugar de gestionar las operaciones de extracción, transformación y carga (ETL) dentro de un data lake, una malla de datos define los mismos como un producto en varios repositorios, cada uno con su propio dominio para gestionar su pipeline de datos.

Al igual que la arquitectura de microservicios, en la que se acoplan servicios ligeros, una malla de datos utiliza dominios funcionales para establecer parámetros en torno a los datos. Esto permite a los usuarios de toda la organización tratar los datos como un producto con acceso generalizado. Por ejemplo, los equipos de marketing, ventas y servicio de atención al cliente tendrían sus propios dominios, lo que proporcionaría más propiedad a los productores de un conjunto de datos determinado, a la vez que permitiría compartirlos entre diferentes equipos.

Las arquitecturas de tejido y malla de datos no son mutuamente excluyentes; incluso pueden utilizarse para complementarse entre sí. Por ejemplo, un tejido de datos puede fortalecer la malla de datos porque puede automatizar procesos clave, como crear productos de datos más rápido, aplicar un gobierno global y facilitar la orquestación de la combinación de múltiples productos de datos.

