La democratización de los datos requiere moverse lejos de la arquitectura tradicional de "datos en reposo", que está diseñada para almacenar datos estáticos. Tradicionalmente, los datos se consideraban información que se reservaba, a la que solo se recurría durante las interacciones con los clientes o la ejecución de un programa. Hoy en día, la forma en que las empresas utilizan los datos es mucho más fluida. Los empleados con conocimientos de datos utilizan datos en cientos de aplicaciones, analizan datos para una mejor toma de decisiones y acceden a datos desde numerosas ubicaciones.
La democratización de datos utiliza una arquitectura de datos adecuada para el propósito que está diseñada para la forma en que operan las empresas actuales, en tiempo real. Se distribuye tanto en la nube como on premises, lo que permite un amplio uso y movimiento entre nubes, aplicaciones y redes, así como almacenar datos en reposo. Una arquitectura diseñada para la democratización de datos pretende ser flexible, integrada, ágil y segura para permitir el uso de datos e inteligencia artificial (IA) a escala. Estos son algunos ejemplos de los tipos de arquitecturas más adecuadas para la democratización de datos.
Data fabric
Las arquitecturas de tejido de datos están diseñadas para conectar plataformas de datos con las aplicaciones donde los usuarios interactúan con la información para simplificar el acceso a los datos en una organización y el consumo de datos de autoservicio. Al aprovechar los servicios de datos y las API, un tejido de datos también puede reunir datos de sistemas heredados, lagos de datos, almacenes de datos y bases de datos SQL, proporcionando una visión holística del rendimiento empresarial.
Los datos dentro de un tejido de datos se definen mediante metadatos y pueden almacenarse en un lago de datos, un entorno de almacenamiento de bajo costo que alberga grandes almacenes de datos estructurados, semiestructurados y no estructurados para analytics, machine learning y otras aplicaciones amplias.
Malla de datos
Otro enfoque para la democratización de datos utiliza una malla de datos, una arquitectura descentralizada que organiza los datos por un dominio empresarial específico. Utiliza gráficos de conocimiento, semántica y tecnología de IA y machine learning (ML) para descubrir patrones en varios tipos de metadatos. Luego, aplica estos insights para automatizar y orquestar el ciclo de vida de los datos. En lugar de manejar operaciones de extracción, transformación y carga (ETL) dentro de un lago de datos, una malla de datos define los datos como un producto en múltiples repositorios, cada uno con su propio dominio para administrar su canalización de datos.
Al igual que la arquitectura de microservicios en la que se acoplan servicios ligeros, una malla de datos utiliza dominios funcionales para establecer parámetros en torno a los datos. Esto permite a los usuarios de toda la organización tratar los datos como un producto con acceso generalizado. Por ejemplo, los equipos de marketing, ventas y atención al cliente tendrían sus propios dominios, lo que proporcionaría más propiedad a los productores de un conjunto de datos determinado, al tiempo que permitiría compartir entre diferentes equipos.
Las arquitecturas de tejido de datos y malla de datos no son mutuamente excluyentes; incluso pueden utilizarse para complementarse entre sí. Por ejemplo, un tejido de datos puede fortalecer la malla de datos porque puede automatizar procesos clave, como crear productos de datos más rápido, aplicar la gobernanza global y facilitar la orquestación de la combinación de múltiples productos de datos.
Leer más: Tejido de datos frente a malla de datos: ¿cuál es el adecuado para usted?