Hoy en día, las organizaciones recopilan grandes cantidades de datos de diversas fuentes, incluidas las interacciones con los clientes, las transacciones financieras, los dispositivos IoT y las plataformas de redes sociales.
Para desbloquear el valor comercial de todos estos datos, a menudo deben organizarse en conjuntos de datos: colecciones organizadas que hagan que la información sea accesible para su análisis y aplicación.
Los diferentes tipos de conjuntos de datos almacenan datos de diversas maneras. Por ejemplo, los conjuntos de datos estructurados suelen organizar puntos de datos en tablas con filas y columnas definidas. Los conjuntos de datos no estructurados pueden contener formatos variados, como archivos de texto, imágenes y audio.
Si bien no todos los conjuntos de datos involucran datos estructurados, siempre tienen alguna estructura general, ya sean esquemas definidos o sintaxis poco organizada en formatos de datos semiestructurados como JSON o XML.
Algunos ejemplos de conjuntos de datos incluyen:
- Conjuntos de datos de atención al cliente que rastrean las interacciones y resoluciones de soporte.
- Conjuntos de datos de fabricación que monitorean las métricas de rendimiento del equipamiento.
- Conjuntos de datos de ventas que analizan los patrones de transacción y el comportamiento del consumidor.
- Conjuntos de datos de marketing que miden la eficacia y el compromiso de las campañas.
Las organizaciones suelen emplear y mantener varios conjuntos de datos para respaldar diversas iniciativas empresariales, como el análisis de datos y la business intelligence (BI).
El big data, en particular, se basa en conjuntos de datos masivos y complejos para ofrecer valor. Cuando se recopilan, gestionan y analizan adecuadamente mediante analytics de big data, estos conjuntos de datos pueden ayudar a descubrir nuevos insights y permitir la toma de decisiones basada en datos.
En los últimos años, el auge de la inteligencia artificial (IA) y el machine learning han aumentado aún más el enfoque en los conjuntos de datos. Las organizaciones necesitan datos de entrenamiento extensos y bien organizados para desarrollar modelos precisos de machine learning y refinar algoritmos predictivos.
Según Gartner, el 61 % de las organizaciones informan que tienen que evolucionar o repensar su modelo operativo de datos y analytics debido al impacto de las tecnologías de AI.1