¿Qué es un mercado de datos?

Empresaria dando una presentación en una sala de conferencias

¿Qué es un mercado de datos?

Un mercado de datos es un subconjunto de un almacén de datos centrado en una línea de negocio, departamento o área temática en particular. Los mercados de datos pueden mejorar la eficiencia del equipo, reducir los costos y facilitar una toma de decisiones comerciales táctica más inteligente en las empresas.

Los data marts ponen datos específicos a disposición de un grupo definido de usuarios, lo que permite a esos usuarios acceder rápidamente a información crítica sin perder tiempo buscando en todo un data warehouse. Por ejemplo, muchas empresas pueden tener un data mart que se alinea con un departamento específico en el negocio, como finanzas, ventas o marketing.

Diseño 3D de pelotas rodando en una pista

Las últimas novedades e insights sobre IA

Descubra insights y noticias de expertos sobre IA, la nube y mucho más en el boletín semanal Think. 

Data mart versus almacén de datos versus lago de datos

Los data marts, los almacenes de datos y los lagos de datos son repositorios de datos centrales cruciales, pero satisfacen diferentes necesidades dentro de una organización.

Un almacén de datos es un sistema que agrega datos de múltiples fuentes en un único almacén de datos central y coherente para respaldar la minería de datos, la inteligencia artificial (IA) y el machine learning, que, en última instancia, pueden mejorar el análisis sofisticado y la business intelligence. A través de este proceso de recopilación estratégica, las soluciones de almacén de datos consolidan los datos de las diferentes fuentes para que estén disponibles en una forma unificada.

Un mercado de datos (como se señaló anteriormente) es una versión enfocada de un almacén de datos que contiene un subconjunto más pequeño de datos importantes y necesarios para un solo equipo o un grupo selecto de usuarios dentro de una organización. Un mercado de datos se construye a partir de un almacén de datos existente (u otras fuentes de datos) a través de un procedimiento complejo que involucra múltiples tecnologías y herramientas para diseñar y construir una base de datos física, poblarla con datos y configurar intrincados protocolos de acceso y gestión.

Si bien es un proceso desafiante, permite que una línea de negocio descubra insights más enfocados más rápido que trabajar con un conjunto de datos de almacén de datos más amplio. Por ejemplo, los equipos de marketing pueden beneficiarse de la creación de un mercado de datos a partir de un almacén existente, ya que sus actividades suelen realizarse de forma independiente del resto de la empresa. Por lo tanto, el equipo no necesita acceder a todos los datos de la empresa.

Un lago de datos también es un depósito de datos. Un lago de datos proporciona almacenamiento masivo de datos no estructurados o en bruto alimentados a través de múltiples fuentes, pero la información aún no fue procesada ni preparada para su análisis. Al poder almacenar datos en formato bruto, los lagos de datos son más accesibles y rentables que los almacenes de datos. No es necesario limpiar y procesar los datos antes de ingestarlos.

Por ejemplo, los gobiernos pueden usar la tecnología para rastrear datos sobre el comportamiento del tráfico, el uso de energía y las vías fluviales, y almacenarlos en un lago de datos mientras descubren cómo usar los datos para crear "ciudades más inteligentes" con servicios más eficientes.

Academia de IA

¿Es la gestión de datos el secreto de la IA generativa?

Explore por qué los datos de alta calidad son esenciales para el uso exitoso de la IA generativa.

Beneficios de un data mart

Los data marts están diseñados para satisfacer las necesidades de grupos específicos al tener un tema de datos comparativamente limitado. Y aunque un data mart puede contener millones de registros, su objetivo es proporcionar a los usuarios empresariales los datos más relevantes en el menor tiempo posible.

Con su diseño más pequeño y enfocado, un mercado de datos tiene varios beneficios para el usuario final, incluidos los siguientes:

  • Rentabilidad: hay muchos factores a considerar al configurar un mercado de datos, como el alcance, las integraciones y el proceso de extracción, transformación y carga (ETL). Sin embargo, un mercado de datos sólo suele suponer una fracción del costo de un almacén de datos.

  • Acceso simplificado a los datos: los mercados de datos solo contienen un pequeño subconjunto de datos, por lo que los usuarios pueden recuperar rápidamente los datos que necesitan con menos trabajo del que podrían cuando trabajan con un conjunto de datos más amplio de un almacén de datos.

  • Acceso más rápido a la información: la intuición obtenida de un almacén de datos respalda la toma de decisiones estratégicas a nivel empresarial, lo que repercute en todo el negocio. Un data mart alimenta la inteligencia empresarial y los análisis que guían las decisiones a nivel de departamento. Los equipos pueden aprovechar los insights de los datos centrados en sus objetivos específicos. A medida que los equipos identifican y extraen datos valiosos en menos tiempo, la compañía se beneficia del aceleramiento de los procesos empresariales y de una mayor productividad.

  • Mantenimiento de datos más sencillo: un almacén de datos contiene una gran cantidad de información empresarial, con alcance para múltiples líneas de negocio. Los mercados de datos se centran en una sola línea, que alberga menos de 100 GB, lo que genera menos desorden y facilita el mantenimiento.

  • Implementación más fácil y rápida: un almacén de datos implica un tiempo de implementación significativo, especialmente en una gran compañía, ya que recopila datos de una gran cantidad de fuentes internas y externas. Por otro lado, solo necesita un pequeño subconjunto de datos al configurar un data mart, por lo que la implementación tiende a ser más eficiente e incluir menos tiempo de configuración.

Tipos de data marts

Hay tres tipos de mercados de datos que difieren en función de su relación con el almacén de datos y las respectivas fuentes de datos de cada sistema.

  • Los data marts dependientes son segmentos particionados dentro de un data warehouse empresarial. Este enfoque de arriba hacia abajo comienza con el almacenamiento de todos los datos comerciales en una ubicación central. Los data marts recién creados extraen un subconjunto definido de los datos primarios cuando es necesario para el análisis.

  • Los data marts independientes actúan como un sistema independiente que no depende de un almacén de datos. Los analistas pueden extraer datos sobre un tema o proceso de negocio en particular de fuentes de datos internas o externas, procesarlos y luego almacenarlos en un repositorio de data mart hasta que el equipo los necesite.

  •  Los data marts híbridos combinan datos de almacenes de datos existentes y otras fuentes operativas. Este enfoque unificado aprovecha la velocidad y la interfaz fácil de usar de un enfoque descendente y también ofrece la integración a nivel empresarial del método independiente.

Estructura de un mercado de datos

Un mercado de datos es una base de datos relacional orientada a temas que almacena datos transaccionales en filas y columnas, lo que facilita el acceso, la organización y la comprensión. Como contiene datos históricos, esta estructura facilita que un analista determine las tendencias de los datos. Los campos de datos típicos incluyen orden numérico, valor de tiempo y referencias a uno o más objetos.

Las compañías organizan los data marts en un esquema multidimensional como un plano para atender las necesidades de las personas que emplean las bases de datos para tareas analíticas. Los tres tipos principales de esquemas son estrella, copo de nieve y bóveda.

Estrella

El esquema en estrella es una formación lógica de tablas en una base de datos multidimensional que se asemeja a una forma de estrella. En este modelo, una tabla de hechos (un conjunto de métricas que se relaciona con un evento o proceso de negocio específico) reside en el centro de la estrella, rodeada por varias tablas de dimensiones asociadas.

No hay dependencia entre las tablas de dimensiones, por lo que un esquema de estrella requiere menos combinaciones al escribir consultas. Esta estructura facilita las consultas, por lo que los esquemas de estrella son muy eficaces para los analistas que desean acceder y navegar por grandes conjuntos de datos.

Snowflake

Un esquema de copo de nieve es una extensión lógica de un esquema de estrella, construyendo el proyecto técnico con tablas de dimensiones adicionales. Las tablas de dimensiones están normalizadas para proteger la integridad de los datos y minimizar la redundancia de datos.

Si bien este método requiere menos espacio para almacenar tablas de dimensiones, es una estructura compleja que puede ser difícil de mantener. El principal beneficio de usar el esquema de copo de nieve es la baja demanda de espacio en disco, pero la advertencia es un impacto negativo en el rendimiento debido a las tablas adicionales.

Vault

Data Vault es una técnica moderna de modelado de bases de datos que permite a los profesionales de TI diseñar almacenes de datos empresariales ágiles. Este enfoque aplica una estructura en capas y se ha desarrollado específicamente para combatir los problemas de agilidad, flexibilidad y escalabilidad que surgen al utilizar los otros modelos de esquema.

El almacén de datos elimina la necesidad de limpieza del esquema en estrella y agiliza la adición de nuevas fuentes de datos sin interrumpir el esquema existente.

¿Quién utiliza un mercado de datos (y cómo)?

Los data marts guían las decisiones empresariales importantes a nivel departamental. Por ejemplo, un equipo de marketing puede emplear data marts para analizar los comportamientos de los consumidores, mientras que el personal de ventas podría emplear data marts para compilar reportes de ventas trimestrales. Dado que estas tareas se realizan dentro de sus respectivos departamentos, los equipos no necesitan acceder a todos los datos de la compañía.

Normalmente, un data mart es creado y gestionado por el departamento comercial específico que pretende emplearlo. El proceso de diseño de un data mart generalmente comprende los siguientes pasos:

  1. Documente los requisitos esenciales para comprender las necesidades comerciales y técnicas del mercado de datos.

  2. Identifique las fuentes de datos en las que confiará su mercado de datos para obtener información.

  3. Determine el subconjunto de datos, ya sea toda la información sobre un tema o campos específicos a un nivel más granular.

  4. Diseñe el diseño lógico para el mercado de datos eligiendo un esquema que se correlacione con el almacén de datos más grande.

Una vez hecho el trabajo preliminar, puede obtener el máximo valor de un mercado de datos utilizando herramientas especializadas de business intelligence, como Qlik o SiSense. Estas soluciones incluyen un panel y visualizaciones que facilitan el discernimiento de los insights de los datos, lo que en última instancia conduce a decisiones más inteligentes que benefician a la empresa.

Data mart y arquitectura en la nube

Si bien los data marts ofrecen a las compañías los beneficios de una mayor eficiencia y flexibilidad, el crecimiento imparable de los datos plantea un problema para las compañías que continúan empleando una solución on-premises.

A medida que los almacenes de datos se muevan a la nube, seguirán los data marts. Al consolidar los recursos de datos en un único repositorio que contiene todos los data marts, las empresas pueden reducir costos y garantizar que todos los departamentos tengan acceso sin trabas a los datos que necesitan en tiempo real.

Las plataformas basadas en la nube permiten crear, compartir y almacenar conjuntos de datos masivos con facilidad, allanando el camino para un acceso y análisis de datos más eficiente y eficaz. Los sistemas en la nube están diseñados para un crecimiento empresarial sostenible, y muchos proveedores modernos de software como servicio (SaaS) separan el almacenamiento de datos de la computación para mejorar la escalabilidad al consultar datos.

Soluciones relacionadas
IBM watsonx.data

watsonx.data le permite escalar los analytics y la IA con todos sus datos, sin importar donde residan, a través de un almacén de datos abierto, híbrido y gobernado.

Descubra watsonx.data
Soluciones de almacenamiento de datos

Escale las cargas de trabajo de analytics e IA siempre activas y de alto rendimiento en datos gobernados en toda su organización

Explore las soluciones de almacenamiento de datos
Servicios de consultoría en datos y analytics

Desbloquee el valor de los datos empresariales con IBM Consulting y cree una organización impulsada por insights que ofrezca ventajas empresariales.

Descubra los servicios de analytics
Dé el siguiente paso

Unifique todos sus datos para IA y analytics con IBM watsonx.data. Ponga sus datos a trabajar, dondequiera que residan, con el lakehouse de datos híbrido y abierto para IA y analytics.

Descubra watsonx.data Explore las soluciones de almacenamiento de datos