¿Qué es un mercado de datos?

Un mercado de datos es un subconjunto de un almacén de datos centrado en una línea de negocio, departamento o área temática en particular. Los mercados de datos pueden mejorar la eficiencia del equipo, reducir los costos y facilitar una toma de decisiones comerciales táctica más inteligente en las empresas.

Los data marts ponen datos específicos a disposición de un grupo definido de usuarios, lo que permite a esos usuarios acceder rápidamente a información crítica sin perder tiempo buscando en todo un data warehouse. Por ejemplo, muchas empresas pueden tener un data mart que se alinea con un departamento específico en el negocio, como finanzas, ventas o marketing.

Las últimas noticias tecnológicas, respaldadas por los insights de expertos

Manténgase al día sobre las tendencias más importantes e intrigantes de la industria sobre IA, automatización, datos y más con el boletín Think. Consulte la Declaración de privacidad de IBM.

Data mart versus almacén de datos versus lago de datos

Los data marts, los almacenes de datos y los lagos de datos son repositorios de datos centrales cruciales, pero satisfacen diferentes necesidades dentro de una organización.

Un almacén de datos es un sistema que agrega datos de múltiples fuentes en un único almacén de datos central y coherente para respaldar la minería de datos, la inteligencia artificial (IA) y el machine learning, que, en última instancia, pueden mejorar el análisis sofisticado y la business intelligence. A través de este proceso de recopilación estratégica, las soluciones de almacén de datos consolidan los datos de las diferentes fuentes para que estén disponibles en una forma unificada.

Un mercado de datos (como se señaló anteriormente) es una versión enfocada de un almacén de datos que contiene un subconjunto más pequeño de datos importantes y necesarios para un solo equipo o un grupo selecto de usuarios dentro de una organización. Un mercado de datos se construye a partir de un almacén de datos existente (u otras fuentes de datos) a través de un procedimiento complejo que involucra múltiples tecnologías y herramientas para diseñar y construir una base de datos física, poblarla con datos y configurar intrincados protocolos de acceso y gestión.

Si bien es un proceso desafiante, permite que una línea de negocio descubra insights más enfocados más rápido que trabajar con un conjunto de datos de almacén de datos más amplio. Por ejemplo, los equipos de marketing pueden beneficiarse de la creación de un mercado de datos a partir de un almacén existente, ya que sus actividades suelen realizarse de forma independiente del resto de la empresa. Por lo tanto, el equipo no necesita acceder a todos los datos de la empresa.

Un lago de datos también es un depósito de datos. Un lago de datos proporciona almacenamiento masivo de datos no estructurados o en bruto alimentados a través de múltiples fuentes, pero la información aún no fue procesada ni preparada para su análisis. Al poder almacenar datos en formato bruto, los lagos de datos son más accesibles y rentables que los almacenes de datos. No es necesario limpiar y procesar los datos antes de ingestarlos.

Por ejemplo, los gobiernos pueden usar la tecnología para rastrear datos sobre el comportamiento del tráfico, el uso de energía y las vías fluviales, y almacenarlos en un lago de datos mientras descubren cómo usar los datos para crear "ciudades más inteligentes" con servicios más eficientes.

Academia de IA

¿Es la gestión de datos el secreto de la IA generativa?

Explore por qué los datos de alta calidad son esenciales para el uso exitoso de la IA generativa.

Ir al episodio

Beneficios de un data mart

Los data marts están diseñados para satisfacer las necesidades de grupos específicos al tener un tema de datos comparativamente limitado. Y aunque un data mart puede contener millones de registros, su objetivo es proporcionar a los usuarios empresariales los datos más relevantes en el menor tiempo posible.

Con su diseño más pequeño y enfocado, un mercado de datos tiene varios beneficios para el usuario final, incluidos los siguientes:

Rentabilidad: hay muchos factores a considerar al configurar un mercado de datos, como el alcance, las integraciones y el proceso de extracción, transformación y carga (ETL). Sin embargo, un mercado de datos sólo suele suponer una fracción del costo de un almacén de datos.
Acceso simplificado a los datos: los mercados de datos solo contienen un pequeño subconjunto de datos, por lo que los usuarios pueden recuperar rápidamente los datos que necesitan con menos esfuerzo que cuando trabajan con un conjunto de datos más amplio de un depósito de datos.
Acceso más rápido a la información: la intuición obtenida de un almacén de datos respalda la toma de decisiones estratégicas a nivel empresarial, lo que repercute en todo el negocio. Un data mart alimenta la inteligencia empresarial y los análisis que guían las decisiones a nivel de departamento. Los equipos pueden aprovechar los insights de los datos centrados en sus objetivos específicos. A medida que los equipos identifican y extraen datos valiosos en menos tiempo, la compañía se beneficia del aceleramiento de los procesos empresariales y de una mayor productividad.
Mantenimiento de datos más sencillo: un almacén de datos contiene una gran cantidad de información empresarial, con alcance para múltiples líneas de negocio. Los mercados de datos se centran en una sola línea, que alberga menos de 100 GB, lo que genera menos desorden y facilita el mantenimiento.
Implementación más fácil y rápida: un almacén de datos implica un tiempo de implementación significativo, especialmente en una gran compañía, ya que recopila datos de una gran cantidad de fuentes internas y externas. Por otro lado, solo necesita un pequeño subconjunto de datos al configurar un data mart, por lo que la implementación tiende a ser más eficiente e incluir menos tiempo de configuración.

Tipos de data marts

Hay tres tipos de mercados de datos que difieren en función de su relación con el almacén de datos y las respectivas fuentes de datos de cada sistema.

Los data marts dependientes son segmentos particionados dentro de un data warehouse empresarial. Este enfoque de arriba hacia abajo comienza con el almacenamiento de todos los datos comerciales en una ubicación central. Los data marts recién creados extraen un subconjunto definido de los datos primarios cuando es necesario para el análisis.
Los data marts independientes actúan como un sistema independiente que no depende de un almacén de datos. Los analistas pueden extraer datos sobre un tema o proceso de negocio en particular de fuentes de datos internas o externas, procesarlos y luego almacenarlos en un repositorio de data mart hasta que el equipo los necesite.
Los data marts híbridos combinan datos de almacenes de datos existentes y otras fuentes operativas. Este enfoque unificado aprovecha la velocidad y la interfaz fácil de usar de un enfoque descendente y también ofrece la integración a nivel empresarial del método independiente.

Estructura de un mercado de datos

Un mercado de datos es una base de datos relacional orientada a temas que almacena datos transaccionales en filas y columnas, lo que facilita el acceso, la organización y la comprensión. Como contiene datos históricos, esta estructura facilita que un analista determine las tendencias de los datos. Los campos de datos típicos incluyen orden numérico, valor de tiempo y referencias a uno o más objetos.

Las compañías organizan los data marts en un esquema multidimensional como un plano para atender las necesidades de las personas que emplean las bases de datos para tareas analíticas. Los tres tipos principales de esquemas son estrella, copo de nieve y bóveda.

Estrella

El esquema en estrella es una formación lógica de tablas en una base de datos multidimensional que se asemeja a una forma de estrella. En este modelo, una tabla de hechos (un conjunto de métricas que se relaciona con un evento o proceso de negocio específico) reside en el centro de la estrella, rodeada por varias tablas de dimensiones asociadas.

No hay dependencia entre las tablas de dimensiones, por lo que un esquema de estrella requiere menos combinaciones al escribir consultas. Esta estructura facilita las consultas, por lo que los esquemas de estrella son muy eficaces para los analistas que desean acceder y navegar por grandes conjuntos de datos.

Snowflake

Un esquema de copo de nieve es una extensión lógica de un esquema de estrella, construyendo el proyecto técnico con tablas de dimensiones adicionales. Las tablas de dimensiones están normalizadas para proteger la integridad de los datos y minimizar la redundancia de datos.

Si bien este método requiere menos espacio para almacenar tablas de dimensiones, es una estructura compleja que puede ser difícil de mantener. El principal beneficio de usar el esquema de copo de nieve es la baja demanda de espacio en disco, pero la advertencia es un impacto negativo en el rendimiento debido a las tablas adicionales.

Vault

Data Vault es una técnica moderna de modelado de bases de datos que permite a los profesionales de TI diseñar almacenes de datos empresariales ágiles. Este enfoque aplica una estructura en capas y se ha desarrollado específicamente para combatir los problemas de agilidad, flexibilidad y escalabilidad que surgen al utilizar los otros modelos de esquema.

El almacén de datos elimina la necesidad de limpieza del esquema en estrella y agiliza la adición de nuevas fuentes de datos sin interrumpir el esquema existente.

¿Quién utiliza un mercado de datos (y cómo)?

Los data marts guían las decisiones empresariales importantes a nivel departamental. Por ejemplo, un equipo de marketing puede emplear data marts para analizar los comportamientos de los consumidores, mientras que el personal de ventas podría emplear data marts para compilar reportes de ventas trimestrales. Dado que estas tareas se realizan dentro de sus respectivos departamentos, los equipos no necesitan acceder a todos los datos de la compañía.

Normalmente, un data mart es creado y gestionado por el departamento comercial específico que pretende emplearlo. El proceso de diseño de un data mart generalmente comprende los siguientes pasos:

Documente los requisitos esenciales para comprender las necesidades comerciales y técnicas del mercado de datos.
Identifique las fuentes de datos en las que confiará su mercado de datos para obtener información.
Determine el subconjunto de datos, ya sea toda la información sobre un tema o campos específicos a un nivel más granular.
Diseñe el diseño lógico para el mercado de datos eligiendo un esquema que se correlacione con el almacén de datos más grande.

Una vez hecho el trabajo preliminar, puede obtener el máximo valor de un mercado de datos utilizando herramientas especializadas de business intelligence, como Qlik o SiSense. Estas soluciones incluyen un panel y visualizaciones que facilitan el discernimiento de los insights de los datos, lo que en última instancia conduce a decisiones más inteligentes que benefician a la empresa.

Data mart y arquitectura en la nube

Si bien los data marts ofrecen a las compañías los beneficios de una mayor eficiencia y flexibilidad, el crecimiento imparable de los datos plantea un problema para las compañías que continúan empleando una solución on-premises.

A medida que los almacenes de datos se muevan a la nube, seguirán los data marts. Al consolidar los recursos de datos en un único repositorio que contiene todos los data marts, las empresas pueden reducir costos y garantizar que todos los departamentos tengan acceso sin trabas a los datos que necesitan en tiempo real.

Las plataformas basadas en la nube permiten crear, compartir y almacenar conjuntos de datos masivos con facilidad, allanando el camino para un acceso y análisis de datos más eficiente y eficaz. Los sistemas en la nube están diseñados para un crecimiento empresarial sostenible, y muchos proveedores modernos de software como servicio (SaaS) separan el almacenamiento de datos de la computación para mejorar la escalabilidad al consultar datos.

Representación 3D de una espiral de varios iconos alineados, como una cámara, una perilla de volumen y un portapapeles

Lea la guía del líder de datos para saber cómo puede hacer que los datos de su organización estén preparados para IA.

Recursos

Representación 3D de varios iconos alineados, como un micrófono y una cámara

Los agentes de IA funcionan con datos. ¿Están listos los suyos?

Sus datos son su ventaja competitiva. Aprenda a desbloquear de forma segura y a generar un retorno de la inversión (ROI) medible de la IA en este breve seminario web.

Explicación de la gestión de datos

Techsplainers de IBM desglosa los aspectos esenciales de los datos para la IA, desde conceptos clave hasta casos de uso del mundo real. Los episodios claros y rápidos le ayudan a aprender los fundamentos rápidamente.

Representación 3D de varios iconos alineados, como una perilla de volumen y un portapapeles

Unifique y acceda a sus datos para ayudar a escalar su IA

Descubra por qué el camino hacia los datos preparados para la IA a menudo comienza con el acceso efectivo a datos estructurados y no estructurados y los desafíos que pueden obstaculizar a los líderes de datos.

Gastos generales legales convertidos en insights estratégicos

Descubra cómo un agente legal impulsado por IA ayuda a acelerar la toma de decisiones, reducir el trabajo manual y mejorar el cumplimiento.

AI Academy: creación de una estrategia de datos para la IA empresarial

En este episodio, Cathy Reese explica cómo las organizaciones de hoy necesitan una estrategia de datos que esté lista para la IA avanzada, lo que requerirá que aprovechen sus activos de datos de la más alta calidad.

Representación 3D de varios iconos alineados, como una cámara y aviones de papel

El lakehouse de datos híbrido y abierto para la IA

Simplifique el acceso a los datos y automatice su gobernanza. Descubra el poder de integrar una estrategia de lakehouse de datos en su arquitectura de datos, incluida la optimización de costos de sus cargas de trabajo y el escalado de IA y analytics, con todos sus datos, en cualquier lugar.

Informe del costo de una filtración de datos 2025

Los costos de la filtración de datos alcanzaron un nuevo máximo. Obtenga insights actualizados sobre las amenazas de ciberseguridad y sus impactos financieros en las organizaciones.

Representación 3D de dos líneas de varios íconos, como una cámara, una perilla de volumen y un portapapeles

La guía del líder de datos preparados para IA

Comprenda los pasos aplicables en la práctica que los líderes de datos pueden tomar para superar los desafíos de los datos, establecer los fundamentos para una base de datos confiable y ayudar a preparar los datos de su organización para la IA.

Representación 3D de varios íconos alineados, como una cámara, una perilla de volumen y un portapapeles

Cómo los altos ejecutivos están convirtiendo la información en impacto

Explore los insights de 1700 CDO en este informe de industrias para líderes de datos.

Soluciones relacionadas

IBM StreamSets

Cree y gestione canalizaciones de datos de streaming inteligentes a través de una interfaz gráfica intuitiva, y facilite una integración de datos fluida en entornos híbridos y multinube.

Explorar StreamSets

IBM watsonx.data™

watsonx.data le permite escalar los analytics y la IA con todos sus datos, residan donde residan, a través de un almacén de datos abierto, híbrido y gestionado.

Descubra watsonx.data

Servicios de consultoría en datos y analytics

Desbloquee el valor de los datos empresariales con IBM Consulting, y construya una organización impulsada por insights que ofrezca ventajas empresariales.

Descubra los servicios de analytics

Dé el siguiente paso

Diseñe una estrategia de datos que elimine los silos de datos, reduzca la complejidad y mejore la calidad de los datos para ofrecer experiencias excepcionales a clientes y empleados.

¿Qué es un mercado de datos?