¿Qué es OLAP (procesamiento analítico en línea)?
Explore la solución OLAP de IBM Suscríbase para recibir actualizaciones sobre IA
Ilustración con collage de pictogramas de nubes, gráfico circular, pictogramas gráficos en lo siguiente
¿Qué es OLAP?

OLAP, o procesamiento analítico en línea, es una tecnología para realizar consultas complejas a alta velocidad o análisis multidimensionales de grandes volúmenes de datos en un almacén de datos, data lake u otro repositorio de datos. OLAP se utiliza en business intelligence (BI), apoyo en la toma de decisiones y diversas aplicaciones de previsión y elaboración de informes empresariales. 

La mayoría de los datos empresariales tienen múltiples dimensiones, es decir, múltiples categorías en las que se desglosan los datos para su presentación, seguimiento o análisis. Por ejemplo, las cifras de ventas pueden tener varias dimensiones relacionadas con la ubicación (región, país, estado/provincia, tienda), la hora (año, mes, semana, día), el producto (ropa, hombre/mujer/niño, marca, tipo), etc.

Pero en un almacén de datos o data lake, los conjuntos de datos se almacenan en tablas, cada una de las cuales puede organizar los datos en sólo dos de estas dimensiones a la vez. OLAP extrae datos de múltiples conjuntos de datos relacionales y los reorganiza en un formato multidimensional que permite un procesamiento muy rápido y un análisis muy perspicaz. 

Aprender y utilizar Presto

Explore el libro electrónico sin costo de O'Reilly para aprender los primeros pasos con Presto, el motor SQL de código abierto para analytics de datos.

Contenido relacionado

Regístrese para obtener el informe de IDC

¿Qué es un cubo OLAP?

El cubo OLAP, núcleo de la mayoría de los sistemas OLAP, es una base de datos multidimensional basada en matrices que permite procesar y analizar múltiples dimensiones de datos de forma mucho más rápida y eficaz que una base de datos relacional tradicional.

Una tabla de base de datos relacional se estructura como una hoja de cálculo, almacenando registros individuales en un formato bidimensional, fila por columna. Cada “hecho” de datos en la base de datos se encuentra en la intersección de dos dimensiones (una fila y una columna), como la región y las ventas totales.

Las herramientas de elaboración de informes SQL y de bases de datos relacionales pueden consultar, elaborar informes y analizar datos multidimensionales almacenados en tablas, pero su rendimiento se ralentiza a medida que aumenta el volumen de datos. Y requiere mucho trabajo reorganizar los resultados para centrarse en distintas dimensiones.

Aquí es donde entra en juego el cubo OLAP. El cubo OLAP amplía la tabla única con capas adicionales, cada una de las cuales añade dimensiones adicionales, normalmente el siguiente nivel en la "jerarquía de conceptos" de la dimensión. Por ejemplo, la capa superior del cubo podría organizar las ventas por región; las capas adicionales podrían ser país, estado/provincia, ciudad e incluso tienda específica.

En teoría, un cubo puede contener un número infinito de capas. (Un cubo OLAP que representa más de tres dimensiones se denomina a veces hipercubo). Y pueden existir cubos más pequeños dentro de las capas: por ejemplo, cada capa de tienda podría contener cubos que organizasen las ventas por vendedor y producto. En la práctica, los analistas de datos crearán cubos OLAP que contengan sólo las capas que necesitan, para un análisis y un rendimiento óptimos. 

Desglosar

La operación de desglose convierte los datos menos detallados en datos más detallados mediante uno de estos dos métodos: desplazándose hacia abajo en la jerarquía de conceptos o añadiendo una nueva dimensión al cubo. Por ejemplo, si visualiza los datos de ventas del calendario o del trimestre fiscal de una organización, puede desglosarlos para ver las ventas de cada mes, descendiendo en la jerarquía de conceptos de la dimensión "tiempo".

Agregar

La función de agregar es lo contrario de la función de desglose: agrega datos en un cubo OLAP ascendiendo en la jerarquía de conceptos o reduciendo el número de dimensiones. Por ejemplo, podría ascender en la jerarquía de conceptos de la dimensión "ubicación" visualizando los datos de cada país, en lugar de cada ciudad.

Cortar y trocear

La operación de corte crea un subcubo seleccionando una única dimensión del cubo OLAP principal. Por ejemplo, puede realizar un corte resaltando todos los datos del primer trimestre fiscal o natural de la organización (dimensión temporal).

La operación de trocear aísla un subcubo seleccionando varias dimensiones dentro del cubo OLAP principal. Por ejemplo, podría realizar una operación de dados resaltando todos los datos por trimestres naturales o fiscales de una organización (dimensión temporal) y dentro de EE. UU. y Canadá (dimensión de ubicación).

Pivote

La función de pivote gira la vista actual del cubo para mostrar una nueva representación de los datos, lo que permite obtener vistas multidimensionales dinámicas de los datos. La función pivote de OLAP es comparable a la característica de tabla pivotante del software de hojas de cálculo, como Microsoft Excel, pero mientras que las tablas pivotantes en Excel pueden ser un reto, los pivotes OLAP son relativamente más fáciles de usar (se requiere menos experiencia) y tienen un tiempo de respuesta y un rendimiento de consulta más rápidos.

MOLAP, ROLAP y HOLAP

El OLAP que funciona directamente con un cubo OLAP multidimensional se conoce como OLAP multidemensional, o MOLAP. De nuevo, para la mayoría de los usos, MOLAP es el tipo de análisis de datos multidimensionales más rápido y práctico.

Sin embargo, hay otros dos tipos de OLAP que pueden ser preferibles en ciertos casos:

ROLAP

El ROLAP, u OLAP relacional, es un análisis multidimensional de datos que opera directamente sobre datos en tablas relacionales, sin reorganizar primero los datos en un cubo.

Como se ha señalado anteriormente, SQL es una herramienta perfectamente capaz de realizar consultas multidimensionales, informes y análisis. Pero las consultas SQL requeridas son complejas, el rendimiento puede verse afectado y la vista resultante de los datos es estática: no se puede pivotar para representar una vista diferente de los datos. ROLAP es mejor cuando la capacidad de trabajar directamente con grandes cantidades de datos es más importante que el rendimiento y la flexibilidad.

HOLAP

HOLAP, u OLAP híbrido, intenta crear la división óptima del trabajo entre bases de datos relacionales y multidimensionales dentro de una única arquitectura OLAP. Las tablas relacionales contienen mayores cantidades de datos, y los cubos OLAP se utilizan para agregaciones y procesamiento especulativo. HOLAP requiere un servidor OLAP que admita MOLAP y ROLAP.

Una herramienta HOLAP puede "perforar" el cubo de datos hasta las tablas relacionales, lo que allana el camino para un procesamiento de datos rápido y un acceso flexible. Este sistema híbrido puede ofrecer una mejor escalabilidad, pero no puede escapar a la inevitable ralentización cuando se accede a fuentes de datos relacionales. Además, su compleja arquitectura suele requerir actualizaciones y mantenimiento más frecuentes, ya que debe almacenar y procesar todos los datos de las bases de datos relacionales y las bases de datos multidimensionales. Por esta razón, HOLAP puede terminar siendo más costoso.

OLAP frente a OLTP

El procesamiento de transacciones en línea, u OLTP, se refiere a los métodos de procesamiento de datos y software centrados en datos y aplicaciones orientados a transacciones. 

La principal diferencia entre OLAP y OLTP está en el nombre: OLAP es de naturaleza analítica y OLTP es transaccional. 

Las herramientas OLAP están diseñadas para el análisis multidimensional de los datos de un almacén de datos, que contiene tanto datos transaccionales como históricos. De hecho, un servidor OLAP suele ser el nivel analítico intermedio de una solución de almacenamiento de datos. Los usos habituales de OLAP incluyen la minería de datos y otras aplicaciones de business intelligence, cálculos analíticos complejos y escenarios predictivos, así como funciones de elaboración de informes empresariales como el análisis financiero, la elaboración de presupuestos y la planificación de previsiones.

OLTP está diseñado para dar soporte a aplicaciones orientadas a transacciones, procesando las transacciones recientes de la forma más rápida y precisa posible. Los usos más comunes de OLTP incluyen cajeros automáticos, software de comercio electrónico, procesamiento de pagos con tarjeta de crédito, reservas en línea, sistemas de reservas y herramientas de mantenimiento de registros.

Para profundizar en las diferencias entre estos enfoques, consulte "OLAP frente a OLTP: ¿cuál es la diferencia?"

OLAP y arquitectura en la nube

OLAP permite a las empresas maximizar el potencial de sus datos corporativos transformándolos en el formato más práctico para el análisis multidimensional. Esto, a su vez, facilita el discernimiento de valiosos insights empresariales. Sin embargo, si estos sistemas se mantienen internamente, se limita el potencial de ampliación.

Los servicios OLAP basados en la nube son menos costosos y más fáciles de configurar, lo que los hace más atractivos para las pequeñas empresas o las nuevas empresas con un presupuesto limitado. Las empresas pueden aprovechar el enorme potencial de los almacenes de datos basados en la nube que realizan analytics sofisticados a velocidades inigualables porque utilizan el procesamiento paralelo masivo (MPP). Por lo tanto, las empresas pueden utilizar OLAP a la velocidad y escala de la nube, analizando grandes cantidades de datos sin moverlos de su almacén de datos en la nube.

Constance Hotels, Resorts & Golf es un grupo de hoteles de lujo con nueve propiedades en las islas del océano Índico. Sin embargo, la falta de comunicaciones de isla a isla dio paso a silos organizativos, con datos empresariales aislados en cada complejo turístico. La organización creó un almacén de datos en la nube y una arquitectura de análisis para enlazar todos los sistemas y herramientas on premises con un repositorio central de datos en la nube. Así, la empresa obtuvo los insights que necesitaba para aprovechar los analytics predictivos avanzados e implantar un sistema OLAP.

OLAP en arquitectura de nube es una solución rápida y rentable construida para el futuro. Una vez creados los cubos, los equipos pueden utilizar las herramientas de business intelligence existentes para conectarse instantáneamente con el modelo OLAP y extraer insights interactivos en tiempo real de sus datos en la nube.

Soluciones relacionadas
IBM Db2 Warehouse on Cloud

IBM Db2 Warehouse on Cloud es un servicio de nube pública gestionado. Puede configurar IBM Db2 Warehouse on premises con su propio hardware o en una nube privada.

Explorar IBM Db2 Warehouse on Cloud
Servicios de creación de cubos

IBM DB2 Warehouse integra y simplifica el entorno de almacén de datos ofreciendo un almacenamiento dinámico y proporcionando soporte directo para OLAP contra el almacén de datos.

Explorar los servicios de creación de cubos
Recursos Cómo elegir el almacén de datos adecuado para la IA

Acelere la innovación e impulse los resultados empresariales convirtiendo los datos en insights.

OLAP frente a OLTP: ¿cuál es la diferencia?

Estos términos se confunden a menudo entre sí, así que ¿cuáles son sus principales diferencias y cómo elegir el más adecuado para su situación?

Dé el siguiente paso

Escale cargas de trabajo de IA para todos sus datos, en cualquier lugar, con IBM watsonx.data, un almacén de datos adecuado para su propósito creado sobre una arquitectura de lakehouse de datos abierta.

Explore watsonx.data Reserve una demostración en vivo