¿Qué es OLAP?
OLAP habilita un análisis de datos multidimensionales rápido y flexible para aplicaciones de inteligencia empresarial (BI, business intelligence) y de soporte a las decisiones en implementaciones de almacenamiento de datos
Fondo negro y azul
¿Qué es OLAP?

OLAP (del inglés Online Analytical Processing: procesamiento analítico en línea) es software para realizar análisis multidimensional a altas velocidades sobre grandes volúmenes de datos de un almacén de datos, data mart o algún otro tipo de almacén de datos unificado y centralizado.

La mayoría de los datos empresariales tienen varios dimensiones: múltiples categorías en las que se dividen los datos para su presentación, seguimiento o análisis. Por ejemplo, las cifras de ventas pueden presentar varias dimensiones relacionadas con la ubicación (región, país, estado/provincia, tienda), el tiempo (año, mes, semana, día), el producto (ropa, hombres/mujeres/niños, marca, tipo) y más.

Pero en un almacén de datos, los conjuntos de datos se almacenan en tablas, cada una de las cuales puede organizar datos en solo dos de estas dimensiones a la vez. OLAP extrae datos de varios conjuntos de datos relacionales y los reorganiza en un formato multidimensional que permite un procesamiento muy rápido y un análisis muy minucioso. 

¿Qué es un cubo OLAP?

El cubo OLAP es el núcleo de la mayoría de los sistemas OLAP y consiste en una base de datos multidimensional basada en matrices que posibilita el procesamiento y el análisis de varias dimensiones de datos de manera mucho más rápida y eficiente que una base de datos relacional tradicional.

Una tabla de base de datos relacional está estructurada como una hoja de cálculo, que almacena registros individuales en un formato bidimensional de fila por columna. Cada "hecho" de datos en la base de datos reside en la intersección de dos dimensiones (una fila y una columna), como región y ventas totales.

Las herramientas de generación de informes de bases de datos relacionales y SQL ciertamente pueden realizar consultas, informes y análisis de datos multidimensionales almacenados en tablas, pero el rendimiento se ralentiza a medida que los volúmenes de datos aumentan. Y requiere mucho trabajo reorganizar los resultados para enfocarlos en diferentes dimensiones.

Aquí es donde entra en juego el cubo OLAP. El cubo OLAP amplía la tabla única con capas adicionales, cada una de las cuales agrega dimensiones adicionales, normalmente el siguiente nivel en la "jerarquía de conceptos" de la dimensión. Por ejemplo, la parte superior del cubo podría organizar las ventas por región; capas adicionales podrían ser país, estado/provincia, ciudad e incluso una tienda específica.

En teoría, un cubo puede contener un número infinito de capas (un cubo OLAP que representa más de tres dimensiones a veces se denomina hipercubo). Y pueden existir cubos más pequeños dentro de las capas; por ejemplo, cada capa de tienda podría contener cubos organizando las ventas por vendedor y producto. En la práctica, los analistas de datos crearán los cubos OLAP que contienen solo las capas que necesitan, para un análisis y un rendimiento óptimos. 

Profundización (Drill-down)

La operación de profundización convierte datos menos detallados en datos más detallados a través de uno de dos métodos: desplazarse hacia abajo en la jerarquía de conceptos o agregar una nueva dimensión al cubo. Por ejemplo, si visualiza los datos de ventas para el trimestre fiscal o natural de una organización, puede profundizar para ver las ventas de cada mes, desplazándose hacia abajo en la jerarquía de conceptos de la dimensión "tiempo".

Consolidación (Roll up)

La consolidación es la función opuesta a la profundización, ya que agrega datos en un cubo OLAP subiendo en la jerarquía de conceptos o reduciendo el número de dimensiones. Por ejemplo, podría desplazarse hacia arriba en la jerarquía de conceptos de la dimensión "ubicación" visualizando los datos de cada país, en lugar de cada ciudad.

Desglose (Slice and dice)

La operación de desglose crea un subcubo seleccionando una única dimensión del cubo OLAP principal. Por ejemplo, puede realizar un desglose resaltando todos los datos del primer trimestre fiscal o natural de la organización (dimensión de tiempo).

Esta operación aísla un subcubo seleccionando varias dimensiones dentro del cubo OLAP principal. Por ejemplo, podría realizar una operación de desglose resaltando todos los datos del primer trimestre fiscal o natural de la organización (dimensión de tiempo) y dentro de los EE. UU. y Canadá (dimensión de ubicación).

Rotación (Pivot)

La función de rotación gira la vista actual del cubo para visualizar una nueva representación de los datos mediante vistas multidimensionales dinámicas. La función de rotación de OLAP es comparable a la función de tablas dinámicas en software de hojas de cálculo, como Microsoft Excel, pero mientras que las tablas dinámicas en Excel pueden ser complicadas, las rotaciones de OLAP son relativamente más fáciles de utilizar (se requiere menos experiencia) y tienen un tiempo de respuesta y rendimiento de las consultas más rápido.

Comparación entre MOLAP, ROLAP y HOLAP

OLAP que trabaja directamente con un cubo OLAP multidimensional es conocido como OLAP multidimensional o MOLAP. Nuevamente, para la mayoría de los usos, MOLAP es el tipo más rápido y práctico de análisis de datos multidimensionales.

Sin embargo, hay otros dos tipos de OLAP que pueden encajar mejor en determinados casos:

ROLAP

ROLAP, u OLAP relacional, es un análisis de datos multidimensionales que opera directamente sobre datos en tablas relacionales, sin reorganizar primero los datos en un cubo.

Como se ha señalado anteriormente, SQL es una herramienta perfectamente capaz de realizar consultas, informes y análisis multidimensionales. Pero las consultas SQL requeridas son complejas, el rendimiento puede caer y la versión resultante de los datos es estática, no se puede girar para representar otra vista de los datos. ROLAP es mejor cuando la capacidad para trabajar directamente con grandes cantidades de datos es más importante que el rendimiento y la flexibilidad.

HOLAP

HOLAP, u OLAP híbrido, intenta crear la división óptima de trabajo entre bases de datos relacionales y multidimensionales dentro de una arquitectura OLAP única. Las tablas relacionales contienen mayores cantidades de datos, y los cubos OLAP se utilizan para agregaciones y proceso especulativos. HOLAP requiere un servidor OLAP que admita tanto MOLAP como ROLAP.

Una herramienta HOLAP puede "profundizar" en el cubo de datos hasta las tablas relacionales, lo que allana el camino para un procesamiento de datos rápido y un acceso flexible. Este sistema híbrido puede ofrecer una mejor escalabilidad pero no puede escapar de la inevitable ralentización cuando se accede a fuentes de datos relacionales. Además, su compleja arquitectura requiere actualizaciones y mantenimiento más frecuentes, ya que debe almacenar y procesar todos los datos de bases de datos relacionales y bases de datos multidimensionales. Por esta razón, HOLAP puede llegar a ser más caro.

OLAP frente a OLTP

El procesamiento de transacciones en línea, u OLTP, se refiere a métodos y software de procesamiento de datos enfocados en datos y aplicaciones en torno a transacciones. 

La principal diferencia entre OLAP y OLTP reside en el nombre: OLAP es de naturaleza analítica y OLTP es transaccional. 

Las herramientas OLAP están diseñadas para el análisis multidimensional de datos en un almacén de datos, que contiene tanto datos transaccionales como históricos. De hecho, un servidor OLAP suele ser el nivel analítico medio de una solución de almacén de datos. Los usos comunes de OLAP incluyen minería de datos y otras aplicaciones de inteligencia empresarial, cálculos analíticos complejos y escenarios predictivos, así como funciones de generación de informes empresariales, como el análisis financiero, la elaboración de presupuestos o la planificación de previsiones.

OLTP está diseñado para dar soporte a aplicaciones orientadas a transacciones mediante el procesamiento de transacciones recientes de la manera más rápida y precisa posible. Los usos comunes de OLTP incluyen cajeros automáticos, software de comercio electrónico, procesamiento de pagos con tarjeta de crédito, reservas en línea, sistemas de reserva y herramientas de mantenimiento de registros.

Para obtener información detallada sobre las diferencias entre estos enfoques, consulte "OLAP frente a OLTP: ¿en qué se diferencian?"

OLAP y arquitectura en nube

OLAP permite a las empresas maximizar el potencial de sus datos corporativos transformándolos en el formato más práctico para el análisis multidimensional. Esto, a su vez, permite discernir más fácilmente información de negocio valiosa. Sin embargo, si estos sistemas se mantienen internamente, limita su escalabilidad.

Los servicios OLAP basados en la nube son menos costosos y más fáciles de configurar, lo que los hace más atractivos para pequeñas empresas o startups con un presupuesto más ajustado. De esta manera, las empresas obtienen acceso al vasto potencial de los almacenes de datos basados en la nube que realizan análisis sofisticados a velocidades inigualables porque utilizan el procesamiento en paralelo masivo (MPP, por sus siglas en inglés). Por lo tanto, las empresas pueden utilizar OLAP con la velocidad y escalabilidad de la nube, analizando grandes cantidades de datos sin moverlos de su almacén de datos en la nube.

Constance Hotels, Resorts & Golf es un grupo de hoteles de lujo con nueve propiedades en islas del Océano Índico. Sin embargo, la falta de comunicaciones entre islas generó silos organizacionales, con datos empresariales aislados en cada complejo hotelero. La organización creó una arquitectura de análisis y un almacén de datos en la nube para vincular todas las herramientas y sistemas en local con un repositorio de datos central basado en la nube. Gracias a ello, la compañía obtuvo la perspectiva de todo el grupo que necesitaba para aprovechar el análisis predictivo avanzado e implementar un sistema OLAP.

OLAP en una arquitectura en la nube es una solución rápida y rentable orientada al futuro. Una vez que se crean los cubos, los equipos pueden utilizar las herramientas de inteligencia empresarial existentes para conectarse al instante con el modelo OLAP y extraer información interactiva en tiempo real de sus datos en la nube.

Soluciones relacionadas
IBM Db2 Warehouse on Cloud

IBM Db2 Warehouse on Cloud es una servicio de nube pública gestionado. Puede configurar IBM Db2 Warehouse en local con su propio hardware o en una nube privada.

Explore IBM Db2 Warehouse on Cloud
Servicios de cubos

IBM DB2 Warehouse integra y simplifica el entorno del almacenamiento de datos con un almacén dinámico y soporte directo para OLAP en torno al almacén de datos.

Explore los servicios de cubos
Dé el siguiente paso

IBM Db2 Warehouse on Cloud es una servicio de nube pública gestionado. Puede configurar IBM Db2 Warehouse en local con su hardware o en una nube privada. Como almacén de datos, este servicio incluye funcionalidades como el procesamiento de datos en memoria y tablas de columnas para el procesamiento analítico en línea (OLAP). Como estas funciones comparten un motor común de base de datos, puede optimizar o migrar fácilmente las cargas de trabajo de datos.

Explore IBM Db2 Warehouse on Cloud hoy