¿Qué es OLAP?
Fondo negro y azul
¿Qué es OLAP?

OLAP (del inglés Online Analytical Processing: procesamiento analítico en línea) es un software para realizar análisis multidimensionales a altas velocidades en grandes volúmenes de datos de un almacén de datos, data mart o algún otro almacén de datos unificado y centralizado.

La mayoría de los datos comerciales tienen varias dimensiones: varias categorías en las que se desglosan los datos para su presentación, seguimiento o análisis. Por ejemplo, las cifras de ventas pueden tener varias dimensiones relacionadas con la ubicación (región, país, estado/provincia, tienda), tiempo (año, mes, semana, día), producto (ropa, hombres/mujeres/niños, marca, tipo) y más.

Pero en un almacén de datos, los conjuntos de datos se almacenan en tablas, cada una de las cuales puede organizar los datos en solo dos de estas dimensiones a la vez. OLAP extrae datos de múltiples conjuntos de datos relacionales y los reorganiza en un formato multidimensional que permite un procesamiento muy rápido y un análisis muy minucioso. 

¿Qué es un cubo OLAP?

 El cubo OLAP es el núcleo de la mayoría de los sistemas OLAP y consiste en una base de datos multidimensional basada en arreglos que hace posible procesar y analizar múltiples dimensiones de datos de manera mucho más rápida y eficiente que una base de datos relacional tradicional.

Una tabla de base de datos relacional está estructurada como una hoja de cálculo y almacena registros individuales en un formato bidimensional de fila por columna. Cada "hecho" de datos en la base de datos se encuentra en la intersección de dos dimensiones, una fila y una columna, como región y ventas totales.

Las herramientas de informes de bases de datos relacionales y SQL ciertamente pueden consultar, informar y analizar datos multidimensionales almacenados en tablas, pero el rendimiento se ralentiza a medida que aumentan los volúmenes de datos. Y requiere mucho trabajo reorganizar los resultados para enfocarlos en diferentes dimensiones.

Aquí es donde entra el cubo OLAP. El cubo OLAP amplía la tabla única con capas adicionales, cada una de las cuales agrega dimensiones adicionales, generalmente el siguiente nivel en la "jerarquía de conceptos" de la dimensión. Por ejemplo, la capa superior del cubo podría organizar las ventas por región. Las capas adicionales pueden ser país, estado/provincia, ciudad e incluso una tienda específica.

En teoría, un cubo puede contener un número infinito de capas. (Un cubo OLAP que representa más de tres dimensiones a veces se denomina hipercubo). Y pueden existir cubos más pequeños dentro de las capas; por ejemplo, cada capa de la tienda podría contener cubos que ordenen las ventas por vendedor y producto.

En la práctica, los analistas de datos crearán cubos OLAP que contienen solo las capas que necesitan para un análisis y un rendimiento óptimos. 

Profundización (Drill-down)

La operación de profundización convierte los datos menos detallados en datos más detallados a través de uno de dos métodos: moverse hacia abajo en la jerarquía de conceptos o agregar una nueva dimensión al cubo.

Por ejemplo, si ve los datos de ventas para el calendario o el trimestre fiscal de una organización, puede desglosarlos para ver las ventas de cada mes, moviéndose hacia abajo en la jerarquía de conceptos de la dimensión "tiempo".

Consolidación (Roll up)

La consolidación es la función opuesta a la profundización, ya que agrega datos en un cubo OLAP subiendo en la jerarquía de conceptos o reduciendo el número de dimensiones.

Por ejemplo, podría desplazarse hacia arriba en la jerarquía de conceptos de la dimensión "ubicación" visualizando los datos de cada país, en lugar de cada ciudad.

Desglose (Slice and dice)

La operación de desglose crea un subcubo seleccionando una única dimensión del cubo OLAP principal.

Por ejemplo, puede realizar un desglose resaltando todos los datos del primer trimestre fiscal o natural de la organización (dimensión de tiempo).

Esta operación aísla un subcubo seleccionando varias dimensiones dentro del cubo OLAP principal. Por ejemplo, podría realizar una operación de desglose resaltando todos los datos del primer trimestre fiscal o natural de la organización (dimensión de tiempo) y dentro de los EE. UU. y Canadá (dimensión de ubicación).

Rotación (Pivot)

La función de rotación gira la vista actual del cubo para visualizar una nueva representación de los datos mediante vistas multidimensionales dinámicas.

La función de rotación de OLAP es comparable a la función de tablas dinámicas en software de hojas de cálculo, como Microsoft Excel, pero mientras que las tablas dinámicas en Excel pueden ser complicadas, las rotaciones de OLAP son relativamente más fáciles de utilizar (se requiere menos experiencia) y tienen un tiempo de respuesta y rendimiento de las consultas más rápido.

MOLAP frente a ROLAP frente a HOLAP

OLAP que trabaja directamente con un cubo OLAP multidimensional es conocido como OLAP multidimensional o MOLAP. Nuevamente, para la mayoría de los usos, MOLAP es el tipo más rápido y práctico de análisis de datos multidimensionales.

Sin embargo, hay otros dos tipos de OLAP que pueden encajar mejor en determinados casos:

ROLAP

ROLAP, u OLAP relacional, es un análisis de datos multidimensional que opera directamente sobre datos en tablas relacionales, sin primero reorganizar los datos en un cubo.

Como se señaló anteriormente, SQL es una herramienta perfectamente capaz de realizar consultas, informes y análisis multidimensionales. Pero las consultas SQL necesarias son complejas, el rendimiento se puede arrastrar y la vista resultante de los datos es estática, no se puede girar para representar una vista diferente de los datos.

ROLAP es mejor cuando la capacidad de trabajar directamente con grandes cantidades de datos es más importante que el rendimiento y la flexibilidad.

HOLAP

HOLAP, u OLAP híbrido, intenta crear la división óptima del trabajo entre bases de datos relacionales y multidimensionales dentro de una única arquitectura OLAP. Las tablas relacionales contienen mayores cantidades de datos y los cubos OLAP se utilizan para agregaciones y procesamiento especulativo. HOLAP requiere un servidor OLAP que admita tanto MOLAP como ROLAP.

Una herramienta HOLAP puede "explorar" el cubo de datos hasta las tablas relacionales, lo que allana el camino para un procesamiento rápido de datos y un acceso flexible.

Este sistema híbrido puede ofrecer una mejor escalabilidad, pero no puede escapar de la inevitable ralentización al acceder a fuentes de datos relacionales. Además, su arquitectura compleja generalmente requiere actualizaciones y mantenimiento más frecuentes, ya que debe almacenar y procesar todos los datos de bases de datos relacionales y bases de datos multidimensionales. Por este motivo, HOLAP puede resultar más caro.

OLAP frente a OLTP

El procesamiento de transacciones en línea, u OLTP, se refiere a métodos de procesamiento de datos y software enfocados en aplicaciones y datos orientados a transacciones. 

La principal diferencia entre OLAP y OLTP está en el nombre: OLAP es de naturaleza analítica y OLTP es transaccional. 

Las herramientas OLAP están diseñadas para el análisis multidimensional de datos en un almacén de datos, que contiene datos históricos y transaccionales. De hecho, un servidor OLAP suele ser el nivel analítico intermedio de una solución de almacenamiento de datos.

Usos comunes de OLAP

  • Minería de datos y otras aplicaciones de inteligencia empresarial
  • Cálculos analíticos complejos
  • Escenarios predictivos
  • Análisis financiero
  • Elaboración de presupuestos
  • Planificación de previsiones

OLTP está diseñado para admitir aplicaciones orientadas a transacciones al procesar transacciones recientes de la manera más rápida y precisa posible. Los usos comunes de OLTP incluyen cajeros automáticos, software de comercio electrónico, procesamiento de pagos con tarjeta de crédito, reservas en línea, sistemas de reserva y herramientas de mantenimiento de registros.

Para obtener información detallada acerca de las diferencias entre estos enfoques, consulte "OLAP frente a OLTP: ¿en qué se diferencian?"

OLAP y arquitectura en la nube

OLAP permite a las empresas maximizar el potencial de sus datos corporativos transformándolos al formato más práctico para el análisis multidimensional. Esto, a su vez, hace que sea más fácil discernir información valiosa sobre el negocio. Sin embargo, si estos sistemas se mantienen en la empresa, limita el potencial de escala.

Los servicios OLAP basados en la nube son menos costosos y más fáciles de configurar, lo que los hace más atractivos para pequeñas empresas o nuevas empresas con un presupuesto limitado.

Las empresas pueden aprovechar el vasto potencial de los almacenes de datos basados en la nube que realizan análisis sofisticados a velocidades inigualables porque utilizan el procesamiento masivamente paralelo (MPP). Por lo tanto, las empresas pueden usar OLAP a la velocidad y escala de la nube, analizando grandes cantidades de datos sin moverlos de su almacén de datos en la nube.

Constance Hotels, Resorts & Golf es un grupo hotelero de lujo con nueve propiedades en islas del Océano Índico. Sin embargo, la falta de comunicaciones de isla a isla dio paso a silos organizativos, con datos comerciales aislados en cada complejo. La organización creó un almacén de datos en la nube y una arquitectura de análisis para vincular todos los sistemas y herramientas locales con un repositorio de datos central basado en la nube. Al hacer esto, la compañía obtuvo la información de todo el grupo que necesitaban para aprovechar el análisis predictivo avanzado e implementar un sistema OLAP.

OLAP en la arquitectura de la nube es una solución rápida y rentable diseñada para el futuro. Una vez que se crean los cubos, los equipos pueden usar las herramientas de inteligencia empresarial existentes para conectarse instantáneamente con el modelo OLAP y obtener información interactiva en tiempo real a partir de sus datos en la nube.

Soluciones relacionadas
IBM Db2 Warehouse on Cloud

IBM Db2 Warehouse on Cloud es un servicio de nube pública gestionado. Puede configurar IBM Db2 Warehouse en las instalaciones con su propio hardware o en una nube privada.

Explore IBM Db2 Warehouse on Cloud
Servicios de cubos

IBM DB2 Warehouse integra y simplifica el entorno del almacenamiento de datos con un almacén dinámico y soporte directo para OLAP en torno al almacén de datos.

Explore los servicios de cubos
Dé el siguiente paso

IBM Db2 Warehouse on Cloud es un servicio de nube pública gestionado. Puede configurar IBM Db2 Warehouse en las instalaciones con su hardware o en una nube privada. Como almacén de datos, este servicio incluye características como procesamiento de datos en memoria y tablas de columnas para procesamiento analítico en línea (OLAP). Como estas funciones comparten un motor de base de datos común, puede optimizar o mover fácilmente cargas de trabajo de datos.

Explore IBM Db2 Warehouse on Cloud hoy