O que é OLAP (processamento analítico online)?
Explore a solução OLAP da IBM Inscreva-se para receber atualizações de IA
Fundo em preto e azul
O que é OLAP?

OLAP, ou processamento analítico online, é uma tecnologia para realizar consultas complexas de alta velocidade ou análise multidimensional em grandes volumes de dados em um data warehouse, data lake ou outro repositório de dados. OLAP é usado em business intelligence (BI), suporte à decisão e uma variedade de previsões de negócios e aplicações de relatórios.

A maioria dos dados empresariais possui múltiplas dimensões — diversas categorias nas quais os dados são divididos para apresentação, rastreamento ou análise. Por exemplo, números de vendas podem ter várias dimensões relacionadas à localização (região, país, estado/província, loja), tempo (ano, mês, semana, dia), produto (roupas, homens/mulheres/crianças, marca, tipo) e mais.

Porém, em um data warehouse ou data lake, os conjuntos de dados são armazenados em tabelas, cada uma das quais pode organizar dados em apenas duas dessas dimensões por vez. O OLAP extrai dados de vários conjuntos de dados relacionais e os reorganiza em um formato multidimensional que permite um processamento muito rápido e uma análise muito perspicaz.

Aprenda e opere o Presto

Explore o ebook gratuito de O'Reilly ebook para aprender como começar a usar o Presto, o mecanismo SQL de código aberto para análise de dados.

Conteúdo relacionado

Cadastre-se para obter o relatório da IDC

O que é um cubo OLAP?

Núcleo da maioria dos sistemas OLAP, o cubo OLAP é um banco de dados multidimensional baseado em arrays que possibilita processar e analisar múltiplas dimensões de dados de forma muito mais rápida e eficiente do que um banco de dados relacional tradicional.

Uma tabela de banco de dados relacional é estruturada como uma planilha, armazenando registros individuais em um formato bidimensional, linha por coluna. Cada "fato" de dados no banco de dados se situa na interseção de duas dimensões — uma linha e uma coluna — como região e vendas totais.

Ferramentas de relatório de banco de dados relacional e SQL certamente podem consultar, reportar e analisar dados multidimensionais armazenados em tabelas, mas o desempenho diminui conforme o volume de dados aumenta. E requer muito trabalho para reorganizar os resultados para focar em diferentes dimensões.

É aqui que o cubo OLAP entra. O cubo OLAP estende a única tabela com camadas adicionais, cada uma adicionando dimensões adicionais — geralmente o próximo nível na "hierarquia de conceitos" da dimensão. Por exemplo, a camada superior do cubo pode organizar vendas por região; camadas adicionais podem ser país, estado/província, cidade e até loja específica.

Em teoria, um cubo pode conter um número infinito de camadas. (Um cubo OLAP representando mais de três dimensões às vezes é chamado de hipercubo.) E cubos menores podem existir dentro de camadas — por exemplo, cada camada de loja pode conter cubos organizando vendas por vendedor e produto. Na prática, analistas de dados criarão cubos OLAP contendo apenas as camadas de que precisam, para análise e desempenho ótimos.

Detalhamento (drill-down)

A operação de detalhamento converte dados menos detalhados em dados mais detalhados por meio de um dos dois métodos: descendo na hierarquia do conceito ou adicionando uma nova dimensão ao cubo. Por exemplo, se você visualizar os dados de vendas de um trimestre fiscal ou calendário de uma organização, você pode fazer um detalhamento para ver as vendas de cada mês, movendo-se para baixo na hierarquia de conceitos da dimensão "tempo".

Agregação (roll up)

A agregação é o oposto da função de detalhamento — ela agrega dados em um cubo OLAP movendo-se para cima na hierarquia de conceitos ou reduzindo o número de dimensões. Por exemplo, você pode subir na hierarquia conceitual da dimensão "localização" visualizando os dados de cada país, em vez de cada cidade.

Fatiar e cortar (slice and dice)

A operação de fatiar (slice) cria um subcubo selecionando uma única dimensão do cubo OLAP principal. Por exemplo, você pode realizar um fatiamento destacando todos os dados do primeiro trimestre fiscal ou calendário da organização (dimensão tempo).

A operação de cortar (dice) isola um subcubo selecionando várias dimensões dentro do cubo OLAP principal. Por exemplo, você poderia realizar uma operação de corte destacando todos os dados por trimestres fiscais ou calendário de uma organização (dimensão tempo) e dentro dos EUA e Canadá (dimensão localização).

Pivoteamento

A função de pivoteamento gira a visualização atual do cubo para exibir uma nova representação dos dados, permitindo visualizações multidimensionais dinâmicas dos dados. A função de pivoteamento OLAP é comparável à funcionalidade de tabela dinâmica em softwares de planilhas, como o Microsoft Excel, mas enquanto tabelas dinâmicas no Excel podem ser desafiadoras, pivots OLAP são relativamente mais fáceis de usar (requerem menos especialização) e têm um tempo de resposta e desempenho de consulta mais rápidos.

MOLAP vs. ROLAP vs. HOLAP

OLAP que trabalha diretamente com um cubo OLAP multidimensional é conhecido como OLAP multidimensional, ou MOLAP. Novamente, para a maioria dos usos, o MOLAP é o tipo mais rápido e prático de análise de dados multidimensionais.

Entretanto, há dois outros tipos de OLAP que podem ser preferíveis em determinados casos:

ROLAP

ROLAP, ou OLAP relacional, é a análise de dados multidimensionais que opera diretamente em dados em tabelas relacionais, sem primeiro reorganizar os dados em um cubo.

Como mencionado anteriormente, SQL é uma ferramenta perfeitamente capaz para consultas, relatórios e análises multidimensionais. A função de pivoteamento OLAP é comparável à funcionalidade de tabela dinâmica em softwares de planilhas, como o Microsoft Excel, mas enquanto tabelas dinâmicas no Excel podem ser desafiadoras, pivots OLAP são relativamente mais fáceis de usar (requerem menos especialização) e têm um tempo de resposta e desempenho de consulta mais rápidos.ROLAP é melhor quando a capacidade de trabalhar diretamente com grandes volumes de dados é mais importante do que o desempenho e a flexibilidade.

HOLAP

O HOLAP, ou OLAP híbrido, tenta criar a divisão de trabalho ótima entre bancos de dados relacionais e multidimensionais dentro de uma única arquitetura OLAP. As tabelas relacionais contêm maiores quantidades de dados, e cubos OLAP são usados para agregações e processamento especulativo. O HOLAP requer um servidor OLAP que suporte tanto MOLAP quanto ROLAP.

Uma ferramenta HOLAP pode "perfurar" o cubo de dados até as tabelas relacionais, o que abre caminho para um processamento de dados rápido e acesso flexível. Este sistema híbrido pode oferecer melhor escalabilidade, mas não pode escapar da inevitável desaceleração ao acessar fontes de dados relacionais. Além disso, sua arquitetura complexa normalmente requer atualizações e manutenções mais frequentes, pois deve armazenar e processar todos os dados de bancos de dados relacionais e multidimensionais. Por esse motivo, o HOLAP pode acabar sendo mais caro.

OLAP vs. OLTP

O processamento de transações online, ou OLTP, refere-se a métodos e softwares de processamento de dados focados em dados e aplicações orientados para transação.

A principal diferença entre OLAP e OLTP está no nome: OLAP é analítico por natureza, e OLTP é transacional.

As ferramentas OLAP são projetadas para análise multidimensional de dados em um data warehouse, contendo tanto dados transacionais quanto históricos. Um servidor OLAP é, tipicamente, o nível analítico intermediário de uma solução de data warehouse. Os usos comuns do OLAP incluem mineração de dados e outras aplicações de business intelligence, cálculos analíticos complexos, cenários preditivos, bem como funções de relatórios empresariais como análise financeira, planejamento orçamentário e previsão.

Por outro lado, OLTP é projetado para suportar aplicações orientadas a transações, processando transações recentes o mais rápido e precisamente possível. Usos comuns do OLTP incluem caixas eletrônicos, software de comércio eletrônico, processamento de pagamentos com cartão de crédito, reservas online, sistemas de reservas e ferramentas de manutenção de registros.

Para um aprofundamento nas diferenças entre essas abordagens, confira "OLAP vs. OLTP: Qual a diferença?"

OLAP e arquitetura de nuvem

O OLAP possibilita que as empresas maximizem o potencial dos seus dados corporativos, transformando-os no formato mais prático para análise multidimensional. Isso, por sua vez, facilita a identificação de insights valiosos para o negócio. Contudo, se esses sistemas são mantidos internamente, isso limita o potencial de escalabilidade.

Os serviços OLAP baseados na nuvem são menos custosos e mais fáceis de configurar, tornando-os mais atraentes para pequenas empresas ou startups com orçamento limitado. As empresas podem acessar o vasto potencial de data warehouses baseados na nuvem que realizam análises sofisticadas a velocidades sem paralelo, pois utilizam processamento paralelo massivo (MPP). Assim, as empresas podem usar OLAP com a velocidade e escalabilidade da nuvem, analisando grandes volumes de dados sem precisar movê-los do seu armazém de dados na nuvem.

Constance Hotels, Resorts & Golf é um grupo de hotéis de luxo com nove propriedades em ilhas no Oceano Índico. No entanto, a falta de comunicação entre as ilhas deu espaço para silos organizacionais, com dados de negócios isolados em cada resort. A organização construiu um data warehouse na nuvem e uma arquitetura de análise para conectar todos os sistemas e ferramentas locais a um repositório central baseado na nuvem. Ao fazer isso, a empresa obteve a visão abrangente de que precisava para alavancar análises preditivas avançadas e implementar um sistema OLAP.

O OLAP em arquitetura de nuvem é uma solução rápida e econômica construída para o futuro. Uma vez que os cubos são criados, as equipes podem usar ferramentas existentes de business intelligence para se conectar instantaneamente com o modelo OLAP e obter insights interativos em tempo real a partir de seus dados na nuvem.

Soluções relacionadas
IBM Db2 Warehouse on Cloud

O IBM Db2 Warehouse on Cloud é um serviço gerenciado de nuvem pública. Você pode configurar o IBM Db2 Warehouse localmente com seu próprio hardware ou em uma nuvem privada.

Explore o IBM Db2 Warehouse on Cloud
Cubing Services

O IBM DB2 Warehouse integra e simplifica o ambiente de data warehouse, oferecendo armazenamento dinâmico e suporte direto para OLAP no data warehouse.

Explore os serviços de cubagem
Recursos Como escolher o data warehouse certo para IA

Acelere a inovação e gere resultados de negócios transformando dados em insights.

OLAP x OLTP: Qual é a diferença?

Esses termos são frequentemente confundidos um com o outro, então quais são suas principais diferenças e como escolher o certo para sua situação?

Dê o próximo passo

Escale cargas de trabalho de IA para todos os seus dados, em qualquer lugar, com o IBM watsonx.data, um armazenamento de dados feito sob medida, construído em uma arquitetura aberta de data lakehouse.

Explore o watsonx.data Agende uma demonstração em tempo real