O que é OLAP (processamento analítico online)?

Um homem sentado perto de uma grande janela em uma biblioteca moderna enquanto trabalha em um notebook

O que é OLAP?

OLAP, ou processamento analítico online, é uma tecnologia para realizar consultas complexas de alta velocidade ou análise multidimensional em grandes volumes de dados em um data warehouse, data lake ou outro repositório de dados. O OLAP é usado em business intelligence (BI), suporte a decisões e uma variedade de aplicações de forecasting de negócios e geração de relatórios.

A maioria dos dados empresariais possui múltiplas dimensões — diversas categorias nas quais os dados são divididos para apresentação, rastreamento ou análise. Por exemplo, números de vendas podem ter várias dimensões relacionadas à localização (região, país, estado/província, loja), tempo (ano, mês, semana, dia), produto (roupas, homens/mulheres/crianças, marca, tipo) e mais.

Porém, em um data warehouse ou data lake, os conjuntos de dados são armazenados em tabelas, cada uma das quais pode organizar dados em apenas duas dessas dimensões de cada vez. O OLAP extrai dados de vários conjuntos de dados relacionais e os reorganiza em um formato multidimensional que permite um processamento muito rápido e uma análise muito perspicaz.

Projeto 3D de bolas rolando em uma pista

As últimas notícias e insights sobre IA 


Descubra insights selecionados por especialistas e notícias sobre IA, nuvem e outros assuntos no boletim informativo semanal Think. 

O que é um cubo OLAP?

Núcleo da maioria dos sistemas de OLAP, o cubo do OLAP é um banco de dados multidimensional baseado em matrizes que possibilita processar e analisar múltiplas dimensões de dados de forma muito mais rápida e eficiente do que um banco de dados relacional tradicional.

Uma tabela de banco de dados relacional é estruturada como uma planilha, armazenando registros individuais em um formato bidimensional, linha por coluna. Cada "fato" de dados no banco de dados se situa na interseção de duas dimensões — uma linha e uma coluna — como região e vendas totais.

Ferramentas de relatório de banco de dados relacional e SQL certamente podem consultar, reportar e analisar dados multidimensionais armazenados em tabelas, mas o desempenho diminui conforme o volume de dados aumenta. E requer muito trabalho para reorganizar os resultados para focar em diferentes dimensões.

É aqui que o cubo OLAP entra. O cubo OLAP estende a única tabela com camadas adicionais, cada uma adicionando dimensões adicionais — geralmente o próximo nível na "hierarquia de conceitos" da dimensão. Por exemplo, a camada superior do cubo pode organizar vendas por região; camadas adicionais podem ser país, estado/província, cidade e até loja específica.

Em teoria, um cubo pode conter um número infinito de camadas. (Um cubo do OLAP representando mais de três dimensões às vezes é chamado de hipercubo.) E cubos menores podem existir dentro de camadas — por exemplo, cada camada de armazenamento pode conter cubos que organizam as vendas por vendedor e produto. Na prática, analistas de dados criarão cubos do OLAP contendo apenas as camadas de que precisam, para análise e desempenho ideais.

Detalhamento

A operação de detalhamento converte dados menos detalhados em dados mais detalhados por meio de um dos dois métodos: descendo na hierarquia do conceito ou adicionando uma nova dimensão ao cubo. Por exemplo, se você visualizar os dados de vendas de um trimestre fiscal ou calendário de uma organização, você pode fazer um detalhamento para ver as vendas de cada mês, movendo-se para baixo na hierarquia de conceitos da dimensão "tempo".

Consolidação

A agregação é o oposto da função de detalhamento — ela agrega dados em um cubo OLAP movendo-se para cima na hierarquia de conceitos ou reduzindo o número de dimensões. Por exemplo, você pode subir na hierarquia conceitual da dimensão "localização" visualizando os dados de cada país, em vez de cada cidade.

Fatiamento e corte

A operação de fatiar (slice) cria um subcubo selecionando uma única dimensão do cubo OLAP principal. Por exemplo, você pode realizar um fatiamento destacando todos os dados do primeiro trimestre fiscal ou calendário da organização (dimensão tempo).

A operação de cortar (dice) isola um subcubo selecionando várias dimensões dentro do cubo OLAP principal. Por exemplo, você poderia realizar uma operação de corte destacando todos os dados por trimestres fiscais ou calendário de uma organização (dimensão tempo) e dentro dos EUA e Canadá (dimensão localização).

Pivoteamento

A função de pivoteamento gira a visualização atual do cubo para exibir uma nova representação dos dados, permitindo visualizações multidimensionais dinâmicas dos dados. A função de pivoteamento OLAP é comparável à funcionalidade de tabela dinâmica em softwares de planilhas, como o Microsoft Excel, mas enquanto tabelas dinâmicas no Excel podem ser desafiadoras, pivots OLAP são relativamente mais fáceis de usar (requerem menos especialização) e têm um tempo de resposta e desempenho de consulta mais rápidos.

Diagrama mostrando a estrutura de um cubo OLAP Um cubo OLAP com dimensões para produtos, regiões de vendas e trimestres

MOLAP vs. ROLAP vs. HOLAP

OLAP que trabalha diretamente com um cubo OLAP multidimensional é conhecido como OLAP multidimensional, ou MOLAP. Novamente, para a maioria dos usos, o MOLAP é o tipo mais rápido e prático de análise de dados multidimensionais.

Entretanto, há dois outros tipos de OLAP que podem ser preferíveis em determinados casos:

ROLAP

ROLAP, ou OLAP relacional, é a análise de dados multidimensionais que opera diretamente em dados em tabelas relacionais, sem primeiro reorganizar os dados em um cubo.

Como mencionado anteriormente, SQL é uma ferramenta perfeitamente capaz para consultas, relatórios e análises multidimensionais. A função de pivoteamento OLAP é comparável à funcionalidade de tabela dinâmica em softwares de planilhas, como o Microsoft Excel, mas enquanto tabelas dinâmicas no Excel podem ser desafiadoras, pivots OLAP são relativamente mais fáceis de usar (requerem menos especialização) e têm um tempo de resposta e desempenho de consulta mais rápidos.ROLAP é melhor quando a capacidade de trabalhar diretamente com grandes volumes de dados é mais importante do que o desempenho e a flexibilidade.

HOLAP

O HOLAP, ou OLAP híbrido, tenta criar a divisão de trabalho ideal entre bancos de dados relacionais e multidimensionais dentro de uma única arquitetura de OLAP. As tabelas relacionais contêm maiores quantidades de dados, e cubos do OLAP são usados para agregações e processamento especulativo. O HOLAP requer um servidor do OLAP compatível tanto com o MOLAP quanto com o ROLAP.

Uma ferramenta HOLAP pode "perfurar" o cubo de dados até as tabelas relacionais, o que abre caminho para um processamento de dados rápido e acesso flexível. Este sistema híbrido pode oferecer melhor escalabilidade, mas não pode escapar da inevitável desaceleração ao acessar fontes de dados relacionais. Além disso, sua arquitetura complexa normalmente requer atualizações e manutenções mais frequentes, pois deve armazenar e processar todos os dados de bancos de dados relacionais e multidimensionais. Por esse motivo, o HOLAP pode acabar sendo mais caro.

AI Academy

O gerenciamento de dados é o segredo para a IA generativa?

Explore por que é essencial ter dados de alta qualidade para utilizar a IA generativa com qualidade.

OLAP vs. OLTP

O processamento de transações online, ou OLTP, refere-se a métodos e softwares de processamento de dados focados em dados e aplicações orientados para transações.

A principal diferença entre OLAP e OLTP está no nome: OLAP é analítico por natureza, e OLTP é transacional.

As ferramentas OLAP são projetadas para análise multidimensional de dados em um data warehouse, contendo tanto dados transacionais quanto históricos. Um servidor OLAP é, tipicamente, o nível analítico intermediário de uma solução de data warehouse. Os usos comuns do OLAP incluem mineração de dados e outras aplicações de business intelligence, cálculos analíticos complexos, cenários preditivos, bem como funções de relatórios empresariais como análise financeira, planejamento orçamentário e previsão.

Por outro lado, OLTP é projetado para suportar aplicações orientadas a transações processando transações recentes o mais rápido e precisamente possível. Usos comuns do OLTP incluem caixas eletrônicos, software de comércio eletrônico, processamento de pagamentos com cartão de crédito, reservas online, sistemas de reservas e ferramentas de manutenção de registros.

Para um aprofundamento nas diferenças entre essas abordagens, confira "OLAP versus OLTP: qual é a diferença?"

OLAP e arquitetura de nuvem

O OLAP possibilita que as empresas maximizem o potencial dos seus dados corporativos, transformando-os no formato mais prático para análise multidimensional. Isso, por sua vez, facilita a identificação de insights valiosos para o negócio. Contudo, se esses sistemas são mantidos internamente, isso limita o potencial de escalabilidade.

Os serviços OLAP baseados na nuvem são menos custosos e mais fáceis de configurar, tornando-os mais atraentes para pequenas empresas ou startups com orçamento limitado. As empresas podem acessar o vasto potencial de data warehouses baseados na nuvem que realizam análises sofisticadas a velocidades sem paralelo, pois utilizam processamento paralelo massivo (MPP). Assim, as empresas podem usar OLAP com a velocidade e escalabilidade da nuvem, analisando grandes volumes de dados sem precisar movê-los do seu armazém de dados na nuvem.

O Constance Hotels, Resorts & Golf é um grupo de hotéis de luxo com nove propriedades em ilhas no Oceano Índico. No entanto, a falta de comunicação entre as ilhas dava espaço para silos organizacionais, com dados de negócios isolados em cada resort. A organização construiu um data warehouse na nuvem e uma arquitetura de análise de dados para conectar todos os sistemas e ferramentas no local a um repositório central baseado na nuvem. Ao fazer isso, a empresa obteve a visão de todo o grupo de que precisava para aproveitar análise preditiva de dados avançada e implementar um sistema de OLAP.

O OLAP em arquitetura de nuvem é uma solução rápida e econômica construída para o futuro. Uma vez que os cubos são criados, as equipes podem usar ferramentas existentes de business intelligence para se conectar instantaneamente com o modelo OLAP e obter insights interativos em tempo real a partir de seus dados na nuvem.

Soluções relacionadas
Software e soluções de gerenciamento de dados

Crie uma estratégia de dados que elimine silos de dados, reduza a complexidade e melhore a qualidade de dados para proporcionar experiências excepcionais para clientes e funcionários.

Explore soluções de gerenciamento de dados
IBM watsonx.data™

O watsonx.data permite escalar a análise de dados e a IA com todos os seus dados, onde quer que estejam, por meio de um armazenamento de dados aberto, híbrido e governado.

Conheça o watsonx.data
Serviços de consultoria de dados e análise de dados

Libere o valor dos dados empresariais com a IBM Consulting, construindo uma organização baseada em insights que ofereça vantagens para os negócios.

Conheça os serviços de análise de dados
Dê o próximo passo

Crie uma estratégia de dados que elimine silos de dados, reduza a complexidade e melhore a qualidade de dados para proporcionar experiências excepcionais para clientes e funcionários.

Explore soluções de gerenciamento de dados Conheça o watsonx.data