O que é OLAP (processamento analítico online)?

O que é OLAP?

OLAP, ou processamento analítico online, é uma tecnologia para realizar consultas complexas de alta velocidade ou análise multidimensional em grandes volumes de dados em um data warehouse, data lake ou outro repositório de dados. O OLAP é usado em business intelligence (BI), suporte a decisões e uma variedade de aplicações de forecasting de negócios e geração de relatórios.

A maioria dos dados empresariais possui múltiplas dimensões — diversas categorias nas quais os dados são divididos para apresentação, rastreamento ou análise. Por exemplo, números de vendas podem ter várias dimensões relacionadas à localização (região, país, estado/província, loja), tempo (ano, mês, semana, dia), produto (roupas, homens/mulheres/crianças, marca, tipo) e mais.

Porém, em um data warehouse ou data lake, os conjuntos de dados são armazenados em tabelas, cada uma das quais pode organizar dados em apenas duas dessas dimensões de cada vez. O OLAP extrai dados de vários conjuntos de dados relacionais e os reorganiza em um formato multidimensional que permite um processamento muito rápido e uma análise muito perspicaz.

As mais recentes notícias de tecnologia, corroboradas por insights de especialistas.

Mantenha-se atualizado sobre as tendências mais importantes (e intrigantes) do setor em IA, automação, dados e muito mais com o boletim informativo Think. Consulte a Declaração de privacidade da IBM.

O que é um cubo OLAP?

Núcleo da maioria dos sistemas de OLAP, o cubo do OLAP é um banco de dados multidimensional baseado em matrizes que possibilita processar e analisar múltiplas dimensões de dados de forma muito mais rápida e eficiente do que um banco de dados relacional tradicional.

Uma tabela de banco de dados relacional é estruturada como uma planilha, armazenando registros individuais em um formato bidimensional, linha por coluna. Cada "fato" de dados no banco de dados se situa na interseção de duas dimensões — uma linha e uma coluna — como região e vendas totais.

Ferramentas de relatório de banco de dados relacional e SQL certamente podem consultar, reportar e analisar dados multidimensionais armazenados em tabelas, mas o desempenho diminui conforme o volume de dados aumenta. E requer muito trabalho para reorganizar os resultados para focar em diferentes dimensões.

É aqui que o cubo OLAP entra. O cubo OLAP estende a única tabela com camadas adicionais, cada uma adicionando dimensões adicionais — geralmente o próximo nível na "hierarquia de conceitos" da dimensão. Por exemplo, a camada superior do cubo pode organizar vendas por região; camadas adicionais podem ser país, estado/província, cidade e até loja específica.

Em teoria, um cubo pode conter um número infinito de camadas. (Um cubo do OLAP representando mais de três dimensões às vezes é chamado de hipercubo.) E cubos menores podem existir dentro de camadas — por exemplo, cada camada de armazenamento pode conter cubos que organizam as vendas por vendedor e produto. Na prática, analistas de dados criarão cubos do OLAP contendo apenas as camadas de que precisam, para análise e desempenho ideais.

Detalhamento

A operação de detalhamento converte dados menos detalhados em dados mais detalhados por meio de um dos dois métodos: descendo na hierarquia do conceito ou adicionando uma nova dimensão ao cubo. Por exemplo, se você visualizar os dados de vendas de um trimestre fiscal ou calendário de uma organização, você pode fazer um detalhamento para ver as vendas de cada mês, movendo-se para baixo na hierarquia de conceitos da dimensão "tempo".

Consolidação

A agregação é o oposto da função de detalhamento — ela agrega dados em um cubo OLAP movendo-se para cima na hierarquia de conceitos ou reduzindo o número de dimensões. Por exemplo, você pode subir na hierarquia conceitual da dimensão "localização" visualizando os dados de cada país, em vez de cada cidade.

Fatiamento e corte

A operação de fatiar (slice) cria um subcubo selecionando uma única dimensão do cubo OLAP principal. Por exemplo, você pode realizar um fatiamento destacando todos os dados do primeiro trimestre fiscal ou calendário da organização (dimensão tempo).

A operação de cortar (dice) isola um subcubo selecionando várias dimensões dentro do cubo OLAP principal. Por exemplo, você poderia realizar uma operação de corte destacando todos os dados por trimestres fiscais ou calendário de uma organização (dimensão tempo) e dentro dos EUA e Canadá (dimensão localização).

Pivoteamento

A função de pivoteamento gira a visualização atual do cubo para exibir uma nova representação dos dados, permitindo visualizações multidimensionais dinâmicas dos dados. A função de pivoteamento OLAP é comparável à funcionalidade de tabela dinâmica em softwares de planilhas, como o Microsoft Excel, mas enquanto tabelas dinâmicas no Excel podem ser desafiadoras, pivots OLAP são relativamente mais fáceis de usar (requerem menos especialização) e têm um tempo de resposta e desempenho de consulta mais rápidos.

Diagrama mostrando a estrutura de um cubo OLAP

Um cubo OLAP com dimensões para produtos, regiões de vendas e trimestres

MOLAP vs. ROLAP vs. HOLAP

OLAP que trabalha diretamente com um cubo OLAP multidimensional é conhecido como OLAP multidimensional, ou MOLAP. Novamente, para a maioria dos usos, o MOLAP é o tipo mais rápido e prático de análise de dados multidimensionais.

Entretanto, há dois outros tipos de OLAP que podem ser preferíveis em determinados casos:

ROLAP

ROLAP, ou OLAP relacional, é a análise de dados multidimensionais que opera diretamente em dados em tabelas relacionais, sem primeiro reorganizar os dados em um cubo.

Como mencionado anteriormente, SQL é uma ferramenta perfeitamente capaz para consultas, relatórios e análises multidimensionais. A função de pivoteamento OLAP é comparável à funcionalidade de tabela dinâmica em softwares de planilhas, como o Microsoft Excel, mas enquanto tabelas dinâmicas no Excel podem ser desafiadoras, pivots OLAP são relativamente mais fáceis de usar (requerem menos especialização) e têm um tempo de resposta e desempenho de consulta mais rápidos.ROLAP é melhor quando a capacidade de trabalhar diretamente com grandes volumes de dados é mais importante do que o desempenho e a flexibilidade.

HOLAP

O HOLAP, ou OLAP híbrido, tenta criar a divisão de trabalho ideal entre bancos de dados relacionais e multidimensionais dentro de uma única arquitetura de OLAP. As tabelas relacionais contêm maiores quantidades de dados, e cubos do OLAP são usados para agregações e processamento especulativo. O HOLAP requer um servidor do OLAP compatível tanto com o MOLAP quanto com o ROLAP.

Uma ferramenta HOLAP pode "perfurar" o cubo de dados até as tabelas relacionais, o que abre caminho para um processamento de dados rápido e acesso flexível. Este sistema híbrido pode oferecer melhor escalabilidade, mas não pode escapar da inevitável desaceleração ao acessar fontes de dados relacionais. Além disso, sua arquitetura complexa normalmente requer atualizações e manutenções mais frequentes, pois deve armazenar e processar todos os dados de bancos de dados relacionais e multidimensionais. Por esse motivo, o HOLAP pode acabar sendo mais caro.

AI Academy

O gerenciamento de dados é o segredo para a IA generativa?

Explore por que é essencial ter dados de alta qualidade para utilizar a IA generativa com qualidade.

Acessar o episódio

OLAP vs. OLTP

O processamento de transações online, ou OLTP, refere-se a métodos e softwares de processamento de dados focados em dados e aplicações orientados para transações.

A principal diferença entre OLAP e OLTP está no nome: OLAP é analítico por natureza, e OLTP é transacional.

As ferramentas OLAP são projetadas para análise multidimensional de dados em um data warehouse, contendo tanto dados transacionais quanto históricos. Um servidor OLAP é, tipicamente, o nível analítico intermediário de uma solução de data warehouse. Os usos comuns do OLAP incluem mineração de dados e outras aplicações de business intelligence, cálculos analíticos complexos, cenários preditivos, bem como funções de relatórios empresariais como análise financeira, planejamento orçamentário e previsão.

Por outro lado, OLTP é projetado para suportar aplicações orientadas a transações processando transações recentes o mais rápido e precisamente possível. Usos comuns do OLTP incluem caixas eletrônicos, software de comércio eletrônico, processamento de pagamentos com cartão de crédito, reservas online, sistemas de reservas e ferramentas de manutenção de registros.

Para um aprofundamento nas diferenças entre essas abordagens, confira "OLAP versus OLTP: qual é a diferença?"

OLAP e arquitetura de nuvem

O OLAP possibilita que as empresas maximizem o potencial dos seus dados corporativos, transformando-os no formato mais prático para análise multidimensional. Isso, por sua vez, facilita a identificação de insights valiosos para o negócio. Contudo, se esses sistemas são mantidos internamente, isso limita o potencial de escalabilidade.

Os serviços OLAP baseados na nuvem são menos custosos e mais fáceis de configurar, tornando-os mais atraentes para pequenas empresas ou startups com orçamento limitado. As empresas podem acessar o vasto potencial de data warehouses baseados na nuvem que realizam análises sofisticadas a velocidades sem paralelo, pois utilizam processamento paralelo massivo (MPP). Assim, as empresas podem usar OLAP com a velocidade e escalabilidade da nuvem, analisando grandes volumes de dados sem precisar movê-los do seu armazém de dados na nuvem.

O Constance Hotels, Resorts & Golf é um grupo de hotéis de luxo com nove propriedades em ilhas no Oceano Índico. No entanto, a falta de comunicação entre as ilhas dava espaço para silos organizacionais, com dados de negócios isolados em cada resort. A organização construiu um data warehouse na nuvem e uma arquitetura de análise de dados para conectar todos os sistemas e ferramentas no local a um repositório central baseado na nuvem. Ao fazer isso, a empresa obteve a visão de todo o grupo de que precisava para aproveitar análise preditiva de dados avançada e implementar um sistema de OLAP.

O OLAP em arquitetura de nuvem é uma solução rápida e econômica construída para o futuro. Uma vez que os cubos são criados, as equipes podem usar ferramentas existentes de business intelligence para se conectar instantaneamente com o modelo OLAP e obter insights interativos em tempo real a partir de seus dados na nuvem.

Renderização 3D de uma espiral de vários ícones alinhados, como uma câmera, um botão de volume e uma prancheta

Leia o guia do líder de dados para saber como tornar os dados de sua organização preparados para IA.

Recursos

Renderização 3D de vários ícones alinhados, como um microfone e uma câmera

Agentes de IA baseados em dados. O seu já está pronto?

Seus dados são sua vantagem competitiva. Saiba como liberá-los de forma segura e gerar ROI mensurável com base na IA neste breve webinar.

Gerenciamento de dados explicado

O Techsplainers da IBM detalha os fundamentos dos dados para IA, desde os conceitos-chave até os casos de uso do mundo real. Episódios claros e rápidos ajudam você a aprender os fundamentos com agilidade.

Renderização 3D de vários ícones alinhados, como um botão de volume e uma área de transferência

Unifique e acesse seus dados para ajudar a escalar sua IA

Aprenda por que o caminho para dados preparados para IA geralmente começa com o acesso efetivo a dados estruturados e não estruturados, e os desafios que podem impedir os líderes de dados.

Custos indiretos jurídicos transformados em insights estratégicos

Saiba como um agente jurídico impulsionado por IA ajuda a acelerar a tomada de decisão, reduzir o trabalho manual e melhorar a conformidade.

AI Academy: Construindo uma estratégia de dados para IA corporativa

Neste episódio, Cathy Reese explica como as organizações de hoje precisam de uma estratégia de dados preparada para a IA avançada e que exigirá que elas aproveitem seus ativos de dados de maior qualidade.

Renderização 3D de vários ícones alinhados, como uma câmera e aviões de papel

O data lakehouse híbrido e aberto para IA

Simplifique o acesso aos dados e automatize sua gestão. Conheça o poder da integração de uma estratégia de data lakehouse à sua arquitetura de dados, incluindo a otimização dos custos das suas cargas de trabalho e a escalabilidade da IA e da análise, com todos os seus dados, em qualquer lugar.

Relatório do custo das violações de dados 2025

Os custos das violações de dados atingiram novo patamar. Receba insights atualizados sobre ameaças à cibersegurança e seus impactos financeiros nas organizações.

Representação 3D de duas linhas de vários ícones, como uma câmera, um botão de volume e uma área de transferência

O guia do líder de dados para preparar dados para IA

Entenda as etapas praticáveis que os líderes de dados podem seguir para superar os desafios dos dados, estabelecer a base para uma estrutura de dados confiável e preparar os dados da organização para a IA.

Representação 3D de vários ícones alinhados, como uma câmera, botão de volume e uma área de transferência

Como a diretoria executiva está transformando informações em impacto

Explore insights de 1.700 CDOs neste relatório de setores para líderes de dados.

Soluções relacionadas

IBM StreamSets

Crie e gerencie pipelines de dados de streaming inteligentes por meio de uma interface gráfica intuitiva, facilitando a integração sem dificuldades dos dados em ambientes híbridos e de multinuvem.

Explore o StreamSets

IBM watsonx.data™

O watsonx.data permite escalar a análise de dados e a IA com todos os seus dados, onde quer que estejam, por meio de um armazenamento de dados aberto, híbrido e governado.

Conheça o watsonx.data

Serviços de consultoria de dados e análise de dados

Libere o valor dos dados empresariais com a IBM Consulting, construindo uma organização baseada em insights, que traz vantagem para os negócios.

Conheça os serviços de análise de dados

Dê o próximo passo

Crie uma estratégia de dados que elimine silos de dados, reduza a complexidade e melhore a qualidade de dados para proporcionar experiências excepcionais para clientes e funcionários.