O que é um data mart?

21 de outubro de 2021

O que é um data mart?

Um data mart é um subconjunto de um data warehouse focado em uma determinada linha de negócios, departamento ou área de assunto. Os data marts podem melhorar a eficiência da equipe, reduzir custos e facilitar a tomada de decisão tática de negócios mais inteligente nas empresas.

Os data marts disponibilizam dados específicos para um grupo definido de usuários, o que permite que esses usuários acessem rapidamente insights críticos sem perder tempo pesquisando em um data warehouse inteiro. Por exemplo, muitas empresas podem ter um data mart alinhado a um departamento específico da empresa, como finanças, vendas ou marketing.

Projeto 3D de bolas rolando em uma pista

As últimas notícias e insights sobre IA 


Descubra insights selecionados por especialistas e notícias sobre IA, nuvem e outros assuntos no boletim informativo semanal Think. 

Data mart versus data warehouse versus data lake

Data marts, data warehouses e data lakes são repositórios centrais de dados cruciais, mas atendem a diferentes necessidades dentro de uma organização.

Um data warehouse é um sistema que agrega dados de várias fontes em um único armazenamento de dados central e consistente para compatibilidade com mineração de dados, inteligência artificial (IA) e aprendizado de máquina, o que, em última análise, pode aprimorar análise de dados sofisticada e business intelligence. Por meio desse processo de coleta estratégica, as soluções de data warehouse consolidam dados de diferentes fontes para disponibilizá-los de forma unificada.

Um data mart (conforme mencionado acima) é uma versão focada de um data warehouse que contém um subconjunto menor de dados importantes e necessários para uma única equipe ou um grupo seleto de usuários de uma organização. Um data mart é construído a partir de um data warehouse existente (ou outras fontes de dados) por meio de um procedimento complexo que envolve várias tecnologias e ferramentas para projetar e construir um banco de dados físico, preenchê-lo com dados e configurar protocolos complexos de acesso e gerenciamento.

Embora seja um processo desafiador, ele permite que uma linha de negócios descubra insights mais focados mais rapidamente do que trabalhar com um conjunto de dados de data warehouse mais amplo. Por exemplo, as equipes de marketing podem se beneficiar da criação de um data mart a partir de um warehouse existente, já que suas atividades geralmente são realizadas de forma independente do restante da empresa. Portanto, a equipe não precisa ter acesso a todos os dados da empresa.

Um data lake também é um repositório de dados. Um data lake fornece armazenamento maciço de dados não estruturados ou brutos alimentados por meio de várias fontes, mas as informações ainda não foram processadas ou preparadas para análise. Como resultado da capacidade de armazenar dados em um formato bruto, os data lakes são mais acessíveis e econômicos do que os data warehouses. Não há necessidade de limpar e processar dados antes da ingestão.

Por exemplo, os governos podem usar a tecnologia para rastrear dados sobre o comportamento do tráfego, uso de energia e vias navegáveis e armazená-los em um data lake enquanto descobrem como usar os dados para criar "cidades mais inteligentes" com serviços mais eficientes.

AI Academy

O gerenciamento de dados é o segredo para a IA generativa?

Explore por que é essencial ter dados de alta qualidade para utilizar a IA generativa com qualidade.

Benefícios de um data mart

Os data marts são projetados para atender às necessidades de grupos específicos, tendo um assunto de dados comparativamente restrito. Embora um data mart ainda possa conter milhões de registros, seu objetivo é fornecer aos usuários corporativos os dados mais relevantes no menor espaço de tempo.

Com seu design menor e focado, um data mart tem vários benefícios para o usuário final, incluindo os seguintes:

  • Relação custo/benefício: há muitos fatores a serem considerados ao configurar um data mart, como escopo, integrações e o processo de extrair, transformar e carregar (ETL). No entanto, um data mart normalmente incorre em apenas uma fração do custo de um data warehouse.

  • Acesso a dados simplificado: os data marts mantêm apenas um pequeno subconjunto de dados, de modo que os usuários podem recuperar rapidamente os dados de que precisam com menos trabalho do que ao trabalhar com um conjunto de dados mais amplo de um data warehouse.

  • Acesso mais rápido a insights: a intuição obtida em um data warehouse apoia a tomada de decisão estratégica em nível empresarial, o que afeta toda a empresa. Um data mart alimenta business intelligence e análise de dados que orientam as decisões no nível do departamento. As equipes podem aproveitar insights de dados focados com seus objetivos específicos em mente. À medida que as equipes identificam e extraem dados valiosos em um curto espaço de tempo, a empresa se beneficia de processos de negócios acelerados e maior produtividade.

  • Manutenção de dados mais simples: um data warehouse contém uma grande quantidade de informações de negócios, com escopo para várias linhas de negócios. Os data marts se concentram em uma única linha, abrigando menos de 100 GB, o que leva a menos confusão e manutenção mais fácil.

  • Implementação mais fácil e rápida: um data warehouse envolve um tempo significativo de implementação, especialmente em uma grande empresa, pois coleta dados de várias fontes internas e externas. Por outro lado, você só precisa de um pequeno subconjunto de dados ao configurar um data mart; então, a implementação tende a ser mais eficiente e a incluir menos tempo de configuração.

Tipos de data marts

Existem três tipos de data marts que diferem com base em sua relação com o data warehouse e as respectivas fontes de dados de cada sistema.

  • Data marts dependentes são segmentos particionados dentro de um data warehouse empresarial. Essa abordagem de cima para baixo começa com o armazenamento de todos os dados de negócios em um local central. Os data marts recém-criados extraem um subconjunto definido dos dados primários sempre que necessário para análise.

  • Data marts independentes atuam como um sistema autônomo que não depende de um data warehouse. Os analistas podem extrair dados sobre um assunto ou processo de negócios específico de fontes de dados internas ou externas, processá-los e armazená-los em um repositório de data mart até que a equipe precise deles.

  • Data marts híbridos combinam dados de data warehouses existentes e outras fontes operacionais. Essa abordagem unificada aproveita a velocidade e a interface fácil de usar de uma abordagem de cima para baixo e também oferece a integração em nível empresarial do método independente.

Estrutura de um data mart

Um data mart é um banco de dados relacional orientado a assuntos que armazena dados transacionais em linhas e colunas, o que facilita o acesso, a organização e a compreensão. Como contém dados históricos, essa estrutura torna mais fácil para um analista determinar as tendências dos dados. Os campos de dados típicos incluem ordem numérica, valor de tempo e referências a um ou mais objetos.

As empresas organizam data marts em um esquema multidimensional como um blueprint para lidar com as necessidades das pessoas que usam os bancos de dados para tarefas analíticas. Os três principais tipos de esquemas são estrela, floco de neve e cofre.

Estrela

O esquema em estrela é uma formação lógica de tabelas em um banco de dados multidimensional que se assemelha a uma forma de estrela. Nesse blueprint, uma tabela de fatos (um conjunto de métricas que se relaciona com um evento ou processo de negócios específico) reside no centro da estrela, cercada por várias tabelas de dimensões associadas.

Não há dependência entre as tabelas de dimensões e, portanto, um esquema em estrela requer menos junções ao escrever consultas. Essa estrutura facilita a consulta, de modo que os esquemas em estrela são altamente eficientes para analistas que desejam acessar e navegar em grandes conjuntos de dados.

Floco de neve

Um esquema em floco de neve é uma extensão lógica de um esquema em estrela, construindo o blueprint com tabelas de dimensões adicionais. As tabelas de dimensões são normalizadas para proteger a integridade dos dados e minimizar a redundância dos dados.

Embora esse método exija menos espaço para armazenar tabelas de dimensões, é uma estrutura complexa que pode ser difícil de manter. O principal benefício de usar o esquema de floco de neve é a baixa demanda por espaço em disco, mas a ressalva é um impacto negativo no desempenho devido às tabelas adicionais.

Cofre

O cofre de dados é uma técnica moderna de modelagem de bancos de dados que permite aos profissionais de TI projetar data warehouses empresariais ágeis. Essa abordagem impõe uma estrutura em camadas e foi desenvolvida especificamente para combater problemas de agilidade, flexibilidade e escalabilidade que surgem ao usar outros modelos de esquemas.

O cofre de dados elimina a necessidade de limpeza do esquema de estrela e simplifica a adição de novas fontes de dados sem interromper o esquema existente.

Quem usa um data mart (e como)?

Os data marts orientam decisões de negócios importantes em nível departamental. Por exemplo, uma equipe de marketing pode usar data marts para analisar o comportamento dos consumidores, enquanto uma equipe de vendas pode usar data marts para compilar relatórios de vendas trimestrais. Como essas tarefas são realizadas em seus respectivos departamentos, as equipes não precisam ter acesso a todos os dados empresariais.

Normalmente, um data mart é criado e gerenciado pelo departamento de negócios específico que pretende usá-lo. O processo de criação de um data mart geralmente compreende as seguintes etapas:

  1. Documentar requisitos essenciais para entender as necessidades técnicas e de negócios do data mart.

  2. Identificar as fontes de dados das quais seu data mart dependerá para obter informações.

  3. Determinar o subconjunto de dados, quer sejam todas as informações sobre um tópico ou campos específicos em um nível mais granular.

  4. Criar o layout lógico para o data mart escolhendo um esquema que se correlacione com o data warehouse maior.

Com a base pronta, você pode obter o máximo valor de um data mart usando ferramentas especializadas de business intelligence, como Qlik ou SiSense. Essas soluções incluem um dashboard e visualizações que facilitam a distinção entre insights e dados, o que, em última análise, leva a decisões mais inteligentes que beneficiam a empresa.

Data mart e arquitetura de nuvem

Embora os data marts ofereçam às empresas os benefícios de maior eficiência e flexibilidade, o crescimento imparável dos dados representa um problema para as empresas que continuam a usar uma solução no local.

À medida que os data warehouses migram para a nuvem, os data marts farão o mesmo. Ao consolidar os recursos de dados em um único repositório que contém todos os data marts, as empresas podem reduzir custos e garantir que todos os departamentos tenham acesso irrestrito aos dados necessários em tempo real.

As plataformas baseadas em nuvem possibilitam a criação, o compartilhamento e o armazenamento de conjuntos de dados maciços com facilidade, abrindo caminho para um acesso e uma análise de dados mais eficientes e eficazes. Os sistemas em nuvem são criados para o crescimento sustentável da empresa, com muitos provedores modernos de software como serviço (SaaS) separando o armazenamento de dados da computação para melhorar a escalabilidade ao consultar dados.

Soluções relacionadas
IBM watsonx.data

O watsonx.data permite escalar a análise de dados e a IA com todos os seus dados, onde quer que estejam, por meio de um armazenamento de dados aberto, híbrido e governado.

Conheça o watsonx.data
Soluções de data warehouse

Escale cargas de trabalho de análise de dados e IA sempre ativas e de alto desempenho em dados governados em toda a sua organização

Explore as soluções de data warehouse
Serviços de consultoria de dados e análise de dados

Libere o valor dos dados empresariais com a IBM® Consulting, construindo uma organização orientada por insights, que proporciona vantagem comercial.

Conheça os serviços de análise de dados
Dê o próximo passo

Unifique todos os seus dados para IA e análise com o IBM watsonx.data. Coloque seus dados para trabalhar, onde quer que estejam, com o data lakehouse híbrido e aberto para IA e análise.

Conheça o watsonx.data Explore as soluções de data warehouse