O que é um data mart?
Saiba mais sobre o data mart e como ele pode ajudar a melhorar a eficiência da equipe, reduzir custos e facilitar a tomada de decisão de negócios táticos mais inteligentes nas empresas
Plano de fundo azul e preto
O que é um data mart?

Um data mart é um subconjunto de um data warehouse focado em uma determinada linha de negócios, departamento ou área de assunto. Os data marts disponibilizam dados específicos para um grupo definido de usuários, permitindo-lhes acessar rapidamente insights críticos sem desperdiçar tempo procurando em todo um data warehouse. Por exemplo, muitas empresas podem ter um data mart alinhado com um departamento específico nos negócios, como finanças, vendas ou marketing.

Data mart vs. data warehouse vs. data lake

Data marts, data warehouses e data lakes são repositórios de dados centrais cruciais, mas atendem a diferentes necessidades dentro de uma organização.

Um data warehouse é um sistema que agrega dados de várias origens em um armazenamento de dados único, central e consistente para suportar mineração de dados, inteligência artificial (IA) e machine learning, que, em última instância, pode aprimorar a análise de dados sofisticada e a inteligência de negócios. Por meio desse processo estratégico de coleção, as soluções de data warehouse consolidam dados das diferentes origens para disponibilizá-los de forma unificada. 

Um data mart (conforme observado acima) é uma versão focada de um data warehouse que contém um subconjunto menor de dados importantes e necessários para uma única equipe ou um grupo selecionado de usuários em uma organização. Um data mart é desenvolvido a partir de um data warehouse existente (ou outras origens de dados) por meio de um procedimento complexo envolvendo várias tecnologias e ferramentas para projetar e construir um banco de dados físico, preenchê-lo com dados e configurar protocolos complexos de acesso e gerenciamento.

Embora seja um processar desafiador, ele permite que uma linha de negócios descubra insights mais focados de forma mais rápida do que trabalhando com um conjunto de dados de um data warehouse mais amplo. Por exemplo, as equipes de marketing podem se beneficiar da criação de um data mart a partir de um data warehouse existente, uma vez que suas atividades são geralmente executadas de forma independente do resto dos negócios. Portanto, a equipe não necessidade acessar todos os dados corporativos.

Um data lake também é um repositório para dados. Um data lake fornece armazenamento substancial de dados brutos ou não estruturados alimentados por meio de várias origens, mas as informações ainda não foram processadas ou preparadas para análise. Como resultado de poder armazenar dados em um formato bruto, os data lakes são mais acessíveis e com custo reduzido do que os data warehouses. Não há necessidade de limpar e processar os dados antes de alimenta-los.

Por exemplo, governos podem usar tecnologia para rastrear dados sobre o comportamento de tráfego, o uso de energia e de hidrovias, e armazená-los em um data lake enquanto eles resolvem como utilizar os dados para criar "cidades mais inteligentes" com serviços mais eficientes.

Benefícios de um data mart

Os data marts são projetados para atender às necessidades de grupos específico por terem um assunto de dados comparativamente limitado. E enquanto um data mart ainda pode conter milhões de registros, seu objetivo é fornecer aos usuários de negócios os dados mais relevante na menor quantidade de tempo. 

Com seu design menor e focado, um data mart traz vários benefícios para o usuário final, incluindo o que se segue:

  • Eficiência de custos:  existem muitos fatores a serem considerados ao configurar um data mart, tais como escopo, integrações e o processo para extrair, transformar e carregar (ETL). No entanto, um data mart normalmente só incorre em uma fração do custo de um data warehouse.

  • Acesso a dados simplificado:  data marts apenas mantêm um subconjunto pequeno de dados, de modo que os usuários podem recuperar rapidamente os dados que precisam com menos trabalho do que poderiam ter ao trabalhar com um conjunto de dados mais amplo de um data warehouse.

  • Acesso mais rápido a insights:  a intuição adquirida com um data warehouse suporta a tomada de decisões estratégicas no nível corporativo, o que impacta todo o negócio. Um data mart alimenta a inteligência de negócios e a análise de dados que guiam decisões no nível do departamento. As equipes podem utilizar insights de dados focados com seus objetivos específicos em mente. À medida que as equipes identificam e extraem dados valiosos em um menor espaço de tempo, a empresa se beneficia de processos de negócios acelerados e maior produtividade.

  • Manutenção de dados mais simples:  um data warehouse detém uma riqueza de informações de negócios, com escopo para várias linhas de negócios. Os data marts focam em uma única linha, hospedando abaixo de 100GB, o que leva a menos desorganização e a uma manutenção mais fácil.

  • Implementação mais fácil e rápida:  um data warehouse envolve um tempo de implementação significativo, especialmente em uma grande empresa, pois coleta dados de uma série de origens internas e externas. Por outro lado, apenas um subconjunto de dados é necessário ao configurar um data mart, portanto, a implementação tende a ser mais eficiente e inclui menos tempo de configuração.
Tipos de data marts

Existem três tipos de data marts que diferem com base em seu relacionamento com o data warehouse e as respectivas origens de dados de cada sistema.

  • Data marts dependentes  são segmentos particionados em um data warehouse corporativo. Esta abordagem descendente começa com o armazenamento de todos os dados de negócios em uma localização central. Os data marts recém-criados extraem um subconjunto definido dos dados primários sempre que necessários para análise.

  • Data marts independentes  atuam como um sistema independente que não depende de um data warehouse. Os analistas podem extrair dados sobre um determinado assunto ou processo de negócios de origens de dados internas e externas, processá-los e, em seguida, armazená-los em um repositório de data mart até que a equipe precise desses dados.

  • Data marts híbridos  combinam dados de data warehouses existentes e outras origens operacionais. Essa abordagem unificada utiliza a velocidade e a interface fácil e simples de uma abordagem descendente, bem como oferece a integração de nível corporativo do método independente.
Estrutura de um data mart

Um data mart é um banco de dados relacional orientado a assunto que armazena dados transacionais em linhas e colunas, o que facilita acessar, organizar e entender. Por conter dados históricos, essa estruturar torna mais fácil para um analista determinar tendências de dados. Os campos de dados típicos incluem ordem numérica, valor de tempo e referências a um ou mais objetos.

As empresas organizam os data marts em um esquema multidimensional como um blueprint para lidar com as necessidades das pessoas que usam os bancos de dados para tarefas de análise de dados. Os três principal tipos de esquema são em estrela, em floco de neve e área segura.

Estrela
 

O esquema em estrela é uma formação lógica de tabelas em um banco de dados multidimensional que se assemelha a uma forma de estrela. Neste projeto, uma tabela de fatos, que é um conjunto métrico que se refere a um evento ou processo de negócios específico, reside no centro da estrela, cercada por várias tabelas de dimensão associadas.

Não há dependência entre as tabelas de dimensão, portanto, um esquema em estrela requer menos junções ao compor consultas. Essa estruturar facilita a consulta, portanto, os esquemas em estrela são altamente eficientes para analistas que desejam acessar e navegar grandes conjuntos de dados.

Floco de neve
 

Um esquema em floco de neve é uma extensão lógica de um esquema em estrela, estendendo o blueprint com tabelas de dimensão adicionais. As tabelas de dimensão são normalizadas para proteger a integridade dos dados e minimizar a redundância deles.

Embora esse método exija menos espaço para armazenar tabelas de dimensão, ele é uma estrutura complexa que pode ser difícil de manter. O principal benefício de usar o esquema em floco de neve é a baixa demanda para espaço em disco, mas a ressalva é um impacto negativo no desempenho em virtude das tabelas adicionais.

Área segura
 

A área segura de dados é uma técnica moderna de modelagem de banco de dados que permite que os profissionais de TI projetem data warehouses corporativos ágeis. Essa abordagem impõe uma estrutura em camadas sendo desenvolvida especificamente para combater problemas relacionados à agilidade, à flexibilidade e à escalabilidade que surgem ao usar os outros modelos de esquema.

A área segura de dados elimina a necessidade do esquema em estrela de limpar, e simplifica a adição de novas origens de dados sem qualquer interrupção do esquema existente.

Quem usa um data mart (e como)?

Os data marts guiam importantes decisões de negócios em um nível departamental. Por exemplo, uma equipe de marketing pode usar data marts para analisar comportamentos de consumidores, enquanto a equipe de vendas poderia usar data marts para compilar relatórios de vendas trimestrais. Uma vez que essas tarefas acontecem dentro de seus respectivos departamentos, as equipes não necessitam ter acesso a todos os dados corporativos.

Normalmente, um data mart é criado e gerenciado pelo departamento de negócios específico que pretende usá-lo. O processo para projetar um data mart normalmente compreende as etapas a seguir:

  1. Requisitos documentais essenciais para entender as necessidades de negócios e técnicas do data mart.

  2. Identifique as origens de dados nas quais o seu data mart irá contar para informações.

  3. Determine o subconjunto de dados, sejam todas as informações a respeito de um tópico ou campos específicos em um nível mais granular.

  4. Projete o formato lógico para o data mark ao escolher um esquema que se correlaciona com o maior data warehouse.

Com a base concluída, é possível obter o máximo valor de um data mart usando ferramentas de especialista em inteligência de negócios, como Qlik ou SiSense. Essas soluções incluem um dashboard e visualizações que facilitam o discernimento de insights dos dados, o que acaba levando a decisões mais inteligente que beneficiam a empresa.

Data mart e arquitetura em cloud

Enquanto os data marts oferecem aos negócios os benefícios de uma maior eficiência e flexibilidade, o crescimento imparável dos dados representa um problema para empresas que continuam a usar uma solução local.

À medida que data warehouses migram para a cloud, os data marts farão o mesmo. Ao consolidar recursos de dados em um único repositório que contém todos os data marts, as empresas podem reduzir custos e assegurar que todos os departamentos tenham acesso irrestrito aos dados que necessitam em tempo real.

As plataformas baseadas em cloud possibilitam criar, compartilhar e armazenar conjuntos de dados substanciais com facilidade, abrindo o caminho para um acesso e análise de dados mais eficiente e eficaz. Os sistemas na cloud são desenvolvidos para um crescimento sustentável de negócios, com muitos provedores modernos de Software como serviço (SaaS) que separam o armazenamento de dados da computação para melhorar a escalabilidade ao consultar dados.

Soluções relacionadas
Db2 Warehouse on Cloud

Conheça os recursos de um data warehouse na cloud totalmente gerenciado e flexível desenvolvido para análise de dados de alto desempenho e IA.

Conheça o Db2 Warehouse on Cloud
InfoSphere Master Data Management

Conheça como o IBM InfoSphere Master Data Management pode capacitar os usuários corporativos e de TI a colaborar e inovar com dados mestre confiáveis em toda a empresa.

Conheça o InfoSphere Master Data Management
Recursos Encontrando o data warehouse corporativo ideal para atender ao desafio de dados e de IA
A IA pode apresentar uma série de desafios que os data warehouses corporativos e data marts podem ajudar a superar. Descubra como avaliar o valor total que essa solução pode fornecer.
Data lakes encontram Data warehouses
Veja o que o analista David Menninger, da Ventana Research, tem a dizer sobre a interseção entre data lakes e data warehouses, uma importante consideração ao estender qualquer data mart.
Dê o próximo passo

O IBM Db2 Warehouse on Cloud é um data warehouse na cloud elástica que oferece ajuste de escala independente do armazenamento e da computação. Os data marts menores podem usar o recurso Flex One, que é um data warehouse elástico desenvolvido para análise de dados de alto desempenho. Este sistema é implementável em vários provedores de cloud, com armazenamento a partir de 40 GB.

Conheça o IBM Db2 Warehouse on Cloud