Início
topics
data mart
Um data mart é um subconjunto de um data warehouse focado em uma determinada linha de negócios, departamento ou área de assunto. Os data marts disponibilizam dados específicos para um grupo definido de usuários, permitindo-lhes acessar rapidamente insights críticos sem desperdiçar tempo procurando em todo um data warehouse. Por exemplo, muitas empresas podem ter um data mart alinhado com um departamento específico nos negócios, como finanças, vendas ou marketing.
Data marts, data warehouses e data lakes são repositórios de dados centrais cruciais, mas atendem a diferentes necessidades dentro de uma organização.
Um data warehouse é um sistema que agrega dados de várias origens em um armazenamento de dados único, central e consistente para suportar mineração de dados, inteligência artificial (IA) e machine learning, que, em última instância, pode aprimorar a análise de dados sofisticada e a inteligência de negócios. Por meio desse processo estratégico de coleção, as soluções de data warehouse consolidam dados das diferentes origens para disponibilizá-los de forma unificada.
Um data mart (conforme observado acima) é uma versão focada de um data warehouse que contém um subconjunto menor de dados importantes e necessários para uma única equipe ou um grupo selecionado de usuários em uma organização. Um data mart é desenvolvido a partir de um data warehouse existente (ou outras origens de dados) por meio de um procedimento complexo envolvendo várias tecnologias e ferramentas para projetar e construir um banco de dados físico, preenchê-lo com dados e configurar protocolos complexos de acesso e gerenciamento.
Embora seja um processar desafiador, ele permite que uma linha de negócios descubra insights mais focados de forma mais rápida do que trabalhando com um conjunto de dados de um data warehouse mais amplo. Por exemplo, as equipes de marketing podem se beneficiar da criação de um data mart a partir de um data warehouse existente, uma vez que suas atividades são geralmente executadas de forma independente do resto dos negócios. Portanto, a equipe não necessidade acessar todos os dados corporativos.
Um data lake também é um repositório para dados. Um data lake fornece armazenamento substancial de dados brutos ou não estruturados alimentados por meio de várias origens, mas as informações ainda não foram processadas ou preparadas para análise. Como resultado de poder armazenar dados em um formato bruto, os data lakes são mais acessíveis e com custo reduzido do que os data warehouses. Não há necessidade de limpar e processar os dados antes de alimenta-los.
Por exemplo, governos podem usar tecnologia para rastrear dados sobre o comportamento de tráfego, o uso de energia e de hidrovias, e armazená-los em um data lake enquanto eles resolvem como utilizar os dados para criar "cidades mais inteligentes" com serviços mais eficientes.
Os data marts são projetados para atender às necessidades de grupos específico por terem um assunto de dados comparativamente limitado. E enquanto um data mart ainda pode conter milhões de registros, seu objetivo é fornecer aos usuários de negócios os dados mais relevante na menor quantidade de tempo.
Com seu design menor e focado, um data mart traz vários benefícios para o usuário final, incluindo o que se segue:
Existem três tipos de data marts que diferem com base em seu relacionamento com o data warehouse e as respectivas origens de dados de cada sistema.
Um data mart é um banco de dados relacional orientado a assunto que armazena dados transacionais em linhas e colunas, o que facilita acessar, organizar e entender. Por conter dados históricos, essa estruturar torna mais fácil para um analista determinar tendências de dados. Os campos de dados típicos incluem ordem numérica, valor de tempo e referências a um ou mais objetos.
As empresas organizam os data marts em um esquema multidimensional como um blueprint para lidar com as necessidades das pessoas que usam os bancos de dados para tarefas de análise de dados. Os três principal tipos de esquema são em estrela, em floco de neve e área segura.
O esquema em estrela é uma formação lógica de tabelas em um banco de dados multidimensional que se assemelha a uma forma de estrela. Neste projeto, uma tabela de fatos, que é um conjunto métrico que se refere a um evento ou processo de negócios específico, reside no centro da estrela, cercada por várias tabelas de dimensão associadas.
Não há dependência entre as tabelas de dimensão, portanto, um esquema em estrela requer menos junções ao compor consultas. Essa estruturar facilita a consulta, portanto, os esquemas em estrela são altamente eficientes para analistas que desejam acessar e navegar grandes conjuntos de dados.
Um esquema em floco de neve é uma extensão lógica de um esquema em estrela, estendendo o blueprint com tabelas de dimensão adicionais. As tabelas de dimensão são normalizadas para proteger a integridade dos dados e minimizar a redundância deles.
Embora esse método exija menos espaço para armazenar tabelas de dimensão, ele é uma estrutura complexa que pode ser difícil de manter. O principal benefício de usar o esquema em floco de neve é a baixa demanda para espaço em disco, mas a ressalva é um impacto negativo no desempenho em virtude das tabelas adicionais.
A área segura de dados é uma técnica moderna de modelagem de banco de dados que permite que os profissionais de TI projetem data warehouses corporativos ágeis. Essa abordagem impõe uma estrutura em camadas sendo desenvolvida especificamente para combater problemas relacionados à agilidade, à flexibilidade e à escalabilidade que surgem ao usar os outros modelos de esquema.
A área segura de dados elimina a necessidade do esquema em estrela de limpar, e simplifica a adição de novas origens de dados sem qualquer interrupção do esquema existente.
Os data marts guiam importantes decisões de negócios em um nível departamental. Por exemplo, uma equipe de marketing pode usar data marts para analisar comportamentos de consumidores, enquanto a equipe de vendas poderia usar data marts para compilar relatórios de vendas trimestrais. Uma vez que essas tarefas acontecem dentro de seus respectivos departamentos, as equipes não necessitam ter acesso a todos os dados corporativos.
Normalmente, um data mart é criado e gerenciado pelo departamento de negócios específico que pretende usá-lo. O processo para projetar um data mart normalmente compreende as etapas a seguir:
Com a base concluída, é possível obter o máximo valor de um data mart usando ferramentas de especialista em inteligência de negócios, como Qlik ou SiSense. Essas soluções incluem um dashboard e visualizações que facilitam o discernimento de insights dos dados, o que acaba levando a decisões mais inteligente que beneficiam a empresa.
Enquanto os data marts oferecem aos negócios os benefícios de uma maior eficiência e flexibilidade, o crescimento imparável dos dados representa um problema para empresas que continuam a usar uma solução local.
À medida que data warehouses migram para a cloud, os data marts farão o mesmo. Ao consolidar recursos de dados em um único repositório que contém todos os data marts, as empresas podem reduzir custos e assegurar que todos os departamentos tenham acesso irrestrito aos dados que necessitam em tempo real.
As plataformas baseadas em cloud possibilitam criar, compartilhar e armazenar conjuntos de dados substanciais com facilidade, abrindo o caminho para um acesso e análise de dados mais eficiente e eficaz. Os sistemas na cloud são desenvolvidos para um crescimento sustentável de negócios, com muitos provedores modernos de Software como serviço (SaaS) que separam o armazenamento de dados da computação para melhorar a escalabilidade ao consultar dados.
Conheça os recursos de um data warehouse na cloud totalmente gerenciado e flexível desenvolvido para análise de dados de alto desempenho e IA.
Conheça como o IBM InfoSphere Master Data Management pode capacitar os usuários corporativos e de TI a colaborar e inovar com dados mestre confiáveis em toda a empresa.
A IA pode apresentar uma série de desafios que os data warehouses corporativos e data marts podem ajudar a superar. Descubra como avaliar o valor total que essa solução pode fornecer.
Veja o que o analista David Menninger, da Ventana Research, tem a dizer sobre a interseção entre data lakes e data warehouses, uma importante consideração ao estender qualquer data mart.