Um data mart é um banco de dados relacional orientado a assunto que armazena dados transacionais em linhas e colunas, o que facilita acessar, organizar e entender. Por conter dados históricos, essa estruturar torna mais fácil para um analista determinar tendências de dados. Os campos de dados típicos incluem ordem numérica, valor de tempo e referências a um ou mais objetos.
As empresas organizam os data marts em um esquema multidimensional como um blueprint para lidar com as necessidades das pessoas que usam os bancos de dados para tarefas de análise de dados. Os três principal tipos de esquema são em estrela, em floco de neve e área segura.
Estrela
O esquema em estrela é uma formação lógica de tabelas em um banco de dados multidimensional que se assemelha a uma forma de estrela. Neste projeto, uma tabela de fatos, que é um conjunto métrico que se refere a um evento ou processo de negócios específico, reside no centro da estrela, cercada por várias tabelas de dimensão associadas.
Não há dependência entre as tabelas de dimensão, portanto, um esquema em estrela requer menos junções ao compor consultas. Essa estruturar facilita a consulta, portanto, os esquemas em estrela são altamente eficientes para analistas que desejam acessar e navegar grandes conjuntos de dados.
Floco de neve
Um esquema em floco de neve é uma extensão lógica de um esquema em estrela, estendendo o blueprint com tabelas de dimensão adicionais. As tabelas de dimensão são normalizadas para proteger a integridade dos dados e minimizar a redundância deles.
Embora esse método exija menos espaço para armazenar tabelas de dimensão, ele é uma estrutura complexa que pode ser difícil de manter. O principal benefício de usar o esquema em floco de neve é a baixa demanda para espaço em disco, mas a ressalva é um impacto negativo no desempenho em virtude das tabelas adicionais.
Área segura
A área segura de dados é uma técnica moderna de modelagem de banco de dados que permite que os profissionais de TI projetem data warehouses corporativos ágeis. Essa abordagem impõe uma estrutura em camadas sendo desenvolvida especificamente para combater problemas relacionados à agilidade, à flexibilidade e à escalabilidade que surgem ao usar os outros modelos de esquema.
A área segura de dados elimina a necessidade do esquema em estrela de limpar, e simplifica a adição de novas origens de dados sem qualquer interrupção do esquema existente.