Ein Datamart ist eine themenorientierte relationale Datenbank, in der Transaktionsdaten in Zeilen und Spalten gespeichert werden, was den Zugriff, die Organisation und das Verständnis erleichtert. Da sie historische Daten enthält, erleichtert diese Struktur dem Analysten die Ermittlung von Datentrends. Typische Datenfelder schließen numerische Reihenfolge, Zeitwert und Verweise auf ein oder mehrere Objekte ein.
Unternehmen organisieren Datamarts in einem mehrdimensionalen Schema als Entwurf, um den Erfordernissen der Personen gerecht zu werden, die die Datenbanken für analytische Aufgaben nutzen. Die drei Haupttypen von Schemata sind Stern, Schneeflocke und Vault.
Stern
Ein Sternschema ist eine logische Anordnung von Tabellen in einer mehrdimensionalen Datenbank, die einer Sternform ähnelt. In diesem Entwurf befindet sich eine Fakttabelle – ein Metriksatz, der sich auf ein bestimmtes Geschäftsereignis oder einen Prozess bezieht – im Mittelpunkt des Sterns, umgeben von mehreren zugeordneten Abmessungstabellen.
Es gibt keine Abhängigkeit zwischen den Abmessungstabellen, so dass ein Sternschema beim Schreiben von Abfragen weniger Joins benötigt. Diese Struktur erleichtert die Abfrage, so dass Sternschemata für Analysten, die auf große Datenbestände zugreifen und in ihnen navigieren wollen, äußerst effizient sind.
Schneeflocke
Ein Schneeflockenschema st eine logische Erweiterung eines Sternschemas, bei dem der Entwurf durch zusätzliche Abmessungstabellen ergänzt wird. Die Abmessungstabellen sind normalisiert, um die Datenintegrität zu schützen und die Datenredundanz zu minimieren.
Diese Methode benötigt zwar weniger Platz für die Speicherung von Abmessungstabellen, ist aber eine komplexe Struktur, die schwer zu verwalten sein kann. Der Hauptvorteil der Verwendung des Schneeflockenschemas ist der geringe Bedarf an Festplattenspeicher, der Nachteil ist jedoch eine negative Auswirkung auf den Durchsatz aufgrund der zusätzlichen Tabellen.
Vault
Ein Daten-Vault ist eine moderne Datenbankmodellierungstechnik, die es IT-Fachleuten ermöglicht, agile Data-Warehouses für Unternehmen zu entwickeln. Dieser Ansatz setzt eine mehrschichtige Struktur voraus und wurde speziell entwickelt, um Probleme mit der Agilität, Flexibilität und Skalierbarkeit zu bekämpfen, die bei der Verwendung anderer Schemamodelle auftreten.
Ein Data Vault macht die Bereinigung von Sternschemata überflüssig und rationalisiert das Hinzufügen neuer Datenquellen ohne Beeinträchtigung des bestehenden Schemas.