Was ist ein Datamart?
Erfahren Sie mehr über Datamarts und wie sie dazu beitragen können, Teameffizienz zu verbessern, Kosten zu senken und intelligentere taktische Geschäftsentscheidungen in Unternehmen zu unterstützen
Blauer und schwarzer Hintergrund
Was ist ein Datamart?

Ein Datamart ist ein Teil eines Data-Warehouse, das sich auf einen bestimmten Geschäftsbereich, eine Abteilung oder einen Themenbereich konzentriert. Datamarts machen bestimmte Daten für eine definierte Benutzergruppe verfügbar, so dass diese Benutzer schnell auf wichtige Erkenntnisse zugreifen können, ohne Zeit mit der Suche in einem ganzen Data-Warehouse zu verschwenden. Viele Unternehmen verfügen beispielsweise über ein Datamart, das auf eine bestimmte Abteilung im Unternehmen ausgerichtet ist, z. B. Finanzen, Vertrieb oder Marketing.

Datamart vs. Data-Warehouse vs. Data-Lake

Datamarts, Data-Warehouses und Data-Lakes sind wichtige zentrale Repositorys, bedienen jedoch unterschiedliche Erfordernisse innerhalb eines Unternehmens.

Ein Data-Warehouse ist ein System, das Daten aus verschiedenen Quellen in einem einzigen, zentralen und einheitlichen Datenspeicher zusammenfasst, um Data-Mining, künstliche Intelligenz (KI) und maschinelles Lernen zu unterstützen, was letztlich zu einer Verbesserung von anspruchsvollen Analysen und Business Intelligence führen kann. Durch diesen strategischen Erfassungsprozess konsolidieren Data-Warehouse-Lösungen die Daten aus den verschiedenen Quellen und machen sie in einer einheitlichen Form verfügbar. 

Ein Datamart ist (wie oben erwähnt) eine fokussierte Version eines Data-Warehouse, die einen kleineren Teil von Daten enthält, die für ein einzelnes Team oder eine ausgewählte Gruppe von Benutzern innerhalb eines Unternehmens wichtig sind und benötigt werden. Ein Datamart wird aus einem bestehenden Data-Warehouse (oder anderen Datenquellen) durch ein komplexes Verfahren aufgebaut, das mehrere Technologien und Tools umfasst, um eine physische Datenbank zu gestalten und zu erstellen, sie mit Daten zu bestücken und komplizierte Zugriffs- und Verwaltungsprotokolle einzurichten.

Dies ist zwar ein anspruchsvoller Prozess, aber er ermöglicht es den Geschäftsbereichen, schneller zu gezielten Erkenntnissen zu gelangen als bei der Arbeit mit einem breiteren Data-Warehouse-Datensatz. Marketingteams können beispielsweise von der Erstellung eines Datamart aus einem bestehenden Warehouse profitieren, da ihre Aktivitäten in der Regel unabhängig vom Rest des Unternehmens durchgeführt werden. Daher muss das Team nicht auf alle Unternehmensdaten zugreifen.

Auch ein Data-Lake ist ein Repository für Daten. Ein Data-Lake bietet einen umfangreichen Speicherplatz für unstrukturierte oder Rohdaten, die über mehrere Quellen eingespeist werden, wobei die Informationen noch nicht verarbeitet oder für die Analyse aufbereitet wurden. Da die Daten in einem Rohformat gespeichert werden können, sind Data-Lakes leichter zugänglich und kostengünstiger als Data-Warehouses. Es besteht keine Notwendigkeit, Daten vor der Aufnahme zu bereinigen und zu verarbeiten.

So können Behörden beispielsweise Daten über das Verkehrsverhalten, den Stromverbrauch und die Wasserwege mithilfe von Technologie verfolgen und in einem Data-Lake speichern, während sie herausfinden, wie sie die Daten nutzen können, um „Smartere Cities“ mit effizienteren Services zu schaffen.

Vorteile eines Datamart

Datamarts sind so konzipiert, dass sie den Bedürfnissen bestimmter Gruppen gerecht werden, indem sie einen vergleichsweise schmalen Datengegenstand bedienen. Auch wenn ein Datamart Millionen von Datensätzen enthalten kann, besteht sein Ziel darin, den Geschäftskunden die wichtigsten Daten in kürzester Zeit zur Verfügung zu stellen. 

Mit seiner kleineren, fokussierten Gestaltung hat ein Datamart mehrere Vorteile für den Endbenutzer, darunter die folgenden:

  • Kosteneffizienz: Bei der Einrichtung eines Datamart sind viele Faktoren zu berücksichtigen, z. B. der Umfang, die Integrationen und der Prozess zum Extrahieren, Transformieren und Laden (ETL). Ein Datamart verursacht jedoch in der Regel nur einen Bruchteil der Kosten eines Data-Warehouse.

  • Vereinfachter Datenzugriff: Datamarts enthalten nur einen kleinen Teil Daten, so dass die Benutzer die benötigten Daten schnell und mit weniger Aufwand abrufen können, als wenn sie mit einem breiteren Datenset aus einem Data-Warehouse arbeiten würden.

  • Schnellerer Zugriff auf Erkenntnisse: Die aus einem Data-Warehouse gewonnenen Erkenntnisse unterstützen die strategische Entscheidungsfindung auf Unternehmensebene, was sich auf das gesamte Unternehmen auswirkt. Ein Datamart dient als Grundlage für Business Intelligence und Analysen, die Entscheidungen auf Abteilungsebene unterstützen. Teams können gezielte Dateneinblicke mit Blick auf ihre spezifischen Ziele nutzen. Da die Teams geschäftskritische Daten in kürzerer Zeit identifizieren und extrahieren, profitiert das Unternehmen von beschleunigten Geschäftsprozessen und höherer Produktivität.

  • Einfachere Datenpflege: Ein Data-Warehouse enthält eine Fülle von Geschäftsinformationen, die sich auf mehrere Geschäftsbereiche beziehen. Datamarts konzentrieren sich auf eine einzige Linie, die weniger als 100 GB umfasst, was zu weniger Unordnung und einer einfacheren Verwaltung führt.

  • Einfachere und schnellere Implementierung: Ein Data-Warehouse erfordert eine erhebliche Implementierungszeit, insbesondere in einem großen Unternehmen, da es Daten aus einer Vielzahl von internen und externen Quellen erfasst. Andererseits benötigen Sie bei der Einrichtung eines Datamart nur einen kleinen Teil von Daten, so dass die Implementierung in der Regel effizienter ist und weniger Zeit für die Einrichtung erfordert.
Arten von Datamarts

Es gibt drei Arten von Datamarts, die sich durch ihre Beziehung zum Data-Warehouse und die jeweiligen Datenquellen der einzelnen Systeme unterscheiden.

  • Abhängige Datamarts sind partitionierte Segmente innerhalb eines Data-Warehouse des Unternehmens. Dieser Top-down-Ansatz beginnt mit der Speicherung aller Geschäftsdaten an einem zentralen Standort. Die neu erstellten Datamarts extrahieren eine definierte Teilmenge der Primärdaten, wenn sie für die Analyse benötigt werden.

  • Unabhängige Datamarts fungieren als eigenständiges System, das nicht auf ein Data-Warehouse angewiesen ist. Analysten können Daten zu einem bestimmten Thema oder Geschäftsprozess aus internen oder externen Datenquellen extrahieren, verarbeiten und dann in einem Datamart-Repository speichern, bis das Team sie benötigt.

  • Hybride Datamarts kombinieren Daten aus bestehenden Data-Warehouses und anderen betrieblichen Quellen. Dieser einheitliche Ansatz profitiert von der Verarbeitungsgeschwindigkeit und der komfortablen Benutzeroberfläche eines Top-down-Ansatzes und bietet gleichzeitig die auf Unternehmen abgestimmte Integration der unabhängigen Methode.
Aufbau eines Datamarts

Ein Datamart ist eine themenorientierte relationale Datenbank, in der Transaktionsdaten in Zeilen und Spalten gespeichert werden, was den Zugriff, die Organisation und das Verständnis erleichtert. Da sie historische Daten enthält, erleichtert diese Struktur dem Analysten die Ermittlung von Datentrends. Typische Datenfelder schließen numerische Reihenfolge, Zeitwert und Verweise auf ein oder mehrere Objekte ein.

Unternehmen organisieren Datamarts in einem mehrdimensionalen Schema als Entwurf, um den Erfordernissen der Personen gerecht zu werden, die die Datenbanken für analytische Aufgaben nutzen. Die drei Haupttypen von Schemata sind Stern, Schneeflocke und Vault.

Stern
 

Ein Sternschema ist eine logische Anordnung von Tabellen in einer mehrdimensionalen Datenbank, die einer Sternform ähnelt. In diesem Entwurf befindet sich eine Fakttabelle – ein Metriksatz, der sich auf ein bestimmtes Geschäftsereignis oder einen Prozess bezieht – im Mittelpunkt des Sterns, umgeben von mehreren zugeordneten Abmessungstabellen.

Es gibt keine Abhängigkeit zwischen den Abmessungstabellen, so dass ein Sternschema beim Schreiben von Abfragen weniger Joins benötigt. Diese Struktur erleichtert die Abfrage, so dass Sternschemata für Analysten, die auf große Datenbestände zugreifen und in ihnen navigieren wollen, äußerst effizient sind.

Schneeflocke
 

Ein Schneeflockenschema st eine logische Erweiterung eines Sternschemas, bei dem der Entwurf durch zusätzliche Abmessungstabellen ergänzt wird. Die Abmessungstabellen sind normalisiert, um die Datenintegrität zu schützen und die Datenredundanz zu minimieren.

Diese Methode benötigt zwar weniger Platz für die Speicherung von Abmessungstabellen, ist aber eine komplexe Struktur, die schwer zu verwalten sein kann. Der Hauptvorteil der Verwendung des Schneeflockenschemas ist der geringe Bedarf an Festplattenspeicher, der Nachteil ist jedoch eine negative Auswirkung auf den Durchsatz aufgrund der zusätzlichen Tabellen.

Vault
 

Ein Daten-Vault ist eine moderne Datenbankmodellierungstechnik, die es IT-Fachleuten ermöglicht, agile Data-Warehouses für Unternehmen zu entwickeln. Dieser Ansatz setzt eine mehrschichtige Struktur voraus und wurde speziell entwickelt, um Probleme mit der Agilität, Flexibilität und Skalierbarkeit zu bekämpfen, die bei der Verwendung anderer Schemamodelle auftreten.

Ein Data Vault macht die Bereinigung von Sternschemata überflüssig und rationalisiert das Hinzufügen neuer Datenquellen ohne Beeinträchtigung des bestehenden Schemas.

Wer nutzt einen Datamart (und wie)?

Datamarts steuern wichtige Geschäftsentscheidungen auf Abteilungsebene. Ein Marketingteam kann beispielsweise Datamarts verwenden, um das Verbraucherverhalten zu analysieren, während Vertriebsmitarbeiter Datamarts für die Erstellung vierteljährlicher Umsatzberichte nutzen können. Da diese Aufgaben in den jeweiligen Abteilungen erledigt werden, benötigen die Teams keinen Zugriff auf alle Unternehmensdaten.

In der Regel wird ein Datamart von der jeweiligen Geschäftsabteilung, die ihn nutzen will, erstellt und verwaltet. Der Prozess der Entwicklung eines Datamart umfasst in der Regel die folgenden Schritte:

  1. Dokumentieren Sie die wesentlichen Anforderungen, um die geschäftlichen und technischen Bedürfnisse des Datamart zu verstehen.

  2. Datenquellen identifizieren, auf die sich Ihr Datamart stützen wird, um Informationen zu erhalten.

  3. Teildatenbestand bestimmen, ob es sich um alle Informationen zu einem Abschnitt oder um bestimmte Felder auf einer differenzierteren Stufe handelt.

  4. Logisches Layout entwerfen für das Datamart durch Wahl eines Schemas, das mit dem größeren Data-Warehouse korreliert.

Wenn die Basis geschaffen wurde, können Sie den größten Nutzen aus einem Data Mart ziehen, indem Sie spezielle Business Intelligence-Tools wie Qlik oder SiSense einsetzen. Diese Lösungen umfassen ein Dashboard und Visualisierungen, die es leicht machen, Erkenntnisse aus den Daten zu gewinnen, was letztlich zu smarteren Entscheidungen zum Vorteil des Unternehmens führt.

Data Mart und Cloud-Architektur

Während Datamarts Unternehmen die Vorteile größerer Effizienz und Flexibilität bieten, stellt das unaufhaltsame Datenwachstum ein Problem für Unternehmen dar, die weiterhin eine lokale Lösung verwenden.

Wenn Data-Warehouses in die Cloud wandern, werden Datamarts folgen. Durch die Konsolidierung von Datenressourcen in einem einzigen Repository, das alle Datamarts enthält, können Unternehmen ihre Kosten senken und sicherstellen, dass alle Abteilungen in Echtzeit uneingeschränkten Zugriff auf die benötigten Daten haben.

Cloudbasierte Plattformen ermöglichen die einfache Erstellung, gemeinsame Nutzung und Speicherung umfangreicher Datenbestände und ebnen so den Weg für einen effizienteren und effektiveren Datenzugriff und eine ebensolche Analyse. Cloud-Systeme sind für ein nachhaltiges Unternehmenswachstum ausgelegt, wobei viele moderne Software-as-a-Service-Anbieter (SaaS) die Datenspeicherung von der Datenverarbeitung trennen, um die Skalierbarkeit bei der Datenabfrage zu verbessern.

Relevante Lösungen
Db2 Warehouse on Cloud

Entdecken Sie die Möglichkeiten eines vollständig verwalteten, elastischen Cloud-Data-Warehouse, das für leistungsfähige Analysen und KI entwickelt wurde.

Db2 Warehouse on Cloud erkunden
InfoSphere Master Data Management

Erfahren Sie, wie IBM InfoSphere Master Data Management Benutzer aus Geschäfts- und IT-Bereich unterstützen kann, mit zuverlässigen Stammdaten im gesamten Unternehmen zusammenzuarbeiten und Innovationen zu realisieren.

InfoSphere Master Data Management erkunden
Ressourcen Das richtige Enterprise-Data-Warehouse, um die Herausforderung von Daten und KI zu erfüllen

KI kann eine Reihe von Herausforderungen mit sich bringen, bei deren Bewältigung Enterprise-Data-Warehouses und Datamarts helfen können. Erfahren Sie, wie Sie den Gesamtwert einer solchen Lösung beurteilen können.

Data-Lakes treffen auf Data-Warehouses

Lesen Sie, was der Analyst David Menninger von Ventana Research über die Überschneidung von Data-Lakes und Data-Warehouses zu sagen hat – eine wichtige Überlegung beim Aufbau eines Datamarts.

Machen Sie den nächsten Schritt

IBM Db2 Warehouse on Cloud ist ein elastisches Cloud-Data-Warehouse, das eine unabhängige Skalierung von Speicher und Rechenleistung bietet. Kleinere Datamarts können die Funktion Flex One nutzen, ein elastisches Data-Warehouse, das für leistungsfähige Analysen entwickelt wurde. Dieses System kann bei mehreren Cloud-Anbietern eingesetzt werden, und zwar ab 40 GB Speicherplatz.

IBM Db2 Warehouse on Cloud erkunden