Was ist ein Data Mart?

Ein Data Mart ist eine Teilmenge eines Data Warehouse, die sich auf einen bestimmten Geschäftszweig, eine Abteilung oder einen Themenbereich konzentriert. Data Marts können die Teameffizienz verbessern, Kosten senken und eine intelligentere taktische Entscheidungsfindung in Unternehmen ermöglichen.

Data Marts stellen bestimmte Daten einer definierten Gruppe von Benutzern zur Verfügung, sodass diese Benutzer schnell auf wichtige Erkenntnisse zugreifen können, ohne ihre Zeit mit der Suche in einem ganzen Data Warehouse zu verschwenden. Viele Unternehmen haben beispielsweise einen Data Mart, der auf eine bestimmte Abteilung des Unternehmens abgestimmt ist, z. B. Finanzen, Vertrieb oder Marketing.

Die neuesten Tech-News – von Experten bestätigt

Bleiben Sie mit dem Think-Newsletter über die wichtigsten – und faszinierendsten – Branchentrends in den Bereichen KI, Automatisierung, Daten und mehr auf dem Laufenden. Weitere Informationen finden Sie in der IBM Datenschutzerklärung.

Data Mart versus Data Warehouse versus Data Lake

Data Marts, Data Warehouses und Data Lakes sind wichtige zentrale Datenspeicher, aber sie dienen unterschiedlichen Zwecken innerhalb eines Unternehmens.

Ein Data Warehouse ist ein System, das Daten aus verschiedenen Quellen in einem einzigen, zentralen und einheitlichen Datenspeicher zusammenfasst, um Data Mining, künstliche Intelligenz (KI) und maschinelles Lernen zu unterstützen, was letztlich anspruchsvolle Analysen und die Business Intelligence verbessern kann. Durch diesen strategischen Erfassungsprozess konsolidieren Data-Warehouse-Lösungen die Daten aus den verschiedenen Quellen, um sie in einer einheitlichen Form verfügbar zu machen.

Ein Data Mart (wie oben erwähnt) ist eine konzentrierte Version eines Data Warehouse, die eine kleinere Teilmenge von Daten enthält, die für ein einzelnes Team oder eine ausgewählte Gruppe von Benutzern innerhalb eines Unternehmens wichtig sind und benötigt werden. Ein Data Mart wird aus einem bestehenden Data Warehouse (oder anderen Datenquellen) durch ein komplexes Verfahren erstellt, das mehrere Technologien und Tools umfasst. Dabei wird eine physische Datenbank konzipiert und aufgebaut und mit Daten befüllt, woraufhin komplizierte Zugriffs- und Verwaltungsprotokolle eingerichtet werden.

Obwohl dies ein anspruchsvoller Prozess ist, ermöglicht er es einem Geschäftsbereich, schneller gezieltere Erkenntnisse zu gewinnen als bei der Arbeit mit einem breiteren Datensatz aus dem Data Warehouse. Beispielsweise können Marketingteams von der Erstellung eines Data Marts aus einem bestehenden Warehouse profitieren, da ihre Aktivitäten in der Regel unabhängig vom Rest des Unternehmens durchgeführt werden. Daher benötigt das Team keinen Zugriff auf alle Unternehmensdaten.

Auch ein Data Lake ist ein Repositorium für Daten. Ein Data Lake bietet massiven Speicherplatz für unstrukturierte oder Rohdaten, die aus mehreren Quellen stammen, aber noch nicht für die Analyse verarbeitet oder aufbereitet wurden. Da Daten in einem Rohformat gespeichert werden können, sind Data Lakes leichter zugänglich und kostengünstiger als Data Warehouses. Die Daten müssen vor der Aufnahme nicht bereinigt oder verarbeitet werden.

Beispielsweise können Behörden Technologien einsetzen, um Daten zum Verkehrsverhalten, zum Stromverbrauch und zu Wasserwegen zu erfassen und in einem Data Lake zu speichern, während sie überlegen, wie sie diese Daten nutzen können, um „intelligentere Städte“ mit effizienteren Dienstleistungen zu schaffen.

AI Academy

Ist Datenverwaltung das Geheimnis generativer KI?

Erfahren Sie, warum qualitativ hochwertige Daten für den erfolgreichen Einsatz generativer KI unerlässlich sind.

Zur Episode wechseln

Vorteile eines Data Mart

Data Marts sind darauf ausgelegt, die Anforderungen bestimmter Gruppen zu erfüllen, indem sie einen vergleichsweise engen Datenbereich abdecken. Ein Data Mart kann zwar immer noch Millionen von Datensätzen enthalten, sein Ziel ist es jedoch, Geschäftsanwendern in kürzester Zeit die relevantesten Daten zur Verfügung zu stellen.

Mit seinem kleineren, fokussierten Design bietet ein Data Mart dem Endnutzer mehrere Vorteile, darunter die folgenden:

Kosteneffizienz: Bei der Einrichtung eines Data Marts sind viele Faktoren zu berücksichtigen, z. B. der Umfang, die Integrationen und der Prozess zum Extrahieren, Transformieren und Laden (ETL). Ein Data Mart verursacht jedoch in der Regel nur einen Bruchteil der Kosten eines Data Warehouse.
Vereinfachter Datenzugriff: Data Marts enthalten nur eine kleine Teilmenge von Daten, sodass Benutzer die benötigten Daten schnell und mit weniger Aufwand abrufen können als bei der Arbeit mit einem breiteren Datensatz aus einem Data Warehouse.
Schnellerer Zugriff auf Erkenntnisse: Die aus einem Data Warehouse gewonnene Intuition unterstützt strategische Entscheidungen auf Unternehmensebene, die sich auf das gesamte Unternehmen auswirken. Ein Data Mart stellt Business Intelligence und Analysen bereit, die Entscheidungen auf Abteilungsebene leiten. Teams können gezielte Dateneinblicke mit Blick auf ihre spezifischen Ziele nutzen. Da Teams wertvolle Daten in kürzerer Zeit identifizieren und extrahieren, profitiert das Unternehmen von beschleunigten Geschäftsprozessen und höherer Produktivität.
Einfachere Datenpflege: Ein Data Warehouse enthält eine Fülle von Geschäftsinformationen, die für mehrere Geschäftsbereiche genutzt werden können. Data Marts konzentrieren sich auf einen einzigen Bereich mit weniger als 100 GB, was zu weniger Überladungen und einer einfacheren Wartung führt.
Einfachere und schnellere Implementierung: Ein Data Warehouse erfordert eine erhebliche Implementierungszeit, insbesondere in einem großen Unternehmen, da es Daten aus einer Vielzahl von internen und externen Quellen sammelt. Auf der anderen Seite benötigen Sie bei der Einrichtung eines Data Mart nur eine kleine Teilmenge an Daten, sodass die Implementierung tendenziell effizienter ist und weniger Einrichtungszeit erfordert.

Arten von Data Marts

Es gibt drei Arten von Data Marts, die sich durch ihre Beziehung zum Data Warehouse und die jeweiligen Datenquellen der einzelnen Systeme unterscheiden.

Abhängige Data Marts sind partitionierte Segmente innerhalb eines Data Warehouse eines Unternehmens. Dieser Top-Down-Ansatz beginnt mit der Speicherung aller Geschäftsdaten an einem zentralen Ort. Die neu erstellten Data Marts extrahieren eine definierte Teilmenge der Primärdaten, wann immer dies für die Analyse erforderlich ist.
Unabhängige Data Marts fungieren als eigenständiges System, das nicht auf ein Data Warehouse angewiesen ist. Analysten können Daten zu einem bestimmten Thema oder Geschäftsprozess aus internen oder externen Datenquellen extrahieren, verarbeiten und dann in einem Data-Mart-Repository speichern, bis das Team sie benötigt.
Hybride Data Marts kombinieren Daten aus bestehenden Data Warehouses und anderen operativen Quellen. Dieser einheitliche Ansatz nutzt die Geschwindigkeit und die benutzerfreundliche Oberfläche eines Top-Down-Ansatzes und bietet darüber hinaus die Integration auf Unternehmensebene der unabhängigen Methode.

Struktur eines Data Marts

Ein Data Mart ist eine themenorientierte relationale Datenbank, die Transaktionsdaten in Zeilen und Spalten speichert, wodurch sie leicht zugänglich, organisierbar und verständlich ist. Da sie historische Daten enthält, erleichtert diese Struktur einem Analysten die Ermittlung von Datentrends. Typische Datenfelder sind numerische Reihenfolge, Zeitwert und Verweise auf ein oder mehrere Objekte.

Unternehmen organisieren Data Marts in einem mehrdimensionalen Schema als Blaupause, um die Bedürfnisse der Personen zu erfüllen, die Datenbanken für analytische Aufgaben nutzen. Die drei Haupttypen von Schemata sind Stern, Schneeflocke und Tresor.

Stern

Das Sternschema ist eine logische Anordnung von Tabellen in einer multidimensionalen Datenbank, die einer Sternform ähnelt. In diesem Blueprint befindet sich eine Faktentabelle – eine Metrikgruppe, die sich auf ein bestimmtes Geschäftsereignis oder einen bestimmten Geschäftsprozess bezieht – im Zentrum des Sterns, umgeben von mehreren zugehörigen Dimensionstabellen.

Es gibt keine Abhängigkeiten zwischen Dimensionstabellen, sodass ein Sternschema beim Schreiben von Abfragen weniger Joins erfordert. Diese Struktur erleichtert die Abfrage, sodass Sternschemata für Analysten, die auf große Datensätze zugreifen und darin navigieren möchten, äußerst effizient sind.

Snowflake

Ein Schneeflockenschema ist eine logische Erweiterung eines Sternschemas, bei dem der Blueprint durch zusätzliche Dimensionstabellen ergänzt wird. Die Dimensionstabellen werden normalisiert, um die Datenintegrität zu schützen und die Datenredundanz zu minimieren.

Diese Methode benötigt zwar weniger Platz zum Speichern von Dimensionstabellen, aber es handelt sich um eine komplexe Struktur, die schwierig zu verwalten sein kann. Der Hauptvorteil der Verwendung des Snowflake-Schemas ist der geringe Bedarf an Festplattenspeicher, aber der Vorbehalt wirkt sich aufgrund der zusätzlichen Tabellen negativ auf die Leistung aus.

Tresor

Data Vault ist eine moderne Technik zur Datenbankmodellierung, mit der IT-Experten agile Data Warehouses für Unternehmen entwerfen können. Dieser Ansatz erzwingt eine mehrschichtige Struktur und wurde speziell entwickelt, um Probleme mit Agilität, Flexibilität und Skalierbarkeit zu bekämpfen, die bei der Verwendung der anderen Schemamodelle auftreten.

Der Data Vault macht die Bereinigung des Sternschemas überflüssig und vereinfacht das Hinzufügen neuer Datenquellen, ohne das bestehende Schema zu beeinträchtigen.

Wer nutzt einen Data Mart (und wie)?

Data Marts unterstützen wichtige Geschäftsentscheidungen auf Abteilungsebene. Beispielsweise kann ein Marketingteam Data Marts zur Analyse des Verbraucherverhaltens nutzen, während Vertriebsmitarbeiter Data Marts zur Erstellung von Quartalsberichten verwenden können. Da diese Aufgaben innerhalb der jeweiligen Abteilungen ausgeführt werden, benötigen die Teams keinen Zugriff auf alle Unternehmensdaten.

Normalerweise wird ein Data Mart von der jeweiligen Geschäftsabteilung erstellt und verwaltet, die ihn verwenden möchte. Der Prozess zur Erstellung eines Data Marts umfasst in der Regel die folgenden Schritte:

Dokumentation der wesentlichen Anforderungen, um die geschäftlichen und technischen Anforderungen des Data Mart zu verstehen.
Identifizierung der Datenquellen, aus denen Ihr Data Mart Informationen beziehen wird.
Bestimmung der Datenuntermenge, ob es sich um alle Informationen zu einem Thema oder um bestimmte Felder auf einer detaillierteren Ebene handelt.
Entwurf des logischen Layouts für den Data Mart durch Auswahl eines Schemas, das mit dem größeren Data Warehouse korreliert.

Wenn die Vorarbeit geleistet ist, können Sie den größtmöglichen Nutzen aus einem Data Mart ziehen, indem Sie spezielle Business-Intelligence-Tools wie Qlik oder SiSense verwenden. Diese Lösungen umfassen ein Dashboard und Visualisierungen, mit denen sich Erkenntnisse aus den Daten leicht erkennen lassen, wodurch letztlich intelligentere Entscheidungen zum Vorteil des Unternehmens getroffen werden können.

Data Mart und Cloud-Architektur

Während Data Marts Unternehmen Vorteile wie höhere Effizienz und Flexibilität bieten, stellt das unaufhaltsame Datenwachstum ein Problem für Unternehmen dar, die weiterhin eine lokale Lösung verwenden.

Wenn Data Warehouses in die Cloud verlagert werden, werden Data Marts folgen. Durch die Konsolidierung von Datenressourcen in einem einzigen Repository, das alle Data Marts enthält, können Unternehmen Kosten senken und sicherstellen, dass alle Abteilungen uneingeschränkten Zugriff auf die benötigten Daten in Echtzeit haben.

Cloudbasierte Plattformen ermöglichen die einfache Erstellung, gemeinsame Nutzung und Speicherung riesiger Datensätze und ebnen den Weg für einen effizienteren und effektiveren Datenzugriff und eine effizientere Datenanalyse. Cloud-Systeme sind auf nachhaltiges Unternehmenswachstum ausgelegt. Viele moderne Software-as-a-Service (SaaS)-Anbieter trennen Datenspeicherung von Datenverarbeitung, um die Skalierbarkeit bei der Datenabfrage zu verbessern.

3D-Rendering einer Spirale aus mehreren nebeneinander angeordneten Symbolen, darunter eine Kamera, ein Lautstärkeregler und ein Klemmbrett

Lesen Sie den Leitfaden für Data Leader, um zu erfahren, wie Sie die Daten Ihres Unternehmens KI-fähig machen können.

Ressourcen

3D-Rendering mehrerer nebeneinander angeordneter Symbole, darunter ein Mikrofon und eine Kamera

KI-Agenten arbeiten mit Daten – sind Ihre bereit dafür?

Ihre Daten sind Ihr Wettbewerbsvorteil. Erfahren Sie in diesem kurzen Webinar, wie Sie die KI sicher nutzen und einen messbaren ROI erzielen können.

Infos zu Datenverwaltung

Techsplainers von IBM erklärt die Grundlagen von Daten für KI, von Schlüsselkonzepten bis hin zu realen Anwendungsfällen. Klare, kurze Folgen helfen Ihnen, die Grundlagen schnell zu erlernen.

3D-Rendering von mehreren aneinandergereihten Symbolen wie einem Lautstärkeregler und einem Klemmbrett

Daten zur Skalierung Ihrer KI vereinheitlichen und zugänglich machen

Erfahren Sie, warum der Weg zu KI-fähigen Daten oft mit dem effektiven Zugriff auf strukturierte und unstrukturierte Daten beginnt und welche Herausforderungen Datenverantwortlichen im Wege stehen können.

Juristischer Aufwand wird zu strategischer Erkenntnis

Erfahren Sie, wie ein KI-gestützter Rechtsagent die Entscheidungsfindung beschleunigt, manuelle Arbeit reduziert und die Compliance verbessert.

Zwei Männer, die in einem Podcast miteinander sprechen

AI Akademy: Aufbau einer Datenstrategie für Unternehmens-KI

In dieser Folge erklärt Cathy Reese, dass Unternehmen heute eine Datenstrategie benötigen, die für fortschrittliche KI bereit ist, was bedeutet, dass sie ihre qualitativ hochwertigsten Datenressourcen nutzen müssen.

3D-Darstellung mehrerer nebeneinander angeordneter Symbole, wie z. B. einer Kamera und Papierfliegern

Das hybride, offene Data Lakehouse für KI

Vereinfachen Sie den Datenzugriff und automatisieren Sie die Data Governance. Entdecken Sie die Vorteile einer Data-Lakehouse-Strategie für Ihre Datenarchitektur, einschließlich der Kostenoptimierung Ihrer Workloads und der Skalierung von KI und Analysen, mit all Ihren Daten, überall.

Cost of a Data Breach Report 2025

Die Kosten für Datenschutzverletzungen haben einen neuen Höchststand erreicht. Erhalten Sie aktuelle Erkenntnisse hinsichtlich Cybersicherheit und deren finanziellen Auswirkungen auf Unternehmen.

3D-Rendering von zwei Reihen mit verschiedenen Symbolen, darunter eine Kamera, ein Lautstärkeregler und eine Zwischenablage

Der Leitfaden für Data Leader zu KI-fähigen Daten

Erfahren Sie, welche umsetzbaren Schritte Datenverantwortliche unternehmen können, um Datenherausforderungen zu überwinden, die Grundlage für eine vertrauenswürdige Datenbasis zu schaffen und die Daten ihres Unternehmens auf die KI vorzubereiten.

3D-Rendering mehrerer nebeneinander angeordneter Symbole, darunter eine Kamera, ein Lautstärkeregler und eine Zwischenablage

How the C-suite is turning information into impact

Erkunden Sie in diesem branchenübergreifenden Bericht für Datenverantwortliche die Erkenntnisse von 1.700 CDOs.

Weiterführende Lösungen

IBM® StreamSets

Erstellen und verwalten Sie intelligente Streaming-Datenpipelines über eine intuitive grafische Benutzeroberfläche, die eine nahtlose Datenintegration in Hybrid- und Multicloud-Umgebungen ermöglicht.

StreamSets erkunden

IBM watsonx.data

Watsonx.data ermöglicht es Ihnen, Analysen und KI mit all Ihren Daten zu skalieren, unabhängig davon, wo sie sich befinden, und zwar über einen offenen, hybriden und kontrollierten Datenspeicher.

IBM watsonx.data entdecken

Beratungsservices für Daten und Analysen

Erschließen Sie den Wert von Unternehmensdaten mit IBM Consulting® und bauen Sie ein erkenntnisgesteuertes Unternehmen auf, das Ihnen geschäftliche Vorteile verschafft.

Analyse-Services entdecken

Machen Sie den nächsten Schritt

Entwerfen Sie eine Datenstrategie, die Datensilos beseitigt, die Komplexität reduziert und die Datenqualität verbessert, um außergewöhnliche Kunden- und Mitarbeitererfahrungen zu schaffen.

Was ist ein Data Mart?