Startseite
Themen
data mart
Ein Datamart ist ein Teil eines Data-Warehouse, das sich auf einen bestimmten Geschäftsbereich, eine Abteilung oder einen Themenbereich konzentriert. Datamarts machen bestimmte Daten für eine definierte Benutzergruppe verfügbar, so dass diese Benutzer schnell auf wichtige Erkenntnisse zugreifen können, ohne Zeit mit der Suche in einem ganzen Data-Warehouse zu verschwenden. Viele Unternehmen verfügen beispielsweise über ein Datamart, das auf eine bestimmte Abteilung im Unternehmen ausgerichtet ist, z. B. Finanzen, Vertrieb oder Marketing.
Datamarts, Data-Warehouses und Data-Lakes sind wichtige zentrale Repositorys, bedienen jedoch unterschiedliche Erfordernisse innerhalb eines Unternehmens.
Ein Data-Warehouse ist ein System, das Daten aus verschiedenen Quellen in einem einzigen, zentralen und einheitlichen Datenspeicher zusammenfasst, um Data-Mining, künstliche Intelligenz (KI) und maschinelles Lernen zu unterstützen, was letztlich zu einer Verbesserung von anspruchsvollen Analysen und Business Intelligence führen kann. Durch diesen strategischen Erfassungsprozess konsolidieren Data-Warehouse-Lösungen die Daten aus den verschiedenen Quellen und machen sie in einer einheitlichen Form verfügbar.
Ein Datamart ist (wie oben erwähnt) eine fokussierte Version eines Data-Warehouse, die einen kleineren Teil von Daten enthält, die für ein einzelnes Team oder eine ausgewählte Gruppe von Benutzern innerhalb eines Unternehmens wichtig sind und benötigt werden. Ein Datamart wird aus einem bestehenden Data-Warehouse (oder anderen Datenquellen) durch ein komplexes Verfahren aufgebaut, das mehrere Technologien und Tools umfasst, um eine physische Datenbank zu gestalten und zu erstellen, sie mit Daten zu bestücken und komplizierte Zugriffs- und Verwaltungsprotokolle einzurichten.
Dies ist zwar ein anspruchsvoller Prozess, aber er ermöglicht es den Geschäftsbereichen, schneller zu gezielten Erkenntnissen zu gelangen als bei der Arbeit mit einem breiteren Data-Warehouse-Datensatz. Marketingteams können beispielsweise von der Erstellung eines Datamart aus einem bestehenden Warehouse profitieren, da ihre Aktivitäten in der Regel unabhängig vom Rest des Unternehmens durchgeführt werden. Daher muss das Team nicht auf alle Unternehmensdaten zugreifen.
Auch ein Data-Lake ist ein Repository für Daten. Ein Data-Lake bietet einen umfangreichen Speicherplatz für unstrukturierte oder Rohdaten, die über mehrere Quellen eingespeist werden, wobei die Informationen noch nicht verarbeitet oder für die Analyse aufbereitet wurden. Da die Daten in einem Rohformat gespeichert werden können, sind Data-Lakes leichter zugänglich und kostengünstiger als Data-Warehouses. Es besteht keine Notwendigkeit, Daten vor der Aufnahme zu bereinigen und zu verarbeiten.
So können Behörden beispielsweise Daten über das Verkehrsverhalten, den Stromverbrauch und die Wasserwege mithilfe von Technologie verfolgen und in einem Data-Lake speichern, während sie herausfinden, wie sie die Daten nutzen können, um „Smartere Cities“ mit effizienteren Services zu schaffen.
Datamarts sind so konzipiert, dass sie den Bedürfnissen bestimmter Gruppen gerecht werden, indem sie einen vergleichsweise schmalen Datengegenstand bedienen. Auch wenn ein Datamart Millionen von Datensätzen enthalten kann, besteht sein Ziel darin, den Geschäftskunden die wichtigsten Daten in kürzester Zeit zur Verfügung zu stellen.
Mit seiner kleineren, fokussierten Gestaltung hat ein Datamart mehrere Vorteile für den Endbenutzer, darunter die folgenden:
Es gibt drei Arten von Datamarts, die sich durch ihre Beziehung zum Data-Warehouse und die jeweiligen Datenquellen der einzelnen Systeme unterscheiden.
Ein Datamart ist eine themenorientierte relationale Datenbank, in der Transaktionsdaten in Zeilen und Spalten gespeichert werden, was den Zugriff, die Organisation und das Verständnis erleichtert. Da sie historische Daten enthält, erleichtert diese Struktur dem Analysten die Ermittlung von Datentrends. Typische Datenfelder schließen numerische Reihenfolge, Zeitwert und Verweise auf ein oder mehrere Objekte ein.
Unternehmen organisieren Datamarts in einem mehrdimensionalen Schema als Entwurf, um den Erfordernissen der Personen gerecht zu werden, die die Datenbanken für analytische Aufgaben nutzen. Die drei Haupttypen von Schemata sind Stern, Schneeflocke und Vault.
Ein Sternschema ist eine logische Anordnung von Tabellen in einer mehrdimensionalen Datenbank, die einer Sternform ähnelt. In diesem Entwurf befindet sich eine Fakttabelle – ein Metriksatz, der sich auf ein bestimmtes Geschäftsereignis oder einen Prozess bezieht – im Mittelpunkt des Sterns, umgeben von mehreren zugeordneten Abmessungstabellen.
Es gibt keine Abhängigkeit zwischen den Abmessungstabellen, so dass ein Sternschema beim Schreiben von Abfragen weniger Joins benötigt. Diese Struktur erleichtert die Abfrage, so dass Sternschemata für Analysten, die auf große Datenbestände zugreifen und in ihnen navigieren wollen, äußerst effizient sind.
Ein Schneeflockenschema st eine logische Erweiterung eines Sternschemas, bei dem der Entwurf durch zusätzliche Abmessungstabellen ergänzt wird. Die Abmessungstabellen sind normalisiert, um die Datenintegrität zu schützen und die Datenredundanz zu minimieren.
Diese Methode benötigt zwar weniger Platz für die Speicherung von Abmessungstabellen, ist aber eine komplexe Struktur, die schwer zu verwalten sein kann. Der Hauptvorteil der Verwendung des Schneeflockenschemas ist der geringe Bedarf an Festplattenspeicher, der Nachteil ist jedoch eine negative Auswirkung auf den Durchsatz aufgrund der zusätzlichen Tabellen.
Ein Daten-Vault ist eine moderne Datenbankmodellierungstechnik, die es IT-Fachleuten ermöglicht, agile Data-Warehouses für Unternehmen zu entwickeln. Dieser Ansatz setzt eine mehrschichtige Struktur voraus und wurde speziell entwickelt, um Probleme mit der Agilität, Flexibilität und Skalierbarkeit zu bekämpfen, die bei der Verwendung anderer Schemamodelle auftreten.
Ein Data Vault macht die Bereinigung von Sternschemata überflüssig und rationalisiert das Hinzufügen neuer Datenquellen ohne Beeinträchtigung des bestehenden Schemas.
Datamarts steuern wichtige Geschäftsentscheidungen auf Abteilungsebene. Ein Marketingteam kann beispielsweise Datamarts verwenden, um das Verbraucherverhalten zu analysieren, während Vertriebsmitarbeiter Datamarts für die Erstellung vierteljährlicher Umsatzberichte nutzen können. Da diese Aufgaben in den jeweiligen Abteilungen erledigt werden, benötigen die Teams keinen Zugriff auf alle Unternehmensdaten.
In der Regel wird ein Datamart von der jeweiligen Geschäftsabteilung, die ihn nutzen will, erstellt und verwaltet. Der Prozess der Entwicklung eines Datamart umfasst in der Regel die folgenden Schritte:
Wenn die Basis geschaffen wurde, können Sie den größten Nutzen aus einem Data Mart ziehen, indem Sie spezielle Business Intelligence-Tools wie Qlik oder SiSense einsetzen. Diese Lösungen umfassen ein Dashboard und Visualisierungen, die es leicht machen, Erkenntnisse aus den Daten zu gewinnen, was letztlich zu smarteren Entscheidungen zum Vorteil des Unternehmens führt.
Während Datamarts Unternehmen die Vorteile größerer Effizienz und Flexibilität bieten, stellt das unaufhaltsame Datenwachstum ein Problem für Unternehmen dar, die weiterhin eine lokale Lösung verwenden.
Wenn Data-Warehouses in die Cloud wandern, werden Datamarts folgen. Durch die Konsolidierung von Datenressourcen in einem einzigen Repository, das alle Datamarts enthält, können Unternehmen ihre Kosten senken und sicherstellen, dass alle Abteilungen in Echtzeit uneingeschränkten Zugriff auf die benötigten Daten haben.
Cloudbasierte Plattformen ermöglichen die einfache Erstellung, gemeinsame Nutzung und Speicherung umfangreicher Datenbestände und ebnen so den Weg für einen effizienteren und effektiveren Datenzugriff und eine ebensolche Analyse. Cloud-Systeme sind für ein nachhaltiges Unternehmenswachstum ausgelegt, wobei viele moderne Software-as-a-Service-Anbieter (SaaS) die Datenspeicherung von der Datenverarbeitung trennen, um die Skalierbarkeit bei der Datenabfrage zu verbessern.
Entdecken Sie die Möglichkeiten eines vollständig verwalteten, elastischen Cloud-Data-Warehouse, das für leistungsfähige Analysen und KI entwickelt wurde.
Erfahren Sie, wie IBM InfoSphere Master Data Management Benutzer aus Geschäfts- und IT-Bereich unterstützen kann, mit zuverlässigen Stammdaten im gesamten Unternehmen zusammenzuarbeiten und Innovationen zu realisieren.
KI kann eine Reihe von Herausforderungen mit sich bringen, bei deren Bewältigung Enterprise-Data-Warehouses und Datamarts helfen können. Erfahren Sie, wie Sie den Gesamtwert einer solchen Lösung beurteilen können.