Mein IBM Anmelden Abonnieren
Was ist ein Data Warehouse?

Was ist ein Data Warehouse?

Entdecken Sie die Data-Warehouse-Lösung von IBM Für den Think Newsletter anmelden
Illustration mit Collage aus Piktogrammen von Wolken, Kreisdiagramm und Graphen

Aktualisiert: 11. Oktober 2024 
Mitwirkende
: Jim Holdsworth, Matthew Kosinski

Was ist ein Data Warehouse?

Was ist ein Data Warehouse?

Ein Data Warehouse ist ein System, das Daten aus mehreren Quellen in einem einzigen, zentralen und konsistenten Datenspeicher zusammenfasst. Data Warehouses helfen bei der Vorbereitung von Daten für Datenanalysen, Business Intelligence (BI), Data Mining, maschinelles Lernen (ML) und künstliche Intelligenz (KI).

 

Ein Data-Warehouse-System der Unternehmensklasse ermöglicht es einem Unternehmen, leistungsstarke Analysen anhand von riesigen Mengen (Petabytes und mehr) historischer Daten durchzuführen, wozu eine herkömmliche Datenbank nicht in der Lage ist. Die Daten können strukturiert, halbstrukturiert oder unstrukturiert sein. Daten können aus mehreren Datenbanken in ein Warehouse eingespeist werden, darunter Managementsysteme für Customer Relationship Management (CRM), Bestand, Point of Sale (POS) und Lieferketten.

Data-Warehouse-Systeme – manchmal auch als Enterprise-Data-Warehouse-Systeme (EDW) bezeichnet – unterstützen seit über drei Jahrzehnten die Bemühungen im Bereich Business Intelligence. Ihre Funktionen konzentrieren sich auf das Extrahieren von Daten aus anderen Quellen, das Bereinigen und Vorbereiten der Daten sowie das Laden und Verwalten der Daten, häufig in einer relationalen Datenbank.

Traditionell wurde ein Data Warehouse lokal gehostet, oft auf einem Mainframe-Computer. Heutzutage werden viele Data Warehouses in der Cloud gehostet und als Cloud-Services bereitgestellt. 

KI erfordert neue Wege der Datenverwaltung

Der Leitfaden für Datenverantwortliche zur Nutzung der richtigen Datenbanken für Anwendungen, Analysen und generative KI.

Entwicklung des Data Warehouse

Entwicklung des Data Warehouse

Data Warehouses entstanden in den 1980er Jahren, um die Datenanalyse zu optimieren, indem integrierte Transaktionsdaten in einem konsistenten Format verfügbar gemacht werden. Mit der zunehmenden Leistungsfähigkeit von Geschäftsanwendungen und der explosionsartigen Zunahme neuer Datenquellen – darunter das World Wide Web, soziale Medien und das Internet der Dinge (IoT) – stieg auch der Bedarf an größerem Speicherplatz und schnelleren Analysen.

Im Zuge der Weiterentwicklung des Data Warehouse, das nun größere Mengen und detailliertere Daten unterstützt, forderten mehr Teams in Unternehmen direkten Zugriff auf die Daten für Self-Service-Analysefunktionen.  

Viele Unternehmen stellten fest, dass ihre alten Data Warehouses diese neuen, enormen Workloads nicht bewältigen konnten. Und da viele Data Warehouses nur strukturierte Daten speicherten, war die Analyse möglicherweise nur begrenzt aussagekräftig. Als Reaktion darauf wurden flexiblere Alternativen entwickelt, darunter cloudnative Data Warehouses und Data Lakehouses. (Weitere Informationen finden Sie unter „Data Lakehouse vs. Data Warehouse“.) 

Data-Warehouse-Architektur

Data-Warehouse-Architektur

Um Daten schnell und effizient zu verarbeiten, verwenden Data Warehouses meist eine dreistufige Architektur.

Untere Ebene


Auf dieser Ebene fließen die Daten aus unterschiedlichen Datenquellen in einen Data-Warehouse-Server, wo sie gespeichert werden. Die Daten werden meistens durch einen Prozess verschoben, der als Extrahieren, Transformieren, Laden (ETL), oder manchmal als Extrahieren, Laden, Transformieren (ELT), bekannt ist. Diese Prozesse werden auf unterschiedliche Weise ausgeführt, aber beide nutzen die Automatisierung, um Daten in ein Warehouse zu verschieben und sie für die Verwendung in Analysen vorzubereiten.

Mittlere Ebene


Diese Ebene basiert traditionell auf einer Analytics Engine, meist einem Online Analytical Processing (OLAP)-System, das für schnelle Analysen und Abfragen ausgelegt ist. In dieser Ebene können drei Arten von OLAP-Modellen verwendet werden:

  • Relational Online Analytical Processing (ROLAP), das eine mehrdimensionale Datenanalyse relationaler Datenbanken ermöglicht.

  • Multidimensional Online Analytical Processing (MOLAP), das Array-basierte multidimensionale Speicher-Engines verwendet, um multidimensionale Ansichten von Daten zu erstellen.

  • Hybrid Online Analytical Processing (HOLAP), das ROLAP- und MOLAP-Funktionen zusammenführt.

Die Art des OLAP-Modells hängt von der Art des verwendeten Datenbanksystems ab.

Oberste Ebene


Diese Ebene umfasst eine Front-End-Benutzeroberfläche oder ein Berichterstellungstool, mit dem Benutzer Ad-hoc-Datenanalysen ihrer Geschäftsdaten durchführen können. Self-Service Business Intelligence hat vielfältige Einsatzmöglichkeiten, wie z. B. die Erstellung von Berichten auf der Grundlage historischer Daten, die Identifizierung neuer Möglichkeiten oder die Identifizierung von Prozessengpässen.

Grundlegendes zu OLAP und OLTP

Grundlegendes zu OLAP und OLTP

Die meisten Data Warehouses verwenden OLAP-Systeme zur Unterstützung von Analysen. OLAP-Software ermöglicht die schnelle multidimensionale Analyse großer Datenmengen aus einem einheitlichen, zentralisierten Datenspeicher, wie z. B. einem Data Warehouse.

Geschäftsdaten haben oft mehrere Dimensionen. Zum Beispiel können Verkaufszahlen mehrere Dimensionen in Bezug auf den Standort (Region, Land und Geschäft), die Zeit (Jahr, Monat, Woche und Tag) oder das Produkt (Marke, Typ) enthalten.

In einer herkömmlichen relationalen Datenbank werden die Daten in Zeilen- und Spaltentabellen organisiert, die jeweils nur zwei dieser Dimensionen darstellen können – eine Dimension in der Zeile und eine Dimension in der Spalte. Dies kann die Analyse umständlich machen.

OLAP-Systeme ermöglichen es Benutzern jedoch, Daten entlang mehrerer Dimensionen gleichzeitig zu analysieren, was eine schnellere Verarbeitung und aufschlussreichere Analysen ermöglicht. Zu den gängigen Einsatzbereichen von OLAP gehören Data-Mining- und Business-Intelligence-Apps, komplexe analytische Berechnungen, Vorhersageszenarien, Budgetierung und Forecasting.

OLAP unterscheidet sich von Online Transactional Processing oder OLTP. OLTP-Systeme verfolgen eine große Anzahl von Transaktionen durch eine große Anzahl von Benutzern in Echtzeit. Der Hauptunterschied zwischen OLTP und OLAP besteht darin, dass OLTP-Systeme in erster Linie für die Datenerfassung konzipiert sind, während OLAP-Systeme bereits erfasste Daten analysieren.

OLTP-Systeme verwenden häufig relationale Datenbanken, um Transaktionen aufzuzeichnen, wie z. B.:

  • Bank- und Geldautomatentransaktionen
  • E-Commerce und Käufe im Geschäft
  • Hotel- und Flugreservierungen

Während Data Warehouses in der Regel keine OLTP-Systeme umfassen, werden die von OLTP-Systemen in Datenbanken aufgezeichneten Daten in der Regel in das Warehouse eingespeist, wo ein OLAP-System die Analyse ermöglicht.

OLAP vs. OLTP: Was ist der Unterschied?
Schemata in Data Warehouses

Schemata in Data Warehouses

Datenbankschemata definieren, wie Daten in einer Datenbank oder einem Data Warehouse organisiert werden. Es gibt zwei Haupttypen von Schemata-Strukturen, die in Data Warehouses verwendet werden: das Sternschema (Star Schema) und das Schneeflockenschema (Snowflake Schema).

Sowohl das Stern- als auch das Schneeflockenschema sind Datenmodelle, die zur Optimierung der Geschwindigkeit der Datenabfrage entwickelt wurden. Dimensionale Modelle erhöhen die Redundanz, um das Auffinden von Informationen für Berichte und Abfragen zu erleichtern. Diese Modellierung wird typischerweise in OLAP-Systemen verwendet.

Sternschema

 

Dieses Schema besteht aus einer Faktentabelle (die messbare Elemente wie verkaufte Produkte und monetäre Verkaufsbeträge enthält), die mit Dimensionstabellen verknüpft ist (d. h. Referenzinformationen, die zeigen, wie die Fakten gruppiert und organisiert werden können, wie z. B. Verkaufsdaten und die Branche, an die verkauft wurde).

In einem Diagramm kann die Faktentabelle in der Mitte eines Sternmusters erscheinen. Das Sternschema gilt als einfachste und am weitesten verbreitete Art von Schema, und seine Benutzer profitieren von der höheren Geschwindigkeit bei der Abfrage.

Schneeflockenschema

 

Das Schneeflockenschema ist zwar nicht so verbreitet, stellt aber eine weitere Organisationsstruktur in Data Warehouses dar. In diesem Fall ist die Faktentabelle mit mehreren normalisierten Dimensionstabellen verbunden, die beschreibende Daten zu den Fakten in der zentralen Faktentabelle enthalten. Diese Dimensionstabellen haben auch untergeordnete Tabellen.

Dieses komplexere, verzweigte Muster kann einer Schneeflocke ähneln. In diesem Fall ist die Faktentabelle mit mehreren normalisierten Dimensionstabellen verbunden, die beschreibende Daten zu den Fakten in der zentralen Faktentabelle enthalten. 

Komponenten der Data-Warehouse-Architektur

Komponenten der Data-Warehouse-Architektur

Die meisten Data Warehouses werden um ein relationales Datenbanksystem herum aufgebaut, entweder vor Ort oder in der Cloud, wo Daten sowohl gespeichert als auch verarbeitet werden. Ein typisches Data Warehouse verfügt über Komponenten wie:

  • Datenebene (oder zentrale Datenbank)
  • Zugriffstools
  • ETL-Tools (Extrahieren, Transformieren, Laden)
  • Metadaten
  • Sandbox
  • API-Schicht

Datenebene (oder zentrale Datenbank)

Die Datenebene oder zentrale Datenbank ist das Herzstück des Data Warehouse und wird von allen anderen Komponenten unterstützt. Die Daten können aus Geschäftsanwendungen, E-Mail-Listen, Websites oder anderen relationalen Datenbanken importiert werden. Die Daten werden physisch auf einem Server oder einer Reihe von Servern gespeichert.

Die Datenebene kann Datensegmente aufteilen, sodass Benutzer nur auf die Daten zugreifen können, die sie auch benötigen. So hat beispielsweise das Vertriebsteam normalerweise keinen Zugriff auf die Daten des HR-Teams und umgekehrt.

In der Regel verfügen Data Warehouses über integrierte Data Governance- und Sicherheitsfunktionen, sodass Unternehmen nicht viel benutzerdefinierte Datenverarbeitung betreiben müssen, um diese Funktionen zu nutzen. Unternehmen müssen möglicherweise die Data Governance-Grundsätze und Sicherheitsmaßnahmen im Zeitverlauf aktualisieren, wenn neue Daten aus verschiedenen Quellen zum Warehouse hinzugefügt werden.

Zugriffstools

Zugriffstools stellen eine Verbindung zu einem Data Warehouse her, um ein Front-End bereitzustellen, das für Geschäftsanwender benutzerfreundlich ist. Dies kann Dashboards, Berichts- und Datenvisualisierung beinhalten, die es Datenanalysten und Geschäftsanwendern ermöglichen, mit den Daten zu interagieren und Erkenntnisse zu gewinnen. Beispiele für diese Tools sind Tableau, Looker und Qlik.

ETL-Tools (Extrahieren, Transformieren, Laden)

ETL-Tools helfen beim Verschieben von Daten aus einer Datenquelle in das Data Warehouse. Die Daten werden zunächst aus ihrer Quelle „extrahiert“, in einen Staging-Bereich verschoben, wo sie bereinigt und vorbereitet (oder „transformiert“) werden, und anschließend in ein Data Warehouse „geladen“.

ETL-Tools konvertieren Daten in ein einheitliches Format, sodass sie effizient analysiert und abgefragt werden können, wenn sie sich im Warehouse befinden. Zum Beispiel könnten Daten aus mehreren Kundendatenbanken extrahiert und dann in ein gemeinsames Format umgewandelt werden, sodass alle Kundendatensätze dann dieselben Felder enthalten.

Ein Framework-Tool für die Datenverarbeitung, wie Apache Spark, kann helfen, die Transformation von Daten zu verwalten.

Da ein Data Warehouse in erster Linie strukturierte Daten speichert, werden die Daten in der Regel transformiert, bevor sie in das Warehouse verschoben werden. Während einige Lagerhäuser stattdessen einen Extraktions-, Lade- und Transformationsprozess (ELT) verwenden können, bei dem die Daten vor der Transformation in das Lager geladen werden, wird dieser Prozess häufiger für Data Lakes verwendet, die keine standardisierten Datenformate erfordern. (Weitere Informationen finden Sie unter „Data Lake vs. Data Warehouse“.)

Metadaten

Metadaten sind Daten über Daten. Im Grunde beschreiben sie diejenigen Daten, die in einem System gespeichert sind, um sie durchsuchbar zu machen. Metadaten enthalten Merkmale wie Autoren, Datumsangaben oder Orte von Artikeln, Erstellungsdaten und Dateigrößen. Metadaten und ihr Verwaltungssystem helfen dabei, Daten zu organisieren und für Analysen nutzbar zu machen.

Sandbox

Einige Data Warehouses bieten eine Sandbox, die von den Live-Daten abgeschottet ist. Sie kann als Testumgebung verwendet werden, die eine Kopie der Produktionsdaten und relevante Analyse- und Visualisierungstools enthält. Data Analysten und Data Scientists können mit neuen Analysetechniken in der Sandbox experimentieren, ohne den Betrieb des Data Warehouse für andere Benutzer zu beeinträchtigen.

API-Schicht

Eine Konnektivitätsschicht für Anwendungsprogrammierschnittstellen (APIs) kann dem Lager dabei helfen, Daten aus organisatorischen Quellen abzurufen und Zugriff auf Visualisierungs- und Analysetools bereitzustellen.

Data Warehouses und andere Arten der Datenspeicherung im Vergleich

Data Warehouses und andere Arten der Datenspeicherung im Vergleich

Die Begriffe Data Warehouse, Datenbank, Data Lake, Data Mart und Data Lakehouse werden manchmal synonym verwendet. Obwohl diese Systeme ähnlich sind, gibt es jedoch wesentliche Unterschiede.

Datenbank vs. Data Warehouse

Eine Datenbank ist wie ein Aktenschrank, der hauptsächlich für schnelle Abfragen und die Verarbeitung von Transaktionen konzipiert ist, jedoch nicht für Analysen. Eine Datenbank dient in der Regel als zielgerichteter Datenspeicher für eine bestimmte Anwendung, während ein Data Warehouse Daten aus einer beliebigen Anzahl von Anwendungen in Ihrem Unternehmen speichert.

Eine Datenbank konzentriert sich auf die Erfassung von Echtzeitdaten, während ein Data Warehouse einen breiteren Anwendungsbereich hat und historische Daten – aber manchmal auch aktuelle Daten – für prädiktive Analysen, maschinelles Lernen und andere fortgeschrittene Analysen erfasst.

Data Lake im Vergleich zu Data Lake Data Warehouse

Ein Data Lake ist eine Speicherlösung für große Mengen an Rohdaten ohne vordefiniertes Schema. Data Lakes enthalten oft unstrukturierte und halbstrukturierte Daten, wie z. B. Dokumente, Videos, Internet-of-Things-Protokolle (IoT) und Social-Media-Beiträge. Sie werden häufig auf Big-Data-Plattformen wie Apache Hadoop erstellt.

Data Lakes sind in erster Linie darauf ausgelegt, kostengünstigen Speicher für große Datenmengen zu bieten. Um die Lagerkosten niedrig zu halten, werden Daten in der Regel nicht transformiert oder für Analysen optimiert, wie es in einem Warehouse der Fall ist.

Data Mart vs. Data Warehouse

Ein Data Mart ist eine Art Data Warehouse, das Daten enthält, die für einen bestimmten Geschäftsbereich oder eine bestimmte Abteilung spezifisch sind, nicht für ein ganzes Unternehmen.

Da sie eine kleinere Teilmenge von Daten enthalten, ermöglichen Data Marts einer Abteilung oder einem Geschäftsbereich schnellere und gezieltere Einblicke, als dies bei der Arbeit mit dem breiteren Data-Warehouse-Datensatz möglich ist.

Ein Marketingteam könnte beispielsweise einen Data Mart verwenden, um ideale demografische Zielgruppen zu definieren, während ein Produktteam einen Data Mart verwenden könnte, um Bestandsmuster zu analysieren.

Data Lakehouse vs. Data Warehouse

Ein Data Lakehouse ist eine Datenplattform, die Aspekte von Data Warehouses und Data Lakes – also die Flexibilität eines Lake und die hohe Leistung eines Warehouse – in einer Datenverwaltungslösung vereint. Data Lakehouses können auch Funktionen wie freigegebene Metadaten, verteilte SQL (Structured Query Language)-Engines und integrierte Governance- und Sicherheitskontrollen hinzufügen.

Das Aufkommen von Open-Source-Technologien und der Wunsch, Datenduplizierung und komplexe ETL-Pipelines zu reduzieren, haben zur Entwicklung des Data Lakehouse geführt. Durch die Kombination der wichtigsten Funktionen von Lakes und Warehouses in einer Datenlösung können Lakehouses dazu beitragen, die Datenverarbeitung zu beschleunigen und maschinelles Lernen, Data Science und KI-Workloads zu unterstützen.

Arten von Data Warehouses

Arten von Data Warehouses

Cloud Data Warehouse

Ein cloudbasiertes Data Warehouse ist für die Ausführung in der Cloud konzipiert. Es wird Unternehmen oft als verwalteter Datenspeicherservice angeboten, bei dem die Data-Warehouse-Infrastruktur vom Cloud-Unternehmen verwaltet wird. Das Unternehmen muss weder im Voraus in Hardware oder Software investieren noch ein eigenes System verwalten. Cloud-Services bieten oft auch eine flexible Preisgestaltung.

Cloudbasierte Data Warehouses erfreuen sich zunehmender Beliebtheit, da immer mehr Unternehmen Cloud-Computing-Services nutzen und versuchen, den Speicherbedarf ihrer lokalen Rechenzentren zu reduzieren.

Lokales oder lizenziertes Data Warehouse

Ein Unternehmen kann eine Data-Warehouse-Lizenz erwerben und das Warehouse dann als eigene lokale Infrastruktur bereitstellen. Dies ist zwar in der Regel teurer als ein Cloud-Data-Warehouse-Service, kann aber für Behörden, Finanzinstitute oder andere Organisationen, die mehr Kontrolle über ihre Daten haben wollen oder strenge Sicherheits- oder Datenschutzstandards einhalten müssen, eine gute Alternative darstellen.

Data-Warehouse-Appliance 

Eine Data-Warehouse-Appliance ist ein vorintegriertes Paket aus Hardware und Software – in der Regel einschließlich Zentralprozessoren (CPUs), Speicher, Betriebssystem und Data-Warehouse-Software –, das ein Unternehmen mit seinem Netzwerk verbinden und sofort nutzen kann.

In Bezug auf die Vorlaufkosten, die Geschwindigkeit der Bereitstellung, die einfache Skalierbarkeit und die Kontrolle der Datenverwaltung liegt eine Data-Warehouse-Anwendung in der Regel zwischen Cloud- und On-Premises-Implementierungen.

Anwendungsfälle für Data Warehouses

Anwendungsfälle für Data Warehouses

Ein Data Warehouse kann Teams in einem Unternehmen Erkenntnisse und Informationen über einen schnellen Self-Service zur Verfügung stellen und so mehrere Anwendungsfälle ermöglichen.

  • KI und maschinelles Lernen
  • Business Intelligence
  • Datenintegration
  • Branchenspezifische Anwendungen

KI und maschinelles Lernen

Data Warehouses können verschiedene Anwendungen für KI und maschinelles Lernen unterstützen. Data Scientists können historische Daten analysieren, um Vorhersagealgorithmen zu entwickeln. Sie können Anwendungen für maschinelles Lernen beibringen, Muster zu erkennen, wie z. B. verdächtige Kontoaktivitäten, die auf Betrug hindeuten könnten. Sie können bereinigte und validierte Lagerdaten verwenden, um proprietäre generative KI-Modelle zu erstellen oder bestehende Modelle zu optimieren, um ihren individuellen Geschäftsanforderungen besser gerecht zu werden.

Business Intelligence

Ein Data Warehouse der Unternehmensklasse kann Tausenden von Benutzern den gleichzeitigen Zugriff auf Analysetools und deren Ausführung ermöglichen. Da die Daten getrennt von den operativen Datenbanken und in einem effizienteren Format gespeichert werden, können Benutzer ihre eigenen Self-Service-Business-Intelligence-Abfragen ausführen, ohne andere wichtige Systeme zu verlangsamen.

Datenintegration

Data Warehouses können dabei helfen, isolierte Daten durch ETL-Pipelines zu konsolidieren, die die Bereinigung und Integration automatisieren. Dies beschleunigt Abfragen und die Verarbeitung und ermöglicht mehr Benutzern den Zugriff auf Daten.

Ein Data-Warehouse der Unternehmensklasse kann auch Open-Source-Formate wie Apache Iceberg, Parquet und CSV unterstützen, was einen weiteren Datenaustausch im gesamten Unternehmen ermöglicht.

Branchenspezifische Anwendungen

Data Warehouses können auch für branchenspezifische Zwecke genutzt werden, z. B. für:

  • Regierung: Die analytischen Fähigkeiten eines Data Warehouse können Regierungen dabei helfen, komplexe Phänomene wie Kriminalität, demografische Trends und Verkehrsmuster besser zu verstehen.

  • Gesundheitswesen: Die Möglichkeit, unterschiedliche Daten wie Abrechnungs- und Diagnosecodes, demografische Patientendaten, Medikamente und Testergebnisse zu zentralisieren und zu analysieren, kann Krankenhäusern dabei helfen, Erkenntnisse über Patientenergebnisse, betriebliche Effizienz und vieles mehr zu gewinnen.

  • Hotel- und Gastgewerbe und Transport: Unternehmen können historische Daten zu Reise- und Unterkunftsentscheidungen nutzen, um Werbung und Verkaufsförderungsmaßnahmen gezielter auf ihre Kunden abzustimmen.

  • Fertigung: Große Produktionsunternehmen generieren riesige Datenmengen. Unternehmen können Data Warehouses nutzen, um Data Marts zu erstellen, die auf die Bedürfnisse der einzelnen Abteilungen zugeschnitten sind, und den Benutzern den Zugriff auf die für ihre Rollen relevanten Daten zu erleichtern.
Vorteile eines Data Warehouse

Vorteile eines Data Warehouse

Ein Data Warehouse kombiniert Datenströme aus unterschiedlichen Datenspeichern, wodurch Unternehmen diese Daten leichter analysieren können. Dadurch können Unternehmen wertvolle Erkenntnisse gewinnen, ihre Leistung steigern, ihre Betriebsabläufe verbessern und sich letztendlich einen Wettbewerbsvorteil verschaffen.

Konkret können die Vorteile eines Data Warehouse Folgendes umfassen:

  • Bessere Datenqualität
  • Tiefergehende Erkenntnisse
  • Bessere Geschäftsentscheidungen

Bessere Datenqualität

Ein Data Warehouse kann Daten aus verschiedenen Datenquellen zusammenführen, z. B. aus Transaktionssystemen, operativen Datenbanken und Flat Files. Anschließend werden diese Betriebsdaten bereinigt, Duplikate entfernt und standardisiert, um eine Single-Source-of-Truth (SSOT) zu schaffen, die einem Unternehmen einen umfassenden, zuverlässigen Überblick über die Unternehmensdaten bietet.

Tiefergehende Erkenntnisse

Wenn Daten in unterschiedlichen Quellen gespeichert sind, kann dies die Fähigkeit von Entscheidungsträgern einschränken, Erkenntnisse zu gewinnen und Geschäftsstrategien mit Zuversicht festzulegen. Ein Data Warehouse mit einem zentralen Repository ermöglicht es Geschäftsanwendern, alle relevanten Daten eines Unternehmens in die Entscheidungsfindung einzubeziehen.

Durch die Erstellung von Berichten über historische Daten kann ein Data Warehouse dabei helfen festzustellen, welche Systeme und Prozesse funktionieren und was verbessert werden muss.

Bessere Geschäftsentscheidungen

Data Warehouses ermöglichen es, Themen, Trends und Aggregationen zu entdecken und darüber zu berichten. Datenexperten und Führungskräfte können diese Erkenntnisse nutzen, um in nahezu jedem Bereich des Unternehmens fundiertere Entscheidungen auf der Grundlage harter Fakten zu treffen, von Geschäftsprozessen bis hin zum Finanz- und Bestandsmanagement.

Herausforderungen mit einer Data-Warehouse-Architektur

Herausforderungen mit einer Data-Warehouse-Architektur

Bei der Implementierung von Data-Warehouse-Lösungen müssen sich Unternehmen möglicherweise bestimmten Herausforderungen stellen, um eine hohe Leistung zu erzielen. Dies kann Folgendes beinhalten:

  • Hohe Datenmengen
  • Datenqualität und -verwaltung
  • Komplexe Cloud-Infrastrukturen
  • Unterstützung für The AI Ladder
  • Mangelnde Speicherflexibilität

Hohe Datenmengen

Da Data Warehouses mit Terabyte- und Petabyte-Größe mittlerweile gang und gäbe sind, erfordern Hochleistungsvorgänge eine hervorragende Ladefähigkeit, effiziente Speicherung und leistungsstarke Datenbank-Engines, die den Anforderungen an höchste Effizienz gerecht werden.

Datenqualität und -verwaltung

Ein Data Warehouse kann dazu verwendet werden, enorme Mengen strukturierter und unstrukturierter Daten aus vielen Quellen zu verwalten. All diese Daten müssen bereinigt und validiert werden, bevor sie verwendet werden können. Stabile Richtlinien und Verfahren zur Data Governance können dazu beitragen, eine genaue Single-Source-of-Truth (SSOT) für alle Benutzer zu gewährleisten.

Komplexe Cloud-Infrastrukturen

Da Unternehmensdaten – sei es aufgrund von Vorschriften oder geschäftlichen Anforderungen – in unterschiedlichen Umgebungen gespeichert werden, benötigen Data Warehouses heute oft Hybrid- und Multi-Cloud-Speicher, wobei Datenfluss, -aufnahme und -analyse über verschiedene Systeme hinweg erfolgen. Unternehmen benötigen möglicherweise sehr erfahrene IT-Teammitglieder, die bei der Implementierung und Wartung dieser komplexen Systeme helfen.

 

Unterstützung für The AI Ladder

Da KI und maschinelles Lernen immer wichtigere Bestandteile der Geschäftsstrategie werden, benötigen Unternehmen Data Warehouses, die diese Workloads bewältigen können.

Im Idealfall sollte ein Data Warehouse in der Lage sein, Daten zu sammeln, zu bereinigen, zu organisieren und zu analysieren, damit sie KI-fähig sind, und den Datenfluss zu KI- und maschinellen Lernanwendungen zu erleichtern. Allerdings sind nicht alle Data Warehouses für KI ausgelegt, was die Nutzung von Unternehmensdaten für KI-Workloads erschweren kann.

Mangelnde Speicherflexibilität

Data Warehouses sind für die Datenanalyse konfiguriert und optimiert, was bedeutet, dass sie in der Regel nicht ideal für die Speicherung großer Datenmengen sind. Mit der wachsenden Datenmenge in einem Warehouse steigen auch die Kosten und die Komplexität der Speicherung. Es können auch Latenzprobleme auftreten.

Ein Data Lakehouse kann für einzelne Unternehmen je nach ihrer individuellen Datenarchitektur eine Option darstellen, da es sowohl günstigere und flexiblere Speicher- als auch Analysefunktionen bietet.

Weiterführende Lösungen

Weiterführende Lösungen

Data-Warehouse-Lösungen

Die Data-Warehouse-Lösungen von IBM bieten Leistung und Flexibilität, um strukturierte und unstrukturierte Daten für Analyse-Workloads (einschließlich maschinellem Lernen) zu unterstützen.

Data-Warehouse-Lösungen kennenlernen
IBM® Db2® Warehouse

Cloud Data Warehousing zur Unterstützung Ihrer betrieblichen Analysen, BI und KI-gesteuerten Erkenntnisse

Mehr zu Db2 Warehouse
IBM® watsonx.data

Mit dem offenen, hybriden Data Lakehouse für KI und Analytics lassen Sie Ihre Daten arbeiten, wo auch immer sie sich befinden.

watsonx.data erkunden
Ressourcen

Ressourcen

So wählen Sie das richtige Data Warehouse für KI aus

Erfahren Sie mehr über die Kriterien, die Unternehmen bei der Auswahl eines Data Warehouse für Unternehmen berücksichtigen sollten.

Was ist ein Data Lakehouse?

Data Lakehouses versuchen, die zentralen Herausforderungen sowohl in Data Warehouses als auch in Data Lakes zu lösen, um eine idealere Datenverwaltungslösung für Unternehmen zu schaffen.

Das Datendifferenzierungsmerkmal

Ein Leitfaden für führende Datenexperten zum Aufbau eines datengestützten Unternehmens und zur Förderung von geschäftlichen Vorteilen

Machen Sie den nächsten Schritt

Skalieren Sie KI-Workloads für alle Ihre Daten, überall, mit IBM watsonx.data, einem zweckmäßigen Datenspeicher, der auf einer offenen Lakehouse-Architektur basiert.

watsonx.data erkunden Buchen Sie eine Live-Demo