Was ist OLAP?
OLAP ermöglicht eine schnelle, flexible multidimensionale Datenanalyse für Business Intelligence (BI) und entscheidungsunterstützende Anwendungen in Data-Warehousing-Implementierungen
Schwarzer und blauer Hintergrund
Was ist OLAP?

OLAP (für Online Analytical Processing) ist eine Software zur schnellen Durchführung multidimensionaler Analysen großer Datenmengen aus einem Data-Warehouse, Datamart oder einem anderen einheitlichen, zentralisierten Datenspeicher.

Die meisten Geschäftsdaten haben mehrere Dimensionen, d. h. mehrere Kategorien, in die die Daten zur Präsentation, Nachverfolgung oder Analyse unterteilt werden. Die Verkaufszahlen können beispielsweise mehrere Dimensionen haben, die sich auf den Ort (Region, Land, Staat/Provinz, Filiale), die Zeit (Jahr, Monat, Woche, Tag), das Produkt (Bekleidung, Herren/Damen/Kinder, Marke, Typ) und mehr beziehen.

In einem Data-Warehouse werden die Datensätze jedoch in Tabellen gespeichert, die jeweils nur zwei dieser Dimensionen abbilden können. OLAP extrahiert Daten aus mehreren relationalen Datasets und reorganisiert sie in einem multidimensionalen Format, das eine sehr schnelle Verarbeitung und sehr aufschlussreiche Analysen ermöglicht. 

Was ist ein OLAP-Würfel?

Der OLAP-Würfel, das Herzstück der meisten OLAP-Systeme, ist eine Array-basierte multidimensionale Datenbank, die es ermöglicht, mehrere Datendimensionen viel schneller und effizienter zu verarbeiten und zu analysieren als eine traditionelle relationale Datenbank.

Eine relationale Datenbanktabelle ist wie eine Tabellenkalkulation aufgebaut und speichert einzelne Datensätze in einem zweidimensionalen, zeilenweisen Format. Jeder „Datenfakt“ in der Datenbank befindet sich an der Schnittstelle zweier Dimensionen – einer Zeile und einer Spalte – wie z. B. Region und Gesamtumsatz.

SQL- und relationale Datenbank-Reporting-Tools können zwar multidimensionale Daten, die in Tabellen gespeichert sind, abfragen, Berichte erstellen und analysieren, aber die Leistung nimmt ab, wenn das Datenvolumen wächst. Und es bedeutet einen hohen Aufwand, die Ergebnisse neu zu organisieren, um sich auf verschiedene Dimensionen zu konzentrieren.

Hier kommt der OLAP-Würfel ins Spiel. Der OLAP-Würfel erweitert die Einzeltabelle um zusätzliche Ebenen, die jeweils weitere Dimensionen hinzufügen – in der Regel die nächste Ebene in der „Konzepthierarchie“ der Dimension. Die oberste Ebene des Würfels könnte zum Beispiel die Verkäufe nach Region ordnen; weitere Ebenen könnten Land, Bundesland/Provinz, Stadt und sogar eine bestimmte Filiale sein.

Theoretisch kann ein Würfel eine unendliche Anzahl von Ebenen enthalten. (Ein OLAP-Würfel, der mehr als drei Dimensionen darstellt, wird manchmal als Hypercube bezeichnet.) Und innerhalb der Ebenen können kleinere Würfel vorhanden sein, z. B. könnte jede Filialebene Würfel enthalten, die die Verkäufe nach Verkäufern und Produkten ordnen. In der Praxis erstellen Datenanalysten OLAP-Würfel, die nur die Ebenen enthalten, die sie für eine optimale Analyse und Leistung benötigen. 

Drilldown

Die Drilldown-Operation wandelt weniger detaillierte Daten in detailliertere Daten um, indem sie eine der beiden folgenden Methoden anwendet: In der Konzepthierarchie nach unten gehen oder dem Würfel eine neue Dimension hinzufügen. Wenn Sie beispielsweise Umsatzdaten für das Kalender- oder Geschäftsquartal eines Unternehmens anzeigen, können Sie die Umsätze für jeden Monat aufschlüsseln, indem Sie in der Konzepthierarchie der Dimension „Zeit“ nach unten gehen.

Rollup

Die Rollup-Funktion ist das Gegenteil der Drilldown-Funktion – sie fasst Daten in einem OLAP-Würfel zusammen, indem sie in der Konzepthierarchie nach oben geht oder die Anzahl der Dimensionen reduziert. Sie könnten zum Beispiel in der Konzepthierarchie der Dimension „Standort“ nach oben gehen, indem Sie die Daten der einzelnen Länder und nicht der einzelnen Städte betrachten.

Slice-and-dice

Die Slice-Operation erstellt einen Unterwürfel durch Auswahl einer einzelnen Dimension aus dem OLAP-Hauptwürfel. Sie können zum Beispiel einen Slice durchführen, indem Sie alle Daten für das erste Geschäfts- oder Kalenderquartal des Unternehmens markieren (Zeitdimension).

Die Dice-Operation isoliert einen Unterwürfel durch Auswahl mehrerer Dimensionen innerhalb des OLAP-Hauptwürfels. Sie können beispielsweise eine Dice-Operation durchführen, indem Sie alle Daten nach den Kalender- oder Geschäftsquartalen eines Unternehmens (Zeitdimension) und innerhalb der USA und Kanada (Ortsdimension) markieren.

Pivot

Mit der Pivot-Funktion wird die aktuelle Würfelansicht gedreht, sodass sich eine neue Darstellung der Daten ergibt, wodurch dynamische mehrdimensionale Ansichten der Daten möglich sind. Die OLAP-Pivot-Funktion ist vergleichbar mit der Pivot-Tabellenfunktion in Tabellenkalkulationsprogrammen wie Microsoft Excel, aber während Pivot-Tabellen in Excel eine Herausforderung darstellen können, sind OLAP-Pivots relativ einfach zu verwenden (es ist weniger Fachwissen erforderlich) und sie bieten eine schnellere Antwortzeit und Abfrageleistung.

MOLAP vs. ROLAP vs. HOLAP

Eine OLAP-Lösung, die direkt mit einem mehrdimensionalen OLAP-Würfel arbeitet, wird als multidimensionales OLAP oder MOLAP bezeichnet. Auch hier gilt, dass MOLAP für die meisten Anwendungen die schnellste und praktischste Art der multidimensionalen Datenanalyse ist.

Es gibt jedoch zwei andere OLAP-Typen, die in bestimmten Fällen vorzuziehen sein können:

ROLAP

ROLAP oder relationales OLAP bezeichnet eine multidimensionale Datenanalyse, die direkt mit Daten in relationalen Tabellen arbeitet, ohne die Daten zuvor in einem Würfel zu reorganisieren.

Wie bereits erwähnt, ist SQL ein hervorragendes Tool für multidimensionale Abfragen, Berichte und Analysen. Aber die erforderlichen SQL-Abfragen sind komplex, die Leistung kann sich verschlechtern und die resultierende Ansicht der Daten ist statisch – sie kann nicht gedreht werden, um die Daten anders darzustellen. ROLAP eignet sich am besten, wenn das direkte Arbeiten mit großen Datenmengen wichtiger ist als Leistung und Flexibilität.

HOLAP

HOLAP – oder hybrides OLAP – versucht, eine optimale Arbeitsteilung zwischen relationalen und multidimensionalen Datenbanken innerhalb einer einzigen OLAP-Architektur zu erreichen. Die relationalen Tabellen enthalten größere Datenmengen und OLAP-Würfel werden für Aggregationen und spekulative Verarbeitung verwendet. HOLAP erfordert einen OLAP-Server, der sowohl MOLAP als auch ROLAP unterstützt.

Ein HOLAP-Tool kann einen „Drill-through“ für den Datenwürfel zu den relationalen Tabellen durchführen, was eine schnelle Datenverarbeitung und einen flexiblen Zugriff ermöglicht. Dieses hybride System bietet zwar eine bessere Skalierbarkeit, kann jedoch nicht verhindern, dass sich der Zugriff auf relationale Datenquellen verlangsamt. Außerdem erfordert die komplexe Architektur in der Regel häufigere Aktualisierungen und Wartung, da sie alle Daten aus relationalen und multidimensionalen Datenbanken speichern und verarbeiten muss. Aus diesem Grund kann HOLAP am Ende teurer sein.

OLAP vs. OLTP

Online Transaction Processing – oder OLTP – bezieht sich auf Datenverarbeitungsmethoden und Software, die auf transaktionsorientierte Daten und Anwendungen ausgerichtet sind. 

Der Hauptunterschied zwischen OLAP und OLTP lässt sich aus dem Namen ableiten: OLAP ist analytisch, OLTP transaktional. 

OLAP-Tools sind für die multidimensionale Analyse von Daten in einem Data-Warehouse konzipiert, das sowohl transaktionale als auch historische Daten enthält. Tatsächlich ist ein OLAP-Server in der Regel die mittlere, analytische Ebene einer Data-Warehousing-Lösung. Zu den üblichen Verwendungszwecken von OLAP gehören Data-Mining und andere Business-Intelligence-Anwendungen, komplexe analytische Berechnungen und Vorhersageszenarien sowie Geschäftsberichtsfunktionen wie Finanzanalyse, Budgetierung und Prognoseplanung.

OLTP wurde entwickelt, um transaktionsorientierte Anwendungen zu unterstützen, indem aktuelle Transaktionen so schnell und genau wie möglich verarbeitet werden. Zu den üblichen Verwendungszwecken von OLTP gehören Geldautomaten, E-Commerce-Software, die Verarbeitung von Kreditkartenzahlungen, Online-Buchungen, Reservierungssysteme und Tools für die Schriftgutverwaltung.

Für eine eingehende Untersuchung der Unterschiede zwischen diesen Ansätzen sehen Sie sich „OLAP vs. OLTP: Was ist der Unterschied?“ an.

OLAP und Cloud-Architektur

OLAP ermöglicht es Unternehmen, das Potenzial ihrer Unternehmensdaten zu maximieren, indem sie diese in das am besten geeignete Format für multidimensionale Analysen umwandeln. Dies wiederum macht es einfacher, wertvolle Geschäftserkenntnisse zu gewinnen. Wenn diese Systeme jedoch innerhalb des Unternehmens verbleiben, sind die Möglichkeiten zur Skalierung begrenzt.

Cloudbasierte OLAP-Services sind kostengünstiger und einfacher einzurichten, was sie für kleine Unternehmen oder Start-ups mit begrenztem Budget attraktiver macht. Unternehmen können das enorme Potenzial von cloudbasierten Data-Warehouses nutzen, die anspruchsvolle Analysen mit unübertroffener Geschwindigkeit durchführen, da sie Massive Parallel Processing (MPP) verwenden. Daher können Unternehmen OLAP mit Cloud-Geschwindigkeit und -Skalierung nutzen und große Datenmengen analysieren, ohne sie aus ihrem Cloud-Data-Warehouse zu entnehmen.

Constance Hotels, Resorts & Golf ist eine Gruppe von Luxushotels mit neun Häusern auf Inseln im Indischen Ozean. Die fehlende Kommunikation zwischen den Inseln führte jedoch dazu, dass die einzelnen Standorte und ihre Daten isoliert waren. Das Unternehmen baute eine Cloud-Data-Warehouse- und -Analyse-Architektur auf, um alle lokalen Systeme und Tools mit einem zentralen cloudbasierten Datenrepository zu verbinden. Auf diese Weise gewann das Unternehmen den Überblick, den es brauchte, um fortschrittliche, vorausschauende Analysen zu nutzen und ein OLAP-System zu implementieren.

OLAP in der Cloud-Architektur ist eine schnelle und kostengünstige Lösung für die Zukunft. Sobald die Würfel erstellt sind, können die Teams vorhandene Business-Intelligence-Tools verwenden, um sofort eine Verbindung mit dem OLAP-Modell herzustellen und interaktive Einblicke in Echtzeit aus ihren Cloud-Daten zu gewinnen.

Relevante Lösungen
IBM Db2 Warehouse on Cloud

IBM Db2 Warehouse on Cloud ist ein verwalteter Public Cloud-Service. Sie können IBM Db2 Warehouse lokal mit Ihrer Hardware oder in einer Private Cloud installieren.

Mehr zu IBM Db2 Warehouse on Cloud
Cubing Services

IBM DB2 Warehouse integriert und vereinfacht die Data-Warehouse-Umgebung, indem es dynamisches Warehousing und direkte Unterstützung von OLAP für das Data-Warehouse bietet.

Mehr zu Cubing-Services
Machen Sie den nächsten Schritt

IBM Db2 Warehouse on Cloud ist ein verwalteter Public-Cloud-Service. Sie können IBM Db2 Warehouse lokal mit Ihrer Hardware oder in einer Private Cloud installieren. Als Data-Warehouse umfasst dieser Service Funktionen wie die In-Memory-Datenverarbeitung und Spaltentabellen für OLAP (Online Analytical Processing). Da diese Funktionen eine gemeinsame Datenbankengine nutzen, können Sie Datenworkloads problemlos optimieren oder verschieben.

Erkunden Sie IBM Db2 Warehouse on Cloud noch heute