Was ist OLAP (Online Analytical Processing)?

Was ist OLAP?

OLAP oder Online Analytical Processing ist eine Technologie zur Durchführung komplexer Hochgeschwindigkeitsabfragen oder multidimensionaler Analysen auf großen Datenmengen in einem Data Warehouse, Data Lake oder einem anderen Datenspeicher. OLAP wird in den Bereichen Business Intelligence (BI), Entscheidungsunterstützung und einer Vielzahl von Anwendungen für geschäftliches Forecasting und Reporting eingesetzt.

Die meisten Geschäftsdaten zeichnen sich durch mehrere Dimensionen aus. Dabei handelt es sich um verschiedene Kategorien, in welche die Daten zur Präsentation, Nachverfolgung oder Analyse unterteilt werden. Zum Beispiel können Umsatzzahlen mehrere Dimensionen haben, die sich auf den Standort (Region, Land, Staat/Provinz, Geschäft), die Zeit (Jahr, Monat, Woche, Tag), das Produkt (Kleidung, Männer/Frauen/Kinder, Marke, Typ) und mehr beziehen.

In einem Data Warehouse oder Data Lake werden Datensätze jedoch in Tabellen gespeichert, von denen jede nur zwei dieser Dimensionen gleichzeitig organisieren kann. OLAP extrahiert Daten aus mehreren relationalen Datensätzen und reorganisiert sie in ein mehrdimensionales Format, das eine sehr schnelle Verarbeitung und eine sehr aufschlussreiche Analyse ermöglicht.

3D-Design aus Kugeln, die auf einer Schiene rollen

Die neuesten Erkenntnisse und Insights zu KI

Entdecken Sie von Experten kuratierte Erkenntnisse und Neuigkeiten zu KI, Cloud und mehr im wöchentlichen Newsletter Think. 

Was ist ein OLAP-Würfel?

Der OLAP-Würfel, das Herzstück der meisten OLAP-Systeme, ist eine auf Arrays basierende multidimensionale Datenbank, die es ermöglicht, mehrere Datendimensionen viel schneller und effizienter zu verarbeiten und zu analysieren als eine traditionelle relationale Datenbank.

Eine relationale Datenbanktabelle ist wie eine Tabellenkalkulation aufgebaut und speichert einzelne Datensätze in einem zweidimensionalen, zeilenweisen Format. Jedes Datenelement in der Datenbank befindet sich am Schnittpunkt von zwei Dimensionen (einer Zeile und einer Spalte) wie z. B. Region und Gesamtumsatz.

Die Reporting-Tools für SQL und relationale Datenbanken können zwar in Tabellen gespeicherte multidimensionale Daten abfragen, darüber berichten und sie analysieren, die Leistung nimmt jedoch mit zunehmendem Datenvolumen ab. Außerdem ist es sehr mühsam, die Ergebnisse neu zu organisieren, um sich auf verschiedene Dimensionen zu konzentrieren.

An dieser Stelle kommt der OLAP-Würfel ins Spiel. Der OLAP-Würfel erweitert die einzelne Tabelle um zusätzliche Ebenen, die jeweils zusätzliche Dimensionen hinzufügen – in der Regel die nächste Ebene in der „Konzepthierarchie“ der Dimension. Die oberste Ebene des Würfels könnte z. B. die Umsätze nach Region organisieren; weitere Ebenen könnten Land, Bundesland/Provinz, Stadt und sogar ein bestimmtes Geschäft sein.

Theoretisch kann ein Würfel eine unendliche Anzahl von Ebenen enthalten. (Ein OLAP-Würfel, der mehr als drei Dimensionen darstellt, wird manchmal auch als Hyperwürfel bezeichnet.) Innerhalb der Ebenen können auch kleinere Würfel vorhanden sein. So könnte beispielsweise jede Geschäftsebene Würfel enthalten, welche die Verkäufe nach Verkäufern und Produkten ordnen. In der Praxis werden Datenanalysten OLAP-Würfel erstellen, die nur die Ebenen enthalten, die sie für eine optimale Analyse und Leistung benötigen.

Drilldown

Der Drilldown-Vorgang wandelt weniger detaillierte Daten in detailliertere Daten um, indem eine von zwei Methoden angewandt wird – das Herabsteigen in der Konzepthierarchie oder das Hinzufügen einer neuen Dimension zum Würfel. Wenn Sie beispielsweise Umsatzdaten für das Kalender- oder Geschäftsquartal eines Unternehmens anzeigen, können Sie einen Drilldown durchführen, um die Umsätze für jeden Monat zu sehen. Hierzu gehen Sie in der Konzepthierarchie der Dimension „Zeit“ nach unten.

Roll-up

Roll-up ist das Gegenteil der Drilldown-Funktion. Sie aggregiert Daten in einem OLAP-Würfel, indem sie in der Konzepthierarchie nach oben geht oder die Anzahl der Dimensionen reduziert. Sie können zum Beispiel in der Konzepthierarchie der Dimension „Standort“ nach oben gehen, indem Sie die Daten jedes Landes und nicht jeder Stadt anzeigen.

Slice und Dice

Der Slice-Vorgang erstellt einen untergeordneten Würfel, indem eine einzelne Dimension aus dem zentralen OLAP-Würfel ausgewählt wird. Sie können zum Beispiel einen Slice-Vorgang durchführen, indem Sie alle Daten für das erste Geschäfts- oder Kalenderquartal des Unternehmens markieren (Zeitdimension).

Der Dice-Vorgang isoliert einen untergeordneten Würfel, indem er mehrere Dimensionen innerhalb des zentralen OLAP-Würfels auswählt. Sie könnten zum Beispiel einen Dice-Vorgang durchführen, indem Sie alle Daten nach den Kalender- oder Steuerquartalen eines Unternehmens (Zeitdimension) und innerhalb der USA und Kanada (Standortdimension) markieren.

Pivot

Die Pivot-Funktion dreht die aktuelle Würfel-Ansicht, um eine neue Darstellung der Daten anzuzeigen und ermöglicht so dynamische multidimensionale Ansichten der Daten. Die OLAP-Pivot-Funktion ist mit der Funktion für Pivot-Tabellen in Tabellenkalkulationsprogrammen wie Microsoft Excel vergleichbar. Während Pivot-Tabellen in Excel jedoch eine Herausforderung darstellen können, sind OLAP-Pivots relativ einfach zu bedienen (es ist weniger Fachwissen erforderlich) und haben eine schnellere Reaktionszeit und Abfrageleistung.

MOLAP vs. ROLAP vs. HOLAP

OLAP, das direkt mit einem multidimensionalen OLAP-Würfel funktioniert, wird als multidimensionales OLAP oder MOLAP bezeichnet. In den meisten Fällen ist MOLAP die schnellste und praktischste Art der multidimensionalen Datenanalyse.

Es gibt jedoch zwei andere Arten von OLAP, die in bestimmten Fällen bevorzugt werden können:

ROLAP

ROLAP, oder relationales OLAP, ist eine multidimensionale Datenanalyse, die direkt mit Daten in relationalen Tabellen funktioniert, ohne die Daten vorher in einem Würfel zu reorganisieren.

Wie bereits erwähnt, ist SQL ein hervorragendes Werkzeug für multidimensionale Abfragen, Berichte und Analysen. Aber die erforderlichen SQL-Abfragen sind komplex, die Leistung kann sich verschlechtern und die resultierende Ansicht der Daten ist statisch –sie kann nicht geschwenkt werden, um eine andere Ansicht der Daten darzustellen. ROLAP ist am besten geeignet, wenn die Fähigkeit zur direkten Arbeit mit großen Datenmengen wichtiger ist als Leistung und Flexibilität.

HOLAP

HOLAP, oder Hybrid-OLAP, versucht, die optimale Arbeitsteilung zwischen relationalen und multidimensionalen Datenbanken innerhalb einer einzigen OLAP-Architektur zu schaffen. Die relationalen Tabellen enthalten größere Datenmengen, und OLAP-Cubes werden für Aggregationen und spekulative Verarbeitung verwendet. HOLAP erfordert einen OLAP-Server, der sowohl MOLAP als auch ROLAP unterstützt.

Ein HOLAP-Tool kann den Datenwürfel bis zu den relationalen Tabellen „durchdringen“, was den Weg für eine schnelle Datenverarbeitung und einen flexiblen Zugriff ebnet. Dieses hybride System bietet zwar eine bessere Skalierbarkeit, kann aber die unvermeidliche Verlangsamung beim Zugriff auf relationale Datenquellen nicht vermeiden. Außerdem erfordert seine komplexe Architektur in der Regel häufigere Aktualisierungen und Wartung, da es alle Daten aus relationalen Datenbanken und multidimensionalen Datenbanken speichern und verarbeiten muss. Aus diesem Grund kann HOLAP am Ende teurer sein.

AI Academy

Ist Datenverwaltung das Geheimnis generativer KI?

Erfahren Sie, warum qualitativ hochwertige Daten für den erfolgreichen Einsatz generativer KI unerlässlich sind.

OLAP vs. OLTP

Online-Transaktionsverarbeitung oder OLTP bezeichnet Datenverarbeitungsmethoden und Software, die sich auf transaktionsorientierte Daten und Anwendungen konzentrieren. 

Der Hauptunterschied zwischen OLAP und OLTP liegt in der Bezeichnung: OLAP ist analytisch, OLTP transaktional. 

OLAP-Tools sind für die multidimensionale Analyse von Daten in einem Data Warehouse konzipiert, das sowohl transaktionale als auch historische Daten enthält. Tatsächlich ist ein OLAP-Server in der Regel die mittlere, analytische Ebene einer Data-Warehousing-Lösung. Zu den üblichen Verwendungszwecken von OLAP gehören Data Mining und andere Business-Intelligence-Anwendungen, komplexe analytische Berechnungen und Prognoseszenarien sowie Geschäftsberichtsfunktionen wie Finanzanalyse, Budgetierung und Forecasting-Planung.

OLTP wurde entwickelt, um transaktionsorientierte Anwendungen zu unterstützen, indem aktuelle Transaktionen so schnell und genau wie möglich verarbeitet werden. OLTP wird häufig für Geldautomaten, E-Commerce-Software, die Verarbeitung von Kreditkartenzahlungen, Online-Buchungen, Reservierungssysteme und Tools für die Datenspeicherung verwendet.

Einen tieferen Einblick in die Unterschiede zwischen diesen Ansätzen erhalten Sie in „OLAP vs. OLTP: Was ist der Unterschied?

OLAP und Cloud-Architektur

OLAP ermöglicht es Unternehmen, das Potenzial ihrer Unternehmensdaten zu maximieren, indem sie diese in das praktischste Format für multidimensionale Analysen umwandeln. Dies wiederum erleichtert die Gewinnung wertvoller Geschäftserkenntnisse. Wenn diese Systeme jedoch intern gehalten werden, sind die Möglichkeiten zur Skalierung begrenzt.

Cloud-basierte OLAP-Dienste sind kostengünstiger und einfacher einzurichten, was sie für kleine Unternehmen oder Startups mit kleinem Budget attraktiver macht. Unternehmen können das enorme Potenzial von Cloud-basierten Data Warehouses nutzen, die anspruchsvolle Analysen in unübertroffener Geschwindigkeit durchführen, da sie die massiv parallele Verarbeitung (MPP) nutzen. Daher können Unternehmen OLAP in Cloud-Geschwindigkeit und -Größe nutzen und riesige Datenmengen analysieren, ohne sie aus ihrem Cloud Data Warehouse herauszunehmen.

Constance Hotels, Resorts & Golf ist eine Luxushotelgruppe mit neun Anlagen auf Inseln im Indischen Ozean. Die fehlende Kommunikation von Insel zu Insel führte jedoch zu organisatorischen Silos, bei denen die Geschäftsdaten in jedem Resort isoliert waren. Das Unternehmen baute eine cloudbasierte Data-Warehouse- und Analyse-Architektur auf, um alle lokalen Systeme und Tools mit einem zentralen cloudbasierten Datenspeicher zu verbinden. Auf diese Weise erhielt das Unternehmen den nötigen gruppenweiten Einblick, um fortschrittliche, vorausschauende Analysen zu nutzen und ein OLAP-System zu implementieren.

OLAP in der Cloud-Architektur ist eine schnelle und kostengünstige Lösung, die für die Zukunft gebaut ist. Sobald die Würfel erstellt sind, können Teams vorhandene Business-Intelligence-Tools nutzen, um sich sofort mit dem OLAP-Modell zu verbinden und interaktive Echtzeit-Erkenntnisse aus ihren Cloud-Daten zu gewinnen.

Weiterführende Lösungen
Software und Lösungen für die Datenverwaltung

Entwerfen Sie eine Datenstrategie, die Datensilos beseitigt, die Komplexität reduziert und die Datenqualität verbessert, um außergewöhnliche Kunden- und Mitarbeitererfahrungen zu schaffen.

Lösungen für Datenmanagement erkunden
IBM watsonx.data

Watsonx.data ermöglicht es Ihnen, Analysen und KI mit all Ihren Daten zu skalieren, unabhängig davon, wo sie sich befinden, und zwar über einen offenen, hybriden und kontrollierten Datenspeicher.

IBM watsonx.data entdecken
Beratungsservices für Daten und Analysen

Erschließen Sie den Wert von Unternehmensdaten mit IBM Consulting und bauen Sie ein erkenntnisgesteuertes Unternehmen auf, das Ihnen geschäftliche Vorteile verschafft.

Analyse-Services entdecken
Machen Sie den nächsten Schritt

Entwerfen Sie eine Datenstrategie, die Datensilos beseitigt, die Komplexität reduziert und die Datenqualität verbessert, um außergewöhnliche Kunden- und Mitarbeitererfahrungen zu schaffen.

Lösungen für Datenmanagement erkunden IBM watsonx.data entdecken