Was ist OLAP (Online Analytical Processing)?
OLAP-Lösung von IBM erkunden Abonnieren Sie KI-Updates
Schwarz-blauer Hintergrund
Was ist OLAP?

OLAP oder Online Analytical Processing ist eine Technologie zur Durchführung komplexer Hochgeschwindigkeitsabfragen oder multidimensionaler Analysen auf großen Datenmengen in einem Data Warehouse, Data Lake oder einem anderen Datenspeicher. OLAP wird in den Bereichen Business Intelligence (BI), Entscheidungsunterstützung und einer Vielzahl von Anwendungen für geschäftliches Forecasting und Reporting eingesetzt. 

Die meisten Geschäftsdaten zeichnen sich durch mehrere Dimensionen aus. Dabei handelt es sich um verschiedene Kategorien, in welche die Daten zur Präsentation, Nachverfolgung oder Analyse unterteilt werden. Zum Beispiel können Umsatzzahlen mehrere Dimensionen haben, die sich auf den Standort (Region, Land, Staat/Provinz, Geschäft), die Zeit (Jahr, Monat, Woche, Tag), das Produkt (Kleidung, Männer/Frauen/Kinder, Marke, Typ) und mehr beziehen.

In einem Data Warehouse oder Data Lake werden Datensätze jedoch in Tabellen gespeichert, von denen jede nur zwei dieser Dimensionen gleichzeitig organisieren kann. OLAP extrahiert Daten aus mehreren relationalen Datensätzen und reorganisiert sie in einem multidimensionalen Format, das eine sehr schnelle Verarbeitung und sehr aufschlussreiche Analysen ermöglicht. 

Presto kennenlernen und bedienen

Lesen Sie das kostenlose O'Reilly-E-Book, um zu erfahren, wie Sie mit Presto, der Open-Source-SQL-Engine für Datenanalysen, loslegen können.

Ähnliche Inhalte

Registrieren und IDC-Bericht lesen

Was ist ein OLAP-Würfel?

Der OLAP-Würfel, das Herzstück der meisten OLAP-Systeme, ist eine auf Arrays basierende multidimensionale Datenbank, die es ermöglicht, mehrere Datendimensionen viel schneller und effizienter zu verarbeiten und zu analysieren als eine traditionelle relationale Datenbank.

Eine relationale Datenbanktabelle ist wie eine Tabellenkalkulation aufgebaut und speichert einzelne Datensätze in einem zweidimensionalen, zeilenweisen Format. Jedes Datenelement in der Datenbank befindet sich am Schnittpunkt von zwei Dimensionen (einer Zeile und einer Spalte) wie z. B. Region und Gesamtumsatz.

Die Reporting-Tools für SQL und relationale Datenbanken können zwar in Tabellen gespeicherte multidimensionale Daten abfragen, darüber berichten und sie analysieren, die Leistung nimmt jedoch mit zunehmendem Datenvolumen ab. Außerdem ist es sehr mühsam, die Ergebnisse neu zu organisieren, um sich auf verschiedene Dimensionen zu konzentrieren.

An dieser Stelle kommt der OLAP-Würfel ins Spiel. Der OLAP-Würfel erweitert die einzelne Tabelle um zusätzliche Ebenen, die jeweils zusätzliche Dimensionen hinzufügen – in der Regel die nächste Ebene in der „Konzepthierarchie“ der Dimension. Die oberste Ebene des Würfels könnte z. B. die Umsätze nach Region organisieren; weitere Ebenen könnten Land, Bundesland/Provinz, Stadt und sogar ein bestimmtes Geschäft sein.

Theoretisch kann ein Cube eine unendliche Anzahl von Ebenen enthalten. (Ein OLAP-Würfel, der mehr als drei Dimensionen darstellt, wird manchmal als Hyperwürfel bezeichnet.) Innerhalb der Ebenen können auch kleinere Würfel vorhanden sein. So könnte beispielsweise jede Geschäftsebene Würfel enthalten, welche die Verkäufe nach Verkäufern und Produkten ordnen. In der Praxis werden Datenanalysten OLAP-Würfel erstellen, die nur die Ebenen enthalten, die sie für eine optimale Analyse und Leistung benötigen. 

Drilldown

Der Drilldown-Vorgang wandelt weniger detaillierte Daten in detailliertere Daten um, indem eine von zwei Methoden angewandt wird – das Herabsteigen in der Konzepthierarchie oder das Hinzufügen einer neuen Dimension zum Würfel. Wenn Sie beispielsweise Umsatzdaten für das Kalender- oder Geschäftsquartal eines Unternehmens anzeigen, können Sie einen Drilldown durchführen, um die Umsätze für jeden Monat zu sehen. Hierzu gehen Sie in der Konzepthierarchie der Dimension „Zeit“ nach unten.

Roll-up

Roll-up ist das Gegenteil der Drilldown-Funktion. Sie aggregiert Daten in einem OLAP-Würfel, indem sie in der Konzepthierarchie nach oben geht oder die Anzahl der Dimensionen reduziert. Sie können zum Beispiel in der Konzepthierarchie der Dimension „Standort“ nach oben gehen, indem Sie die Daten jedes Landes und nicht jeder Stadt anzeigen.

Slice und Dice

Der Slice-Vorgang erstellt einen untergeordneten Würfel, indem eine einzelne Dimension aus dem zentralen OLAP-Würfel ausgewählt wird. Sie können zum Beispiel einen Slice-Vorgang durchführen, indem Sie alle Daten für das erste Geschäfts- oder Kalenderquartal des Unternehmens markieren (Zeitdimension).

Der Dice-Vorgang isoliert einen untergeordneten Würfel, indem er mehrere Dimensionen innerhalb des zentralen OLAP-Würfels auswählt. Sie könnten zum Beispiel einen Dice-Vorgang durchführen, indem Sie alle Daten nach den Kalender- oder Steuerquartalen eines Unternehmens (Zeitdimension) und innerhalb der USA und Kanada (Standortdimension) markieren.

Pivot

Die Pivot-Funktion dreht die aktuelle Würfel-Ansicht, um eine neue Darstellung der Daten anzuzeigen und ermöglicht so dynamische multidimensionale Ansichten der Daten. Die OLAP-Pivot-Funktion ist mit der Funktion für Pivot-Tabellen in Tabellenkalkulationsprogrammen wie Microsoft Excel vergleichbar. Während Pivot-Tabellen in Excel jedoch eine Herausforderung darstellen können, sind OLAP-Pivots relativ einfach zu bedienen (es ist weniger Fachwissen erforderlich) und haben eine schnellere Reaktionszeit und Abfrageleistung.

MOLAP vs. ROLAP vs. HOLAP

OLAP, das direkt mit einem multidimensionalen OLAP-Würfel funktioniert, wird als multidimensionales OLAP oder MOLAP bezeichnet. In den meisten Fällen ist MOLAP die schnellste und praktischste Art der multidimensionalen Datenanalyse.

Es gibt jedoch zwei andere Arten von OLAP, die in bestimmten Fällen bevorzugt werden können:

ROLAP

ROLAP, oder relationales OLAP, ist eine multidimensionale Datenanalyse, die direkt mit Daten in relationalen Tabellen funktioniert, ohne die Daten vorher in einem Würfel zu reorganisieren.

Wie bereits erwähnt, ist SQL ein hervorragendes Werkzeug für multidimensionale Abfragen, Berichte und Analysen. Aber die erforderlichen SQL-Abfragen sind komplex, die Leistung kann sich verschlechtern und die resultierende Ansicht der Daten ist statisch –sie kann nicht geschwenkt werden, um eine andere Ansicht der Daten darzustellen. ROLAP ist am besten geeignet, wenn die Fähigkeit zur direkten Arbeit mit großen Datenmengen wichtiger ist als Leistung und Flexibilität.

HOLAP

HOLAP, oder hybrides OLAP, versucht, die optimale Arbeitsteilung zwischen relationalen und multidimensionalen Datenbanken innerhalb einer einzigen OLAP-Architektur zu erreichen. Die relationalen Tabellen enthalten größere Datenmengen, während OLAP-Würfel für Aggregationen und spekulative Verarbeitung verwendet werden. HOLAP erfordert einen OLAP-Server, der sowohl MOLAP als auch ROLAP unterstützt.

Ein HOLAP-Tool kann den Datenwürfel bis zu den relationalen Tabellen „durchdringen“, was den Weg für eine schnelle Datenverarbeitung und einen flexiblen Zugriff ebnet. Dieses hybride System bietet zwar eine bessere Skalierbarkeit, kann aber die unvermeidliche Verlangsamung beim Zugriff auf relationale Datenquellen nicht vermeiden. Außerdem erfordert seine komplexe Architektur in der Regel häufigere Aktualisierungen und Wartung, da es alle Daten aus relationalen Datenbanken und multidimensionalen Datenbanken speichern und verarbeiten muss. Aus diesem Grund kann HOLAP am Ende teurer sein.

OLAP vs. OLTP

Online-Transaktionsverarbeitung oder OLTP (Online Transaction Processing im Englischen) bezeichnet Datenverarbeitungsmethoden und Software, die sich auf transaktionsorientierte Daten und Anwendungen konzentrieren. 

Der Hauptunterschied zwischen OLAP und OLTP liegt in der Bezeichnung: OLAP ist analytisch, OLTP transaktional. 

OLAP-Tools sind für die multidimensionale Analyse von Daten in einem Data Warehouse konzipiert, das sowohl transaktionale als auch historische Daten enthält. Tatsächlich ist ein OLAP-Server in der Regel die mittlere, analytische Ebene einer Data-Warehousing-Lösung. Zu den üblichen Verwendungszwecken von OLAP gehören Data Mining und andere Business-Intelligence-Anwendungen, komplexe analytische Berechnungen und Prognoseszenarien sowie Geschäftsberichtsfunktionen wie Finanzanalyse, Budgetierung und Forecasting-Planung.

OLTP wurde entwickelt, um transaktionsorientierte Anwendungen zu unterstützen, indem aktuelle Transaktionen so schnell und genau wie möglich verarbeitet werden. OLTP wird häufig für Geldautomaten, E-Commerce-Software, die Verarbeitung von Kreditkartenzahlungen, Online-Buchungen, Reservierungssysteme und Tools für die Datenspeicherung verwendet.

Einen tieferen Einblick in die Unterschiede zwischen diesen Ansätzen erhalten Sie in „OLAP vs. OLTP: Was ist der Unterschied?

OLAP und Cloud-Architektur

OLAP ermöglicht es Unternehmen, das Potenzial ihrer Unternehmensdaten zu maximieren, indem sie diese in das praktischste Format für multidimensionale Analysen umwandeln. Dies wiederum erleichtert die Gewinnung wertvoller Geschäftserkenntnisse. Wenn diese Systeme jedoch intern gehalten werden, sind die Möglichkeiten zur Skalierung begrenzt.

Cloud-basierte OLAP-Dienste sind kostengünstiger und einfacher einzurichten, was sie für kleine Unternehmen oder Startups mit kleinem Budget attraktiver macht. Unternehmen können das enorme Potenzial von Cloud-basierten Data Warehouses nutzen, die anspruchsvolle Analysen in unübertroffener Geschwindigkeit durchführen, da sie die massiv parallele Verarbeitung (MPP) nutzen. Daher können Unternehmen OLAP in Cloud-Geschwindigkeit und -Größe nutzen und riesige Datenmengen analysieren, ohne sie aus ihrem Cloud Data Warehouse herauszunehmen.

Constance Hotels, Resorts & Golf ist eine Luxushotelgruppe mit neun Anlagen auf Inseln im Indischen Ozean. Die fehlende Kommunikation von Insel zu Insel führte jedoch zu organisatorischen Silos, bei denen die Geschäftsdaten in jedem Resort isoliert waren. Das Unternehmen baute eine cloudbasierte Data-Warehouse- und Analyse-Architektur auf, um alle lokalen Systeme und Tools mit einem zentralen cloudbasierten Datenspeicher zu verbinden. Auf diese Weise erhielt das Unternehmen den nötigen gruppenweiten Einblick, um fortschrittliche, vorausschauende Analysen zu nutzen und ein OLAP-System zu implementieren.

OLAP in der Cloud-Architektur ist eine schnelle und kostengünstige Lösung, die für die Zukunft gebaut ist. Sobald die Würfel erstellt sind, können Teams vorhandene Business-Intelligence-Tools nutzen, um sich sofort mit dem OLAP-Modell zu verbinden und interaktive Echtzeit-Erkenntnisse aus ihren Cloud-Daten zu gewinnen.

Weiterführende Lösungen
IBM Db2 Warehouse on Cloud

IBM Db2 Warehouse on Cloud ist ein verwalteter Public-Cloud Service. Sie können IBM Db2 Warehouse lokal mit Ihrer eigenen Hardware oder in einer Private Cloud einrichten.

IBM Db2 Warehouse on Cloud erkunden
Cubing Services

IBM DB2 Warehouse integriert und vereinfacht die Data-Warehouse-Umgebung, indem es dynamisches Warehousing und direkte Unterstützung für OLAP gegenüber dem Data Warehouse bietet.

Cubing-Services erkunden
Ressourcen So wählen Sie das richtige Data Warehouse für KI aus

Beschleunigen Sie Innovationen und erzielen Sie Geschäftsergebnisse, indem Sie Daten in Erkenntnisse verwandeln.

OLAP vs. OLTP: Was ist der Unterschied?

Diese Begriffe werden oft miteinander verwechselt. Was sind also die wichtigsten Unterschiede und wie wählen Sie den richtigen Begriff für Ihre Situation?

Machen Sie den nächsten Schritt

Skalieren Sie KI-Workloads für alle Ihre Daten, überall, mit IBM watsonx.data, einem zweckmäßigen Datenspeicher, der auf einer offenen Lakehouse-Architektur basiert.

watsonx.data erkunden Buchen Sie eine Live-Demo