Lakehouse-Muster 3: Optimierung von Data Warehouse-Workloads zur Kostenoptimierung

Reduzieren Sie die Kosten für die Datenspeicherung und behalten Sie gleichzeitig die zeitlichen Abfragemöglichkeiten bei, indem Sie die günstigen Speicher- und Rechenkapazitäten von Lakehouse nutzen und mehreren Abfrage-Engines die Verwendung desselben Datensatzes ermöglichen. Abfrage-Engines wie Spark ermöglichen die Durchführung von vakuumierten/materialisierten Abfragen von Daten in ihrem aktuellen Zustand (z. B. nicht alle Datenänderungen in der Vergangenheit), was die Größe der Datenabfrage und die Kosten für die Abfrageberechnung reduziert. Darüber hinaus ermöglichen die Vorverarbeitungs- und selektiven Transformationsfunktionen im Lakehouse eine optimale Verteilung der Data-Warehouse-Workloads und senken so die Kosten.