Data Warehouses, Data Lakes und Data Lakehouses erfüllen unterschiedliche Geschäfts- und Datenanforderungen. Viele Unternehmen nutzen zwei oder alle drei dieser Systeme in Kombination, um Datenpipelines zu optimieren und KI, ML und Analysen zu unterstützen.

Betrachten Sie als Analogie eine Großküche. Jeden Tag erhält diese Küche Lieferungen von Zutaten (Daten), die auf Lkws (Transaktionsdatenbanken, Geschäftsanwendungen usw.) geliefert werden.

Alle Zutaten, unabhängig von ihrer Art, landen auf der Laderampe (dem Data Lake). Die Zutaten werden verarbeitet und in Kühlschränke, Vorratskammern und andere Lagerbereiche (Data Warehouses) sortiert. Dort stehen die Zutaten den Köchen ohne weitere Verarbeitung zur Verfügung.

Dieser Prozess ist recht effizient, bringt jedoch einige der Herausforderungen traditioneller Data Lakes und Data Warehouses mit sich. Wie Zutaten auf einem Ladedock können Daten in einem Data Lake nicht ohne weitere Verarbeitung verwendet werden. Wie Zutaten in der Küche müssen Daten in einem Data Warehouse richtig aufbereitet und an den richtigen Ort geliefert werden, bevor sie verwendet werden können.

Ein Data Lakehouse ist ein bisschen so, als würde man Laderampe, Speisekammer und Kühlschrank an einem Ort vereinen. Natürlich ist diese Kombination im Bereich der Großküchen unrealistisch. In der Welt der Unternehmensdaten versetzt es Unternehmen jedoch in die Lage, den gleichen Wert aus Daten zu ziehen und gleichzeitig die Verarbeitungskosten, Redundanzen und Datensilos zu reduzieren.