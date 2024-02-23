Zusätzlich zu seiner offenen Tabellenformatspezifikation umfasst Iceberg auch eine Reihe von APIs und Bibliotheken, die es Speicher-Engines, Abfrage-Engines und Ausführungs-Engines ermöglichen, reibungslos mit Tabellen zu interagieren, die diesem Format folgen.

Das Iceberg-Tabellenformat ist zu einem festen Bestandteil des Big Data-Ökosystems geworden, vor allem aufgrund seiner Fähigkeit zur Bereitstellung von Funktionen, die bei anderen Tabellenformaten normalerweise nicht verfügbar sind. Durch die Verwendung einer Vielzahl von Metadaten, die zu jeder Tabelle gespeichert werden, ermöglicht Iceberg die Entwicklung von Schemata, Partitionen und Tabellenversionen, ohne dass kostspielige Tabellenumschreibungen oder Tabellenmigrationen erforderlich sind. Es ist vollständig unabhängig vom Speichersystem, unterstützt mehrere Datenquellen und ist nicht vom Dateisystem abhängig.

Ursprünglich 2017 von Data Engineers bei Netflix und Apple entwickelt, um die Mängel von Apache Hive zu beheben, wurde Iceberg als Open Source veröffentlicht und im darauffolgenden Jahr an die Apache Software Foundation gespendet. Im Jahr 2020 wurde es zu einem Apache-Projekt auf oberster Ebene.

Die Geschwindigkeit, Effizienz, Zuverlässigkeit und allgemeine Benutzerfreundlichkeit von Apache Iceberg tragen dazu bei, die Datenverarbeitung in jeder Größenordnung zu vereinfachen und zu koordinieren. Diese Vorteile haben es zum Tabellenformat der Wahl für eine Reihe führender Data Warehouses, Data Lakes und Data Lakehouses gemacht, darunter IBM® watsonx.data. Netezza und Db2 Warehouse.