Versteckte Partitionierung
Iceberg kümmert sich unter der Oberfläche um alle Details der Partitionierung und Abfrage. Die versteckte Partitionierung von Iceberg erspart Nutzern die Arbeit, beim Abfragen von Tabellen Informationen zum Partitionslayout bereitzustellen. Nutzer müssen Partitionsspalten nicht selbst verwalten und das Layout der physischen Tabelle nicht einmal verstehen, um genaue Abfrageergebnisse zu erhalten.
Dies macht die Iceberg-Partitionierung nicht nur sehr benutzerfreundlich, sondern ermöglicht auch die Änderung von Partitionslayouts im Laufe der Zeit, ohne dass vorab geschriebene Abfragen beschädigt werden. Wenn sich Partitionsspezifikationen weiterentwickeln, bleiben die Daten in der Tabelle (und ihre Metadaten) davon unberührt. Nur neue Daten, die nach der Weiterentwicklung in die Tabelle geschrieben wurden, werden mit der neuen Spezifikation partitioniert, und Metadaten für diese neuen Daten werden separat aufbewahrt.
Schemaentwicklung
Iceberg bietet native Unterstützung für die Schemaweiterentwicklung. Dadurch können Benutzer Tabellenschemata ändern, ohne dass eine komplexe Datenmigration erforderlich ist, wodurch die Anpassung an sich weiter entwickelnde Datenstrukturen erheblich vereinfacht wird.
Zeitreisen
Iceberg ermöglicht Benutzern eine Zeitreise durch Momentaufnahmen von Iceberg-Daten zu verschiedenen Zeitpunkten. Dies ist für eine Vielzahl von Anwendungsfällen wertvoll, einschließlich Audits, Debugging und Compliance-Prüfungen.
Datenverdichtung und -filterung
Iceberg bietet eine Reihe von Indizierungsfunktionen, die zur Optimierung der Abfrageleistung beitragen, wie z. B. Verdichtungsoptionen zum Zusammenführen kleinerer Dateien in größere, um den Metadaten-Overhead zu reduzieren und Bloom-Filter, um unnötiges Lesen von Daten während der Abfrageausführung zu vermeiden.