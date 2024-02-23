Además de su especificación de formato de tabla abierta, Iceberg también incluye un conjunto de API y bibliotecas que permiten a los motores de almacenamiento, de consulta y de ejecución interactuar sin problemas con las tablas que siguen ese formato.

El formato de tabla Iceberg se ha convertido en una parte integral del ecosistema de big data, en gran parte debido a su capacidad de proporcionar funciones que normalmente no están disponibles con otros formatos de tabla. Al utilizar una serie de metadatos guardados en cada tabla, Iceberg permite la evolución del esquema y de las particiones y la reversión de las versiones de la tabla sin necesidad de costosas reescrituras o migraciones de tablas. Es completamente independiente del sistema de almacenamiento, con soporte para varias fuentes de datos y sin dependencias del sistema de archivos.

Originalmente creado por ingenieros de datos de Netflix y Apple en 2017 para abordar las deficiencias de Apache Hive, Iceberg se hizo de código abierto y se donó a la Apache Software Foundation al año siguiente. Se convirtió en un proyecto Apache de primer nivel en 2020.

La velocidad, la eficiencia, la fiabilidad y la facilidad de uso general de Apache Iceberg ayudan a simplificar y coordinar el proceso de datos a cualquier escala. Estos puntos fuertes lo han convertido en el formato de tabla preferido por varios de los principales almacenes de datos, data lakes y lakehouses de datos, incluyendo IBM watsonx.data, Netezza y Db2 Warehouse.