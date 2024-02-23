Iceberg는 오픈 테이블 형식 사양 외에도 스토리지 엔진, 쿼리 엔진 및 실행 엔진이 해당 형식을 따르는 테이블과 원활하게 상호 작용할 수 있도록 하는 일련의 API 및 라이브러리로 구성되어 있습니다.

Iceberg 테이블 형식은 보통 다른 테이블 형식에서는 사용할 수 없는 기능을 제공할 수 있기 때문에 빅 데이터 에코시스템의 필수적인 부분이 되었습니다. 각 테이블에 보관된 수많은 메타데이터를 사용하는 Iceberg는 고비용의 테이블 재작성 또는 테이블 마이그레이션 없이도 스키마 진화, 파티션 진화 및 테이블 버전 롤백을 허용합니다. 그리고 스토리지 시스템에 전혀 구애받지 않으며, 여러 데이터 소스를 지원하며, 파일 시스템 종속성이 없습니다.

2017년에 Netflix와 Apple의 데이터 엔지니어들이 원래 Apache Hive의 단점을 보완하기 위해 만든 Iceberg는 이듬해에 오픈 소스로 공개되어 Apache 소프트웨어 재단에 기부되었습니다. 그리고 2020년에 최상위 Apache 프로젝트가 되었습니다.

Apache Iceberg의 속도, 효율성, 안정성 및 전반적인 사용자 친화성은 모든 규모에서 데이터 처리를 간소화하고 조정하는 데 도움이 됩니다. 이러한 장점으로 인해 IBM watsonx.data, Netezza 및 Db2 Warehouse를 비롯한 여러 선도적인 데이터 웨어하우스, 데이터 레이크 및 데이터 레이크하우스에서 선호하는 테이블 형식이 되었습니다.