Data Lakehouse란?
Data Lake 저장소 위에 트랜잭션·스키마·BI 성능을 더한 현대 아키텍처다. Databricks가 제안·대중화.
핵심 테이블 포맷
- Delta Lake — Databricks
- Apache Iceberg — Netflix 출신, 업계 표준화 경쟁 우위
- Apache Hudi — Uber
이들이 ACID, 타임 트래블, 스키마 진화를 Lake에 가져온다.
Lake의 저장 + Warehouse의 성능을 결합한 아키텍처. Delta Lake, Iceberg, Hudi가 주도.
Data Lake 저장소 위에 트랜잭션·스키마·BI 성능을 더한 현대 아키텍처다. Databricks가 제안·대중화.
이들이 ACID, 타임 트래블, 스키마 진화를 Lake에 가져온다.