핵심 요약
같은 10억 row + 7TB 데이터로 ClickHouse 25, DuckDB 1.2 분석. CH가 대용량·동시 쿼리에 압도, DuckDB는 단일 분석가·로컬 워크플로에 압승. 사내 채택 기준.
1. 환경
- ClickHouse Cloud, 32 vCPU x 3 노드, $4,200/월
- DuckDB on EC2 m7g.2xlarge, $190/월
- 데이터: Parquet on S3, 10억 row, 7TB
2. 쿼리 실측
| 쿼리 | ClickHouse | DuckDB |
|---|---|---|
| group by + 1억 row | 2.4s | 8.1s |
| join 3개 table | 5.8s | 14s |
| window 함수 | 3.1s | 6.2s |
| 동시 100 query | 안정 | 직렬 — 부적합 |
3. 운영
ClickHouse — 클러스터 관리·tier·partition 정책. 운영 0.3 FTE. DuckDB — 파일 하나, 로컬에서 분석. 운영 0.
4. 채택 기준
- 다중 사용자·dashboard·BI — ClickHouse
- 분석가 1~3명, 로컬·notebook 워크플로 — DuckDB
- edge 분석(브라우저 wasm) — DuckDB
- 실시간 ingest + sub-second dashboard — ClickHouse
5. 함정
- DuckDB 메모리 — 메모리 부족 시 디스크 스필. m7g.2xl(32GB)로 10억 row 무리, 동시 쿼리 1개만
- ClickHouse 비용 — Cloud는 스토리지+컴퓨트 따로, idle 시 1/3로 자동 축소 옵션 명시
- 둘 다 SQL 방언 차이 — group by all, qualify 등 ClickHouse 확장이 DuckDB 미지원

댓글 0