본문 바로가기
Data#Data#Pipeline조회 1

Data Pipeline란?

정의

소스에서 목적지까지 데이터가 흐르는 자동화 경로. ETL/ELT·스트리밍 모두 포함.

다른 표현데이터 파이프라인

Data Pipeline이란?

원시 데이터를 가치 있는 형태로 변환·전달하는 자동화된 워크플로다.

종류

  • Batch — Airflow, dbt (일·시간 단위)
  • Streaming — Kafka, Flink (실시간)
  • Micro-batch — Spark Structured Streaming

🔗 함께 보면 좋은 용어

Data 전체 →