본문 바로가기
Data#Data#Processing조회 1

Apache Spark란?

정의

분산 빅데이터 처리 엔진. Hadoop MapReduce 대체. Python·Scala·SQL 지원.

다른 표현스파크

Spark란?

UC Berkeley가 개발, 2014년 Apache 재단. 메모리 기반이라 Hadoop보다 10~100배 빠름.

구성

  • Spark SQL — DataFrame API
  • Spark Streaming — 실시간
  • MLlib — ML
  • GraphX — 그래프

🔗 함께 보면 좋은 용어

Data 전체 →