Spark란?
UC Berkeley가 개발, 2014년 Apache 재단. 메모리 기반이라 Hadoop보다 10~100배 빠름.
구성
- Spark SQL — DataFrame API
- Spark Streaming — 실시간
- MLlib — ML
- GraphX — 그래프
분산 빅데이터 처리 엔진. Hadoop MapReduce 대체. Python·Scala·SQL 지원.
UC Berkeley가 개발, 2014년 Apache 재단. 메모리 기반이라 Hadoop보다 10~100배 빠름.