1. 程式人生 > >Spark SQL 筆記(2)——Spark 生態圈和 Hadoop 生態圈對比

Spark SQL 筆記(2)——Spark 生態圈和 Hadoop 生態圈對比

1 Spark 產生的背景

1.1 MapReduce 的侷限性

  • 程式碼繁瑣
  • 只能夠支援map 和 reduce 方法;
  • 執行效率低;
  • 不適合多次迭代、互動式、流式的處理;

1.2 框架多樣化

  • 批處理(離線):MapReduce,Hive,Pig
  • 流式處理(實時):Storm,JStorm,
  • 互動式計算:Impala

1.3 Hadoop 生態系統

在這裡插入圖片描述

1.4 Spark 生態系統(BDAS)

BDAS : Berkeley Data Analytics Stack
在這裡插入圖片描述
在這裡插入圖片描述
在這裡插入圖片描述