1. 程式人生 > >spark比hadoop快的原因

spark比hadoop快的原因

(1)spark大量使用記憶體

(2)核心資料結構:RDD(彈性分散式資料集),在此基礎上提供了許多計算函式,

(3)在原先hadoop下一個map或reduce實現的功能,在spark下可以拆分成多個job.如果把hadoop看做罐子裡的大石頭,那麼spark的job就是罐子裡的碎石子,可以裝的更多。

()