1. 程式人生 > >spark-寬依賴和窄依賴

spark-寬依賴和窄依賴

交互 本質 pen alt png spark img 出現 技術分享

一、窄依賴(Narrow Dependency,)

一個RDD,對它的父RDD,只有簡單的一對一的依賴關系。也就是說, RDD的每個partition ,僅僅依賴於父RDD中的一個partition,父 RDD和子RDD的partition之間的對應關系,是一對一的!這種情況下,是簡單的RDD之間的依賴關系,也被稱之為窄依賴。

二、寬依賴(Shuffle Dependency)

本質就是Shuffle,也就是說,每一個父RDD的partition中的數據,都可能會傳輸一部分到下一個RDD的每個partition中。此時就會出現,父RDD和子RDD的partition之間,具有交互綜復雜的關系。那麽,這種情況,就叫做兩個RDD之間是寬依賴。同時,他們之間發生的,操作,是Shuffle,

技術分享圖片

spark-寬依賴和窄依賴