Spark排程機制：4)階段劃分

阿新 • • 發佈：2019-01-28

階段劃分是作業排程過程的關鍵所在，首先探討下Spark是如何進行階段劃分的。

一個階段劃分的例子如下圖所示，用虛線表示一個階段，虛線框內所有的RDD都是為了實現該階段而需要被計算的資料。整個作業最後一個RDD的所有分割槽資料被計算完畢對於的階段就是所求的末階段。

沿著RDD的依賴關係往前進行深度優先遍歷，若遇到一個Shuffle依賴，依賴的每一個父RDD所有分割槽資料都計算完畢可以分別對應一個階段，且都是當前階段的父階段，繼續沿著父RDD往前遍歷，若遇到一個窄依賴，則直接往前遍歷，直到當前所有的依賴關係都被遍歷才返回上一層，通過這個過程，最後會得到一張DAG。DAG的最終階段稱之為結果階段(Result Stage)，其餘的階段稱為ShuffleMap階段。(簡單區分窄依賴和Shuffle依賴，看父RDD是否存在一個分割槽有大於1條線出去，若有則為Shuffle依賴)

以上圖為例，Stage3是結果階段，沿著RDD的依賴關係，從G向前遍歷。(明確一點Spark階段劃分是包含式的)

首先看A->B->G這條路徑，B->G是窄依賴，繼續向前到A->B是Shuffle依賴，B的父RDD-A所有分割槽資料被計算完成可以視為一個階段，所以RDD_A可以視為一個階段Stage1。

再看C->D->F->G這條路徑，F->G是shuffle依賴，G的父RDD-F所有分割槽資料被計算完成可以視為一個階段，也就是下面的整體。由於其他的路徑都是窄依賴，因此只有一個階段Stage2。

如上圖所示，將Shuffle依賴作為兩個階段的分割點，並記錄二者之間的階段依賴關係，這部分的功能在newResultStage

方法中實現

  private def newResultStage(
      rdd: RDD[_],
      func: (TaskContext, Iterator[_]) => _,
      partitions: Array[Int],
      jobId: Int,
      callSite: CallSite): ResultStage = {
    val (parentStages: List[Stage], id: Int) = getParentStagesAndId(rdd, jobId)
    val stage = new ResultStage(id, rdd, func, partitions, parentStages, jobId, callSite)
    stageIdToStage(id) = stage
    updateJobIdStageIdMaps(jobId, stage)
    stage
  }

可以看到，newResultStage函式內部先呼叫getParentStagesAndId獲得父輩階段集合parentStages和階段唯一標識ID，parentStages中的每一個階段又儲存了與其父輩階段的關係

  private def getParentStagesAndId(rdd: RDD[_], firstJobId: Int): (List[Stage], Int) = {
    val parentStages = getParentStages(rdd, firstJobId)
    val id = nextStageId.getAndIncrement()
    (parentStages, id)
  }

getParentStages是一個比較複雜的堆疊遞迴過程，對於每一個階段的父階段，都會將其封裝成一個Stage物件，並新增到parentStages中。換句話說，parentStages得到的實際上就是除了當前階段在內的DAG圖。

   //遞迴構建DAG圖，結果儲存在parents中
  private def getParentStages(rdd: RDD[_], firstJobId: Int): List[Stage] = {
    val parents = new HashSet[Stage]
    val visited = new HashSet[RDD[_]]
    // We are manually maintaining a stack here to prevent StackOverflowError
    // caused by recursively visiting
    val waitingForVisit = new Stack[RDD[_]]
    def visit(r: RDD[_]) {
      if (!visited(r)) {
        visited += r
        // Kind of ugly: need to register RDDs with the cache here since
        // we can't do it in its constructor because # of partitions is unknown
        for (dep <- r.dependencies) {
          dep match {
            case shufDep: ShuffleDependency[_, _, _] =>
              parents += getShuffleMapStage(shufDep, firstJobId)
            case _ =>
              waitingForVisit.push(dep.rdd)
          }
        }
      }
    }
    waitingForVisit.push(rdd)
    while (waitingForVisit.nonEmpty) {
      visit(waitingForVisit.pop())
    }
    parents.toList
  }

至此，DAG排程已經完成了階段劃分的工作，並把任務集交付給任務排程器，具體可參看下一章節：Spark排程機制：5)任務排程

Spark排程機制：4)階段劃分

Spark排程機制：4)階段劃分

Spark通訊機制：1)Spark1.3 vs Spark1.6原始碼分析

第二階段：2.商業需求分析及BRD：4.產品需求分析總結

第二階段：2.商業需求文檔MRD：4.MRD-核心目標-產品構成

第二階段：4.商業需求文檔MRD：1.PRD-產品功能列表

第二階段：4.產品功能需求文檔PRD：7.案例總結

分散式事務：兩階段提交、一階段提交、事務補償機制

Spark2.3.2原始碼解析：9.排程系統 DAGScheduler 之 Stage 劃分原始碼詳解

Spark學習筆記4——spark執行機制

Master原理剖析與原始碼分析：資源排程機制原始碼分析（schedule()，兩種資源排程演算法）

codevs 1039：數的劃分

一個極其高效的虛擬機內存冗余消除機制：UKSM

ES6標準學習： 4、數組的擴展

《屏幕上的聰明決策》：4星。人類在手機/電腦上做選擇的心理學研究的綜述。不流暢的文本有助於理解和記憶，淘汰賽制可以有效降低選擇後懊悔。

《暢銷的原理》：4星。關於判斷與決策的研究的綜述。

《誰動了我的網絡資產》：4星。移動互聯時代的軟件使用技巧。

<spark> error：啟動spark後查看進程，進程中master和worker進程沖突

《艱難的制造》：4星。基本是關於制造業的報告文學。嚴重劇透。

《領導梯隊》：4星。企業中六個層級的領導的必知必會和必須不能做的事情。

《新經濟學》：4星。《經濟學人》2012～2015文章選集。

Spark排程機制：4)階段劃分

相關推薦