flink：JobGraph生成過程分析

阿新 • • 發佈：2020-11-28

1、JobGraph是由StreamGraph轉換而來，當client將StreamGraph提交後，job啟動前會先完成轉換，統一的轉換入口如下： ![](https://img2020.cnblogs.com/blog/2204822/202011/2204822-20201128104224238-2031434764.png) 2、StreamingJobGraphGenerator類 StreamingJobGraphGenerator的職責就是將StreamGraph轉換成JobGraph，在轉換的過程中要根據StreamGraph中的節點及邊的對應關係進行運算元鏈的合併，同時將一些其他與任務執行相關聯的資訊複製過來，接下來主要需要關注其中的構造方法、轉換方法、判斷能否合併的邏輯、運算元合併的方法、StreamNode轉換為JobVertex等幾個核心方法即可梳理清楚其轉換的業務 2.1、構造方法 ![](https://img2020.cnblogs.com/blog/2204822/202011/2204822-20201128104807780-2061502937.png) 其構造方法中主要包含三個內容，儲存了StreamGraph、構造了JobGraph、同時new了一系列的集合容器用於儲存轉換的中間態 2.2、轉換方法createJobGraph ![](https://img2020.cnblogs.com/blog/2204822/202011/2204822-20201128105149062-1467634407.png) createJobGraph方法中邏輯很清晰，除了合併運算元就是複製一些其他執行引數 2.3、setChaining和createChain方法在這兩處完成了運算元的合併核心邏輯，其實就是根據能否chain的判定進行不同的處理，其步驟可以歸納為： ![](https://img2020.cnblogs.com/blog/2204822/202011/2204822-20201128110656527-1617712842.png) a、因為在StreamGraph中已經形成了完整的DAG圖，此處直接遍歷source節點，從source節點往後挨個去createChain ![](https://img2020.cnblogs.com/blog/2204822/202011/2204822-20201128110752808-652212905.png) b，createChain時先拿到當前節點的下游節點，然後遞迴處理，構建出整個的傳遞鏈 ![](https://img2020.cnblogs.com/blog/2204822/202011/2204822-20201128110841368-340209301.png) c、在構造JobVertex時，如果從前面傳遞過來的兩個節點ID相同，則證明是頭結點，則生成一個JobVertex，並將傳遞鏈中的後續運算元connect起來，如果不是則表示應當是被合併的運算元，則僅維護StreamConfig即可 d、於此同時也維護好對應的執行資源資料、格式化資料等 2.4、能否chain成鏈的判斷邏輯 ![](https://img2020.cnblogs.com/blog/2204822/202011/2204822-20201128111030520-505490136.png) 判斷很簡潔明瞭，不再贅述 2.5、createJobVertex 如果是頭結點時就將頭節點轉化為一個JobVertex，此處有InputOutputFormatVertex和JobVertex的區別 ![](https://img2020.cnblogs.com/blog/2204822/202011/2204822-20201128111334582-173205712.png) 2.6 connect 此處就是根據不同的策略，將傳遞鏈上的對應關係維護到一個JobEdge中去。最後，總的來看由於在StreamGraph中已經構建好了DAG的關係和對映，在StreamingJobGraphGenerator將這個對映關係再次優化而已，在此過程中還涉及到JobGraph、JobVertex、JobEdge等物件，這些可以對比StreamGraph、StreamNode和StreamEdge更容易

flink：JobGraph生成過程分析

flink：JobGraph生成過程分析

比特幣BTC原始碼分析（1）：地址生成過程

以太坊ETH原始碼分析（1）：地址生成過程

Linux核心移植 part2：uboot裝置樹--生成過程分析

對症下藥：Tomcat停機過程分析與執行緒處理方法

u-boot-2015.07 autoconf.mk生成過程分析

Lucene學習總結之四：Lucene索引過程分析

Lucene學習總結之四：Lucene索引過程分析(1)

flink1.10版本StreamGraph生成過程分析

論文：基於粒子群優化的測試資料生成及其實證分析－－－－－生成過程以及實驗（計算機研究與發展）

Flink 原理與實現：如何生成 JobGraph

Java分析系列之四：jstack生成的Thread Dump日誌執行緒狀態

分析系列之二：jstack生成的Thread Dump日誌結構解析

LIVE555學習3：live555MediaServer講解——Live555從啟動到響應Client過程分析

TF之DCGAN：基於TF利用DCGAN測試自己的資料集並進行生成過程全記錄

Flink原始碼系列——獲取JobGraph的過程

Rxjava2原始碼分析（一）：Flowable的建立和基本使用過程分析

linux核心的生成過程, vmlinux除錯分析

【Flink原理和應用】：CliFrontend的原始碼分析

編譯原理實驗報告一：PL0語言編譯器分析（PL0，詞法分析，語法分析，中間程式碼生成）

flink：JobGraph生成過程分析

相關推薦