Flink 原始碼解析 —— 原始碼編譯執行

阿新 • • 發佈：2019-08-10

更新一篇知識星球裡面的原始碼分析文章，去年寫的，週末自己錄了個視訊，大家看下效果好嗎？如果好的話，後面補錄發在知識星球裡面的其他原始碼解析文章。

前言

之前自己本地 clone 了 Flink 的原始碼，編譯過，然後 share 到了 GitHub 上去了，自己也寫了一些原始碼的中文註釋，並且 push 到了 GitHub 上去了。這幾天阿里開源了宣傳已久的 Blink，結果我那個分支不能夠繼續 pull 下新的程式碼，再加上自己對 Flink 研究了也有點時間了，所以打算將這兩個東西對比著來看，這樣可能會學到不少更多東西，因為 Blink 是另外一個分支，所以自己乾脆再重新 fork 了一份，拉到本地來看原始碼。

fork

執行下面命令：

git clone [email protected]:apache/flink.git

拉取的時候找個網路好點的地方，這樣速度可能會更快點。

編譯

因為自己想看下 Blink 分支的程式碼，所以需要切換到 blink 分支來，

git checkout blink

這樣你就到了 blink 分支了，接下來我們將 blink 原始碼編譯一下，執行如下命令：

mvn clean install -Dmaven.test.skip=true -Dhadoop.version=2.7.6 -Dmaven.javadoc.skip=true -Dcheckstyle.skip=true

maven 編譯的時候跳過測試程式碼、javadoc 和程式碼風格檢查，這樣可以減少不少時間。

注意：你的 maven 的 settings.xml 檔案的 mirror 新增下面這個：(這樣下載依賴才能飛起來)

<mirror>
  <id>nexus-aliyun</id>
  <mirrorOf>*,!jeecg,!jeecg-snapshots,!mapr-releases</mirrorOf>
  <name>Nexus aliyun</name>
  <url>http://maven.aliyun.com/nexus/content/groups/public</url>
</mirror>

<mirror>
  <id>mapr-public</id>
  <mirrorOf>mapr-releases</mirrorOf>
  <name>mapr-releases</name>
  <url>https://maven.aliyun.com/repository/mapr-public</url>
</mirror>

執行完這個命令後，然後呢，你可以掏出手機，開啟微信，搜尋下微訊號：zhisheng_tian , 然後點選一波新增好友，歡迎來探討技術。

等了一波時間之後，你可能會遇到這個問題(看到不少童鞋都遇到這個問題，之前編譯 Flink 的時候也遇到過)：

[ERROR] Failed to execute goal on project flink-mapr-fs: Could not resolve dependencies for project com.alibaba.blink:flink-mapr-fs:jar:1.5.1: Failure to find com.mapr.hadoop:maprfs:jar:5.2.1-mapr in http://maven.aliyun.com/nexus/content/groups/public was cached in the local repository, resolution will not be reattempted until the update interval of nexus-aliyun has elapsed or updates are forced -> [Help 1]

如果你試了兩遍都沒編譯通過，那麼我這裡就教大家一種方法（執行完編譯命令後啥也沒動就 OK 的請跳過，誰叫你運氣這麼好呢）：

在 flink-filesystems 中把 flink-mapr-fs module 給註釋掉。

上圖這是我給大家的忠告，特別管用。

再次執行命令編譯起來就沒有錯誤了，如果你還有其他的錯誤，我猜估計還是網路的問題，導致一些國外的 maven 依賴下載不下來或者不完整，導致的錯誤，暴力的方法就是和我一樣，把這些下載不下來的依賴 module 註釋掉，或者你可以像已經編譯好的童鞋要下 maven 的 .m2 檔案裡面已經下載好了的依賴，然後複製貼上到你的本地路徑去，注意路徑包名不要弄錯了，這樣一般可以解決所有的問題了，如果還有問題，我也無能為力了。

編譯成功就長下圖這樣：

執行

然後我們的目錄是長這樣的：

標記的那個就是我們的可執行檔案，就跟我們在 Flink 官網下載的一樣，我們可以將它執行起來看下效果。

我把它移到了 /usr/local/blink-1.5.1 下了，個人習慣，喜歡把一些安裝的軟體安裝在 /usr/local/ 目錄下面。

目錄結構和我以前的安裝介紹文章類似，就是多了 batch_conf 目錄，和 conf 目錄是一樣的東西，不知道為啥要弄兩個配置檔案目錄，問過負責的人，沒理我，哈哈哈。

那麼我們接下來就是執行下 Blink，進入到 bin 目錄，執行可執行檔案：

./start-cluster.sh

windows 可以點選 start-cluster.bat 啟動，這點對 windows 使用者比較友好。

執行完後命令後，在瀏覽器裡訪問地址，http://localhost:8081/ , 出現下圖這樣就代表 Blink 成功啟動了：

上圖是開源版本的白色主題，騷氣的黑色主題通過在 Flink 群裡得知如何改之後，編譯執行後的效果如下：

一次好奇的執行了多次上面啟動命令，發現也能夠正常的執行。

然後啟動的日誌是這樣的：

說明已經啟動了 9 個 Task Manager，然後看到我們頁面的監控資訊如下：

可以看到監控資訊裡面已經有 40 個可用的 slot，這是因為 Blink 預設的是一個 Task Manager 4 個 slot，我們總共啟動了 10 個 Task Manager，所以才會有 40 個可用的 slot，注意：Flink 預設的配置是 1 個 Task Manager 只含有 1 個 slot，不過這個是可以自己分配的。

注意：開啟了多個 Task Manager 後，要關閉的話，得執行同樣次數的關閉命令：

./stop-cluster.sh

中文原始碼分析

https://github.com/zhisheng17/flink

配套視訊解析

視訊錄製過程難免說錯，還請大家可以指教

總結

本篇文章是《從1到100深入學習Flink》的第一篇，zhisheng 我帶帶大家一起如何 clone 專案原始碼，進行原始碼編譯，然後執行編譯後的可執行檔案 blink。下篇文章會分析專案原始碼的結構組成。

部落格

1、Flink 從0到1學習 —— Apache Flink 介紹

2、Flink 從0到1學習 —— Mac 上搭建 Flink 1.6.0 環境並構建執行簡單程式入門

3、Flink 從0到1學習 —— Flink 配置檔案詳解

4、Flink 從0到1學習 —— Data Source 介紹

5、Flink 從0到1學習 —— 如何自定義 Data Source ？

6、Flink 從0到1學習 —— Data Sink 介紹

7、Flink 從0到1學習 —— 如何自定義 Data Sink ？

8、Flink 從0到1學習 —— Flink Data transformation(轉換)

9、Flink 從0到1學習 —— 介紹 Flink 中的 Stream Windows

10、Flink 從0到1學習 —— Flink 中的幾種 Time 詳解

11、Flink 從0到1學習 —— Flink 讀取 Kafka 資料寫入到 ElasticSearch

12、Flink 從0到1學習 —— Flink 專案如何執行？

13、Flink 從0到1學習 —— Flink 讀取 Kafka 資料寫入到 Kafka

14、Flink 從0到1學習 —— Flink JobManager 高可用性配置

15、Flink 從0到1學習 —— Flink parallelism 和 Slot 介紹

16、Flink 從0到1學習 —— Flink 讀取 Kafka 資料批量寫入到 MySQL

17、Flink 從0到1學習 —— Flink 讀取 Kafka 資料寫入到 RabbitMQ

18、Flink 從0到1學習 —— Flink 讀取 Kafka 資料寫入到 HBase

19、Flink 從0到1學習 —— Flink 讀取 Kafka 資料寫入到 HDFS

20、Flink 從0到1學習 —— Flink 讀取 Kafka 資料寫入到 Redis

21、Flink 從0到1學習 —— Flink 讀取 Kafka 資料寫入到 Cassandra

22、Flink 從0到1學習 —— Flink 讀取 Kafka 資料寫入到 Flume

23、Flink 從0到1學習 —— Flink 讀取 Kafka 資料寫入到 InfluxDB

24、Flink 從0到1學習 —— Flink 讀取 Kafka 資料寫入到 RocketMQ

25、Flink 從0到1學習 —— 你上傳的 jar 包藏到哪裡去了

26、Flink 從0到1學習 —— 你的 Flink job 日誌跑到哪裡去了

27、阿里巴巴開源的 Blink 實時計算框架真香

28、Flink 從0到1學習 —— Flink 中如何管理配置？

29、Flink 從0到1學習—— Flink 不可以連續 Split(分流)？

30、Flink 從0到1學習—— 分享四本 Flink 國外的書和二十多篇 Paper 論文

31、Flink 架構、原理與部署測試

32、為什麼說流處理即未來？

33、OPPO 資料中臺之基石：基於 Flink SQL 構建實時資料倉庫

34、流計算框架 Flink 與 Storm 的效能對比

35、Flink狀態管理和容錯機制介紹

36、Apache Flink 結合 Kafka 構建端到端的 Exactly-Once 處理

37、360深度實踐：Flink與Storm協議級對比

38、如何基於Flink+TensorFlow打造實時智慧異常檢測平臺？只看這一篇就夠了

39、Apache Flink 1.9 重大特性提前解讀

40、Flink 全網最全資源（視訊、部落格、PPT、入門、實戰、原始碼解析、問答等持續更新）

41、Flink 靈魂兩百問，這誰頂得住？

原始碼解析

1、Flink 原始碼解析 —— 原始碼編譯執行

2、Flink 原始碼解析 —— 專案結構一覽

3、Flink 原始碼解析—— local 模式啟動流程

4、Flink 原始碼解析 —— standalone session 模式啟動流程

5、Flink 原始碼解析 —— Standalone Session Cluster 啟動流程深度分析之 Job Manager 啟動

6、Flink 原始碼解析 —— Standalone Session Cluster 啟動流程深度分析之 Task Manager 啟動

7、Flink 原始碼解析 —— 分析 Batch WordCount 程式的執行過程

8、Flink 原始碼解析 —— 分析 Streaming WordCount 程式的執行過程

9、Flink 原始碼解析 —— 如何獲取 JobGraph？

10、Flink 原始碼解析 —— 如何獲取 StreamGraph？

11、Flink 原始碼解析 —— Flink JobManager 有什麼作用？

12、Flink 原始碼解析 —— Flink TaskManager 有什麼作用？

13、Flink 原始碼解析 —— JobManager 處理 SubmitJob 的過程

14、Flink 原始碼解析 —— TaskManager 處理 SubmitJob 的過程

15、Flink 原始碼解析 —— 深度解析 Flink Checkpoint 機制

16、Flink 原始碼解析 —— 深度解析 Flink 序列化機制

17、Flink 原始碼解析 —— 深度解析 Flink 是如何管理好記憶體的？

18、Flink Metrics 原始碼解析 —— Flink-metrics-core

19、Flink Metrics 原始碼解析 —— Flink-metrics-datadog

20、Flink Metrics 原始碼解析 —— Flink-metrics-dropwizard

21、Flink Metrics 原始碼解析 —— Flink-metrics-graphite

22、Flink Metrics 原始碼解析 —— Flink-metrics-influxdb

23、Flink Metrics 原始碼解析 —— Flink-metrics-jmx

24、Flink Metrics 原始碼解析 —— Flink-metrics-slf4j

25、Flink Metrics 原始碼解析 —— Flink-metrics-statsd

26、Flink Metrics 原始碼解析 —— Flink-metrics-prometheus

26、Flink Annotations 原始碼解析

27、Flink 原始碼解析 —— 如何獲取 ExecutionGraph ？

28、大資料重磅炸彈——實時計算框架 Flink

29、Flink Checkpoint-輕量級分散式快照

30、Flink Clients 原始碼解析原文出處：zhisheng的部落格，歡迎關注我的公眾號：zhish

Flink 原始碼解析 —— 原始碼編譯執行

前言

fork

編譯

執行

中文原始碼分析

配套視訊解析

相關

總結

部落格

原始碼解析

Flink 原始碼解析 —— 原始碼編譯執行

Spark原始碼解析(一):Spark執行流程和指令碼

分散式任務排程平臺XXL-JOB--原始碼解析六:executor執行器原始碼解析之啟動jetty服務接受請求並執行排程

ARouter原始碼解析01-編譯生成檔案

MySQL的JDBC驅動原始碼解析預編譯開啟

ConcurrentHashMap原始碼解析，多執行緒擴容

Spring原始碼解析（十四）——AOP原理——AnnotationAwareAspectJAutoProxyCreator執行時機

flink on yarn部分原始碼解析 (FLIP-6 new mode)

java執行緒池詳細入門教程即原始碼解析

1.EOS原始碼編譯執行

(一)turtlebot3學習,執行的開原始碼解析

Elastic-Job原始碼解析(三)之分片定時任務執行

Tomcat原始碼解析：Jsp檔案的編譯、實現

RxJava2原始碼解析——基本流程、執行緒排程

Thread執行緒原始碼解析

OKHttp 3.10原始碼解析（一）：執行緒池和任務佇列

mybatis原始碼解析第一課-mybatis原始碼匯入idea執行

Java多執行緒——FutureTask原始碼解析

Windows下編譯xgboost的C++原始碼（方便vs執行的）

併發程式設計的藝術-執行緒池原始碼解析

Flink 原始碼解析 —— 原始碼編譯執行

前言

fork

編譯

執行

中文原始碼分析

配套視訊解析

相關

總結

部落格

原始碼解析

相關推薦