1. 程式人生 > 實用技巧 >第三章 Flink部署

第三章 Flink部署

1 standalone模式

1.1 安裝

解壓縮 flink-1.7.0-bin-hadoop27-scala_2.11.tgz

修改 flink/conf/flink-conf.yaml 檔案

修改 /conf/slave檔案

分發給 另外兩臺機子

啟動

訪問http://hadoop1:8081

1.2 提交任務

1) 準備資料檔案

2) 把含資料檔案的資料夾,分發到taskmanage 機器中

由於讀取資料是從本地磁碟讀取,實際任務會被分發到taskmanage的機器中,所以要把目標檔案分發。

3) 執行程式

./flink run -c com.atguigu.flink.app.BatchWcApp  /ext/flink0503-1.0-SNAPSHOT.jar  --input /applog/flink/input.txt --output /applog/flink/output.csv

  

4) 到目標資料夾中檢視計算結果

注意:計算結果根據會儲存到taskmanage的機器下,不會再jobmanage下。

5) 在webui控制檯檢視計算過程

2 yarn模式

1) 啟動hadoop叢集

2) 啟動yarn-session

./yarn-session.sh -n 2 -s 2 -jm 1024 -tm 1024 -nm test -d

其中:

-n(--container):TaskManager的數量。

-s(--slots): 每個TaskManager的slot數量,預設一個slot一個core,預設每個taskmanager的slot的個數為1,有時可以多一些taskmanager,做冗餘。

-jm:JobManager的記憶體(單位MB)。

-tm:每個taskmanager的記憶體(單位MB)。

-nm:yarn 的appName(現在yarn的ui上的名字)。

-d:後臺執行。

3) 執行任務

./flink run  -m yarn-cluster -c com.atguigu.flink.app.BatchWcApp  /ext/flink0503-1.0-SNAPSHOT.jar  --input /applog/flink/input.txt --output /applog/flink/output5.csv

  

4) 去yarn控制檯檢視任務狀態