第三章 Flink部署
阿新 • • 發佈:2020-07-09
1 standalone模式
1.1 安裝
解壓縮 flink-1.7.0-bin-hadoop27-scala_2.11.tgz
修改 flink/conf/flink-conf.yaml 檔案
修改 /conf/slave檔案
分發給 另外兩臺機子
啟動
1.2 提交任務
1) 準備資料檔案
2) 把含資料檔案的資料夾,分發到taskmanage 機器中
由於讀取資料是從本地磁碟讀取,實際任務會被分發到taskmanage的機器中,所以要把目標檔案分發。
3) 執行程式
./flink run -c com.atguigu.flink.app.BatchWcApp /ext/flink0503-1.0-SNAPSHOT.jar --input /applog/flink/input.txt --output /applog/flink/output.csv
4) 到目標資料夾中檢視計算結果
注意:計算結果根據會儲存到taskmanage的機器下,不會再jobmanage下。
5) 在webui控制檯檢視計算過程
2 yarn模式
1) 啟動hadoop叢集
2) 啟動yarn-session
./yarn-session.sh -n 2 -s 2 -jm 1024 -tm 1024 -nm test -d
其中:
-n(--container):TaskManager的數量。
-s(--slots): 每個TaskManager的slot數量,預設一個slot一個core,預設每個taskmanager的slot的個數為1,有時可以多一些taskmanager,做冗餘。
-jm:JobManager的記憶體(單位MB)。
-tm:每個taskmanager的記憶體(單位MB)。
-nm:yarn 的appName(現在yarn的ui上的名字)。
-d:後臺執行。
3) 執行任務
./flink run -m yarn-cluster -c com.atguigu.flink.app.BatchWcApp /ext/flink0503-1.0-SNAPSHOT.jar --input /applog/flink/input.txt --output /applog/flink/output5.csv
4) 去yarn控制檯檢視任務狀態