Flink on Yarn模式啟動流程分析

阿新 • • 發佈：2018-10-31

cin XML images ont list action -i 多個信息

此文已由作者嶽猛授權網易雲社區發布。

歡迎訪問網易雲社區，了解更多網易技術產品運營經驗。

Flink On Yarn 架構

技術分享圖片

Paste_Image.png

前提條件
首先需要配置YARN_CONF_DIR, HADOOP_CONF_DIR ，HADOOP_CONF_PATH其中一個用來確保Flink能夠訪問HDFS和Yarn的RM。

主要啟動流程

1. 啟動進程

首先我們通過下面的命令行啟動flink on yarn的集群
bin/yarn-session.sh -n 3 -jm 1024 -nm 1024 -st

這裏將產生總共五個進程

** 1個FlinkYarnSessionCli ---> Yarn Client **
** 1個YarnApplicationMasterRunner ---> AM + JobManager**
3個YarnTaskManager --> TaskManager

即一個客戶端+4個container，1個container啟動AM，3個container啟動TaskManager。

2.啟動流程

FlinkYarnSessionCli 啟動的過程中首先會檢查Yarn上有沒有足夠的資源去啟動所需要的container，如果有，則上傳一些flink的jar和配置文件到HDFS，這裏主要是啟動AM進程和TaskManager進程的相關依賴jar包和配置文件。

2.接著yarn client會首先向RM申請一個container來 ApplicationMaster（YarnApplicationMasterRunner進程），然後RM會通知其中一個NM啟動這個container，被分配到啟動AM的NM會首先去HDFS上下載第一步上傳的jar包和配置文件到本地，接著啟動AM；在這個過程中會啟動JobManager，因為JobManager和AM在同一進程裏面,它會把JobManager的地址重新作為一個文件上傳到HDFS上去，TaskManager在啟動的過程中也會去下載這個文件獲取JobManager的地址，然後與其進行通信；AM還負責Flink的web 服務，Flink裏面用到的都是隨機端口，這樣就允許了用戶能夠啟動多個yarn session。
啟動命令：

Paste_Image.png
3.AM 啟動完成以後，就會向AM申請container去啟動TaskManager,啟動的過程中也是首先從HDFS上去下載一些包含TaskManager（yarn模式的話這裏就是YarnTaskManager ）主類的jar和啟動過程依賴的配置文件，如JobManager地址所在的文件，然後利用java cp的方式去啟動YarnTaskManager ，一旦這些準備好，就可以接受任務了。這個和spark on yarn的yarn cluster模式其實差不多，也是分為兩個部分，一個是準備工人和工具（spark是啟動sc的過程，flink是初始化ENV的過程），另外一個就是給工人分配具體工作（都是執行具體的操作，action什麽的觸發）。
啟動命令:

Paste_Image.png

進程信息

** FlinkYarnSessionCli **
/home/hadoop/ym/jdk1.8.0_101/bin/java -Xmx512m -classpath /home/hadoop/ym/flink-1.1.3/lib/flink-dist_2.10-1.1.3.jar:/home/hadoop/ym/flink-1.1.3/lib/flink-python_2.10-1.1.3.jar:/home/hadoop/ym/flink-1.1.3/lib/log4j-1.2.17.jar:/home/hadoop/ym/flink-1.1.3/lib/slf4j-log4j12-1.7.7.jar::/home/hadoop/ym/hadoop-2.7.1/etc/hadoop: -Dlog.file=/home/hadoop/ym/flink-1.1.3/log/flink-xxxuser-yarn-session-db-180.photo.163.org.log -Dlog4j.configuration=file:/home/hadoop/ym/flink-1.1.3/conf/log4j-yarn-session.properties -Dlogback.configurationFile=file:/home/hadoop/ym/flink-1.1.3/conf/logback-yarn.xml org.apache.flink.yarn.cli.FlinkYarnSessionCli -j /home/hadoop/ym/flink-1.1.3/lib/flink-dist_2.10-1.1.3.jar -n 3 -jm 1024 -nm 1024 -st
** YarnApplicationMasterRunner **
/home/hadoop/ym/jdk1.8.0_101/bin/java -Xmx424M -Dlog.file=/home/hadoop/ym/hadoop-2.7.1/hadoop/nm/application_1480493133223_0009/container_1480493133223_0009_01_000001/jobmanager.log -Dlogback.configurationFile=file:logback.xml -Dlog4j.configuration=file:log4j.properties org.apache.flink.yarn.YarnApplicationMasterRunner
**個YarnTaskManager **
/home/hadoop/ym/jdk1.8.0_101/bin/java -Xms424m -Xmx424m -XX:MaxDirectMemorySize=424m -Dlog.file=/home/hadoop/ym/hadoop-2.7.1/hadoop/nm/application_1480493133223_0009/container_1480493133223_0009_01_000003/taskmanager.log -Dlogback.configurationFile=file:./logback.xml -Dlog4j.configuration=file:./log4j.properties org.apache.flink.yarn.YarnTaskManager --configDir .

後面我會從源代碼的角度看下啟動流程

鏈接：https://www.jianshu.com/p/20d5c3ad5843

免費體驗雲安全(易盾)內容安全、驗證碼等服務

更多網易技術、產品、運營經驗分享請點擊。

相關文章：
【推薦】【0門檻】PR稿的自我修養
【推薦】 Hadoop分布式集群的搭建

Flink on Yarn模式啟動流程分析

cin XML images ont list action -i 多個信息此文已由作者嶽猛授權網易雲社區發布。歡迎訪問網易雲社區，了解更多網易技術產品運營經驗。Flink On Yarn 架構Paste_Image.png前提條件首先需要配置YARN_CONF_DIR

Flink on Yarn模式啟動流程原始碼分析

此文已由作者嶽猛授權網易雲社群釋出。歡迎訪問網易雲社群，瞭解更多網易技術產品運營經驗。 Flink on yarn的啟動流程可以參見前面的文章 Flink on Yarn啟動流程,下面主要是從原始碼角度看下這個實現，可能有的地方理解有誤，請給予指正，多謝。 --> 1.命令列啟動yarn sessi

Flink on Yarn模式啟動流程源代碼分析

www and *** err wap `` dem 註冊 contex 此文已由作者嶽猛授權網易雲社區發布。歡迎訪問網易雲社區，了解更多網易技術產品運營經驗。Flink on yarn的啟動流程可以參見前面的文章 Flink on Yarn啟動流程,下面主要是從源碼角度看

flink on yarn模式

flink on yarn模式的相關知識點（重要）：https://blog.csdn.net/xu470438000/article/details/79576989 在flink on yarn模式中，flink yarn-session的兩種提交方式兩種提交方式 1

【Flink】深入理解Flink-On-Yarn模式

1. 前言 Flink提供了兩種在yarn上執行的模式，分別為Session-Cluster和Per-Job-Cluster模式，本文分析兩種模式及啟動流程。下圖展示了Flink-On-Yarn模式下涉及到的相關類圖結構 2. Session-Cluster模式 Session-Cluster

Flink1.6系列之—Flink on yarn流程詳解

端口準備 -a 根據 images mas info 使用臨時本篇我們介紹下，Flink在YARN上運行流程：當開始一個新的Flink yarn 會話時，客戶端首先檢查所請求的資源（containers和內存）是否可用。如果資源夠用，之後，上傳

大資料之Spark（八）--- Spark閉包處理，Spark的應用的部署模式，Spark叢集的模式，啟動Spark On Yarn模式，Spark的高可用配置

一、Spark閉包處理 ------------------------------------------------------------ RDD,resilient distributed dataset,彈性(容錯)分散式資料集。分割槽列表,fun

Android5 Zygote 與 SystemServer 啟動流程分析

進一步 null 正常的 rtb 這樣的 ket constant vml resp Android5 Zygote 與 SystemServer 啟動流程分析 Android5 Zygote 與 SystemServer 啟動流程分析前言 zy

開機啟動流程分析

boot 啟動流程本節索引在對系統啟動流程進行分析的時候，我想你一定是對系統有了一定的了解。系統的啟動目前來講大都為串行接力的方式來啟動。而所謂的並行方式的啟動方式也是某一個階段的並行。所以我按照系統啟動的順序來把文章連綴起來。 * BIOS階段 * BootLoader階段

kexec 內核快速啟動流程分析

-- 令行並且內存 tab 執行過程 family use -a 一、命令行 1. kexec -l $kpwd --append="$arg" 其中$kpwd =目標內核的路徑　　$arg =傳給內核的參數，與/proc/cmdline一致時表示重啟現有內核

從0移植uboot (二) _啟動流程分析

title tco ret 沒有返回 ips css location config 來源：Linux社區作者：xiaojiang1025 ： http://www.linuxidc.com/Linux/2017-02/141019.htm 經過

u-boot.2012.10——mini2440(二、啟動流程分析)

我們分享默認從數據中斷改變處理 mini2440 https 參考資料：https://blog.csdn.net/suiyuan19840208/article/details/7239949 1、第一階段功能　　* 硬件設備初始化　　* 加載u-boot

GEF入門實例_總結_04_Eclipse插件啟動流程分析

理解 viso inf targe get ica order workbench 註意一、前言本文承接上一節：GEF入門實例_總結_03_顯示菜單和工具欄註意到app目錄下的6個類文件。這6個文件對RCP應用程序而言非常重要，可能我們現在對這幾個文件的理

[Abp 源碼分析] 一、Abp 框架啟動流程分析

arch rep man job dsi 法則依賴 gconf dep Abp 不一定僅用於 Asp.Net Core 項目，他也可以在 Console 與 WinFrom 項目當中進行使用，所以關於啟動流程可以分為兩種，一種是 Asp.Net Core 項目的啟動流程

linux-2.6.22.6內核啟動流程分析之配置

linux 分享圖片 src image 比較文件包含子目錄 2.6 config 配置過程最終結果是生成.config文件，我們想要對配置的目的有很清楚的了解，必須先對.config文件進行分析。通過cd命令切換到linux-2.6.22.6內核目錄，輸入vi .co

spark on yarn模式下內存資源管理（筆記2）

warn 計算 nta 堆內存註意 layout led -o exc 1.spark 2.2內存占用計算公式 https://blog.csdn.net/lingbo229/article/details/80914283 2.spark on yarn內存分配*

flink on yarn部分原始碼解析 (FLIP-6 new mode)

我們在https://www.cnblogs.com/dongxiao-yang/p/9403427.html文章裡分析了flink提交single job到yarn叢集上的程式碼，flink在1.5版本後對整個框架的deploy方式重構了全新的流程（參考https://cwiki.apache.org/co

flink開發實戰之 flink on yarn

flink 執行模式 Flink 和spark一樣有三種部署模式，分別是 Local、Standalone Cluster 和 Yarn Cluster。實戰開發主要使用Yarn Cluster模式，所以本文主要介紹yarn 模式下flink任務的執行和資源分配。 Ya

Flink on yarn的問題：Invalid AMRMToken

目前採用的Flink的版本是1.4.2，執行在yarn上，總是時不時的報錯“Invalid AMRMToken from appattempt”，導致AM掛掉。簡而言之，就是AM和RM溝通的過程中，突然AM提供的Token不被認可，導致拒絕連線，進而AM掛掉。後來發現早

MapReduce程式在yarn叢集上流程分析

yarn本身也是一個叢集，這個叢集的老大是resourcemanager，其他的小弟是nodemanager。 yarn 是一個資源排程平臺，負責為運算程式提供伺服器運算資源，相當於一個分散式的作業系統平臺，而MapReduce等運算程式則相當於是運行於作業系統之上的應用程式。運算資源

Flink on Yarn模式啟動流程分析

Flink On Yarn 架構

主要啟動流程

1. 啟動進程

2.啟動流程

進程信息

相關推薦