[轉載] YARN 排程和資源佇列

阿新 • • 發佈：2018-11-16

[大資料之Yarn]——資源排程淺學

在hadoop生態越來越完善的背景下，叢集多使用者租用的場景變得越來越普遍，多使用者任務下的資源排程就顯得十分關鍵了。比如，一個公司擁有一個幾十個節點的hadoop叢集，a專案組要進行一個計算任務，b專案組要計算一個任務，叢集到底先執行哪個任務？如果你需要提交1000個任務呢？這些任務又是如何執行的？

為了解決上面的問題，就需要在hadoop叢集中引入資源管理和任務排程的框架。這就是——Yarn。

YARN的發展

Yarn在第一代的時候，框架跟hdfs差不多。一個主節點jobtracker，用來分配任務和監控任務執行情況；多個從節點tasktracker，用來執行真正的計算。

這種方式還是有一定的弊端的：

tasktracker出現故障，會導致整個任務計算失敗。
jobtracker壓力過大，既要負責全域性的任務分配，還需要時刻與tasktracker溝通。

因此，就出現了第二代的YARN。

這種模式主要的特點，就是兩個地方：

jobtracker被分離為兩個角色，一個是resourcemanager，簡稱RM，僅僅負責任務的排程和應用的管理；一個是applicationmaster，簡稱AM，每個應用任務都會建立一個AM，用於申請任務需要的資源並且監控任務執行狀況。

YARN資源排程流程

YARN的資源排程可以看官網提供的圖片：

流程大致如下：

client客戶端向yarn叢集(resourcemanager)提交任務
resourcemanager選擇一個node建立appmaster
appmaster根據任務向rm申請資源
rm返回資源申請的結果
appmaster去對應的node上建立任務需要的資源（container形式，包括記憶體和CPU）
appmaster負責與nodemanager進行溝通，監控任務執行
最後任務執行成功，彙總結果。

其中Resourcemanager裡面一個很重要的東西，就是排程器Scheduler，排程規則可以使用官方提供的，也可以自定義。

官方大概提供了三種模式：

FIFO，最簡單的先進先出，按照使用者提交任務的順序執行。這種方式最簡單，但是也一大堆問題，比如任務可能獨佔資源，導致其他任務餓死等。
Capacity，採用佇列的概念，任務提交到佇列，佇列可以設定資源的佔比，並且支援層級佇列、訪問控制、使用者限制、預定等等高階的玩法。
Fair share，基於使用者或者應用去平分資源，靈活分配。

capacity和fair share都是採用佇列的模式，佇列內部基本上還是FIFO。並且同級的佇列任務，如果一個佇列是空閒的，那麼另一個佇列任務可以使用資源；如果這個佇列又提交了任務，則會搶佔或者等待資源釋放，直到資源到達預定的分配比例。

總的來說，YARN的資源排程還是比較完善的。

參考

作者：xingoo

出處：http://www.cnblogs.com/xing901022

本文版權歸作者和部落格園共有。歡迎轉載，但必須保留此段宣告，且在文章頁面明顯位置給出原文連線！

[轉載] YARN 排程和資源佇列

[大資料之Yarn]——資源排程淺學

YARN的發展

YARN資源排程流程

參考

[轉載] YARN 排程和資源佇列

【Hadoop入門學習系列之三】YARN原理和資源排程

Zeppelin 原始碼分析-排程和資源分析（2）

.Net Core 商城微服務專案系列（十五）: 構建定時任務排程和訊息佇列管理系統

從零開始入門 K8s | Kubernetes 排程和資源管理

YARN中記憶體和CPU兩種資源的排程和隔離實現詳解

hadoop的yarn資源佇列

Spark資源排程和任務排程

hadoop使用Yarn進行資源佇列劃分管理

spark提交任務的模式—— standalone模式與yarn模式、資源排程與任務排程

YARN基於IO資源的隔離排程

QoS和QoS佇列排程演算法

kubernetes排程之pod優先順序和資源搶佔

[轉載]持續交付和DevOps的前世今生

[轉載]熱血傳奇之資源文件與地圖的讀取分析

unity5打包機制下，一種資源打ab和資源管理的方案

spring security oauth2 jwt 認證和資源分離的配置文件（java類配置版）

【轉載】sharding和partition區別

轉載：sigmoid和softmax總結

cgroup實現cpu綁定和資源使用比例限制

[轉載] YARN 排程和資源佇列

YARN的發展

YARN資源排程流程

參考

相關推薦