Spark作業排程

阿新 • • 發佈：2022-04-29

　　Spark在standalone模式下，預設是使用FIFO的模式，我們可以使用spark.cores.max 來設定它的最大核心數，使用spark.executor.memory 來設定它的記憶體。

在YARN模式下，使用--num-workers設定worker的數量，使用--worker-memory設定work的記憶體，使用--worker-cores設定worker的核心數。

下面介紹一下怎麼設定Spark的排程為Fair模式。

　　在例項化SparkContext之前，設定spark.scheduler.mode。

System.setProperty("spark.scheduler.mode", "FAIR")

　　公平演算法支援把作業提交到排程池裡面，然後給每個排程池設定優先順序來執行，下面是怎麼在程式裡面指定排程池。

context.setLocalProperty("spark.scheduler.pool", "pool1")

　　上面是設定排程池為pool1，當不需要的時候，可以設定為null。

context.setLocalProperty("spark.scheduler.pool", null)

　　預設每個排程池在叢集裡面是平等共享叢集資源的，但是在排程池裡面，作業的執行是FIFO的，如果給每個使用者設定一個排程池，這樣就不會出現遲提交的比先提交的先執行。

　　下面是設定pool的樣本，詳情可以具體參考conf/fairscheduler.xml.template。

<?xml version="1.0"?>
<allocations>
  <pool name="production">
    <schedulingMode>FAIR</schedulingMode>
    <weight>1</weight>
    <minShare>2</minShare>
  </pool>
  <pool name="test">
    <schedulingMode>FIFO</schedulingMode>
    <weight>2</weight>
    <minShare>3</minShare>
  </pool>
</allocations>

schedulingMode：FAIR或者FIFO。

weight：權重，預設是1，設定為2的話，就會比其他排程池獲得2x多的資源，如果設定為-1000，該排程池一有任務就會馬上執行。

minShare：最小共享核心數，預設是0，在權重相同的情況下，minShare大的，可以獲得更多的資源。

　　我們可以通過spark.scheduler.allocation.file引數來設定這個檔案的位置。

System.setProperty("spark.scheduler.allocation.file", "/path/to/file")

Spark作業排程

　　Spark在standalone模式下，預設是使用FIFO的模式，我們可以使用spark.cores.max 來設定它的最大核心數，使用spark.executor.memory 來設定它的記憶體。

分支限界，流水作業問題批處理作業排程

>>> 最優流水排程問題問題描述：設有n個作業，每一個作業i均被分解為m項任務: Ti1, Ti2, ┅ , Tim(1≤i≤n，故共有n*m個任務)，要把這些任務安排到m臺機器上進行加工。

C#作業排程FluentScheduler學習筆記

技術標籤：C#教程c# 一、簡介 FluentScheduler是一個簡單的任務排程框架，定時工作管理員。

Quartz作業排程實踐

技術標籤：.NETc# Quartz的使用場景：例如：每5秒對某個平臺傳輸資料 Quartz框架的一些基礎概念解釋： Scheduler 作業排程器。 IJob 作業介面，繼承並實現Execute，編寫執行的具體作業邏輯。 JobBuilder 根據設

[luogu p1065] 作業排程方案

技術標籤：java演算法資料結構python大資料傳送門作業排程方案題目描述我們現在要利用\\(m\\)臺機器加工\\(n\\)個工件，每個工件都有\\(m\\)道工序，每道工序都在不同的指定的機器上完成。每個工件的每道工

Spark 系列（五）—— Spark 執行模式與作業提交

一、作業提交 1.1spark-submit Spark 所有模式均使用 spark-submit 命令提交作業，其格式如下：

spark排程器FIFO,FAIR

Spark中的排程模式主要有兩種：FIFO和FAIR。預設情況下Spark的排程模式是FIFO（先進先出），誰先提交誰先執行，後面的任務需要等待前面的任務執行。而FAIR（公平排程）模式支援在排程池中為任務進行分組，不同的排程

【排程】柔性作業車間排程問題的描述與分類

柔性作業車間排程問題（ｆｌｅｘｉｂｌｅｊｏｂｓｈｏｐｓｃｈｅｄｕｌｉｎｇｐｒｏｂｌｅｍ，ＦＪＳＰ）的描述如下：ｎ個工件（Ｊ１，Ｊ２，…，Ｊｎ）要在ｍ臺機器（Ｍ１，Ｍ２，…，Ｍｍ）上加工；每個工

【排程】經典作業車間排程問題VS柔性作業車間排程問題

經典作業車間排程問題在傳統車間排程模型中，假設工序加工所需要的資源是不具備柔性的資源，工件的所有工序的加工機器是唯一的，且機器順序是已知的，則可通過確定工序在每臺機器上的加工順序來優化完工時

支援上百萬作業量自動排程與編排，BMC雲課堂釋出Control-M 20

近日，雲端計算和IT管理解決方案提供商BMC宣佈正式釋出Control-M 20，幫助IT運維領導實現業務敏捷性，加快新應用釋出速度，更加快速地實現資料驅動結果，降低成本並通過技術現代化創造業務價值。

餘老師帶你學習大資料-Spark快速大資料處理第三章第十一節YARN排程器和實戰編寫

YARN編寫實戰 Yarn排程器配置理想情況下，我們應用對Yarn資源的請求應該立刻得到滿足，但現實情況資源往往是有限的，特別是在一個很繁忙的叢集，一個應用資源的請求經常需要等待一段時間才能的到相應的

作業系統導論OSTEP 第七章作業答案程序排程：介紹

技術標籤：作業系統導論OSTEP作業系統程序排程OSTEP作業系統導論答案答案Github庫https://github.com/jzplp/OSTEP-Answers

Spark應用程式-任務的排程

任務的排程關於任務的排程邏輯依然在submitMissingTasks方法中，在任務的劃分之後，會生成一個任務的任務的集合，即：

Spark原始碼系列（一）spark-submit提交作業過程

前言折騰了很久，終於開始學習Spark的原始碼了，第一篇我打算講一下Spark作業的提交過程。

Spark原始碼系列（三）作業執行過程

作業執行上一章講了RDD的轉換，但是沒講作業的執行，它和Driver Program的關係是啥，和RDD的關係是啥？

Spark原始碼系列（四）圖解作業生命週期

這一章我們探索了Spark作業的執行過程，但是沒把整個過程描繪出來，好，跟著我走吧，let you know！

位元組跳動在Spark SQL上的核心優化實踐 | 位元組跳動技術沙龍

10月26日，位元組跳動技術沙龍 | 大資料架構專場在上海位元組跳動總部圓滿結束。我們邀請到位元組跳動資料倉庫架構負責人-郭俊，Kyligence 大資料研發工程師-陶加濤，位元組跳動儲存工程師-徐明敏，阿里雲高階技術

Spark Shuffle的基本原理分析

這篇主要根據官網對Shuffle的介紹做了梳理和分析，並參考下面資料中的部分內容加以理解，對英文官網上的每一句話應該細細體味，目前的能力還有欠缺，以後慢慢補。

Apache Flink 進階（六）：Flink 作業執行深度解析

作者：嶽猛整理：毛鶴本文根據 Apache Flink 系列直播課程整理而成，由 Apache Flink Contributor、網易雲音樂實時計算平臺研發工程師嶽猛分享。主要分享內容為 Flink Job 執行作業的流程，文章將從兩個方面進行分

XXL-JOB v2.1.1 釋出，分散式任務排程平臺

XXL-JOB 正在角逐 “2019年度最受歡迎中國開源軟體”，期待您寶貴的一票！投票連結

Spark作業排程

相關推薦