Spark-原始碼-Spark-StartAll Master Worler啟動流程

阿新 • • 發佈：2018-11-19

Spark start-all>>



"""Master啟動流程"""


Master類
class Master(
    host: String,
    port: Int,
    webUiPort: Int,
    val securityMgr: SecurityManager,
    val conf: SparkConf) extends Actor with ActorLogReceive with Logging with LeaderElectable







Master端
def main(){
	val (actorSystem, _, _, _) = startSystemAndActor(args.host, args.port, args.webUiPort, conf)
    actorSystem.awaitTermination()
}

Master端
def startSystemAndActor(System, Int, Int, Option[Int]) = {
	//呼叫AkkaUtils建立ActorSystem
	val (actorSystem, boundPort) = AkkaUtils.createActorSystem(systemName, host, port, conf = conf,
	  securityManager = securityMgr)
	//建立屬於Master的actor, 在建立actor的同時, 會使用classOf[Master]初始化Master
	val actor = actorSystem.actorOf(Props(classOf[Master], host, boundPort, webUiPort, securityMgr, conf), actorName)
}

Master端
"""初始化Master時由於Master繼承了 trait Actor 重寫了preStart方法, 
Actor的初始化會啟動preStart方法 因此找到Master的 override def preStart()
preStart屬於生命週期方法, 在構造器之後, receiver之前"""
override def preStart() {
	// 啟動一個定時器, 定時檢查超時的Worker, WORKER_TIMEOUT:每六十秒檢查一次, 
	// self:先對著自己來一下(檢查)試試
	context.system.scheduler.schedule(0 millis, WORKER_TIMEOUT millis, self, CheckForWorkerTimeOut)
 	// 呼叫 timeOutDeadWorkers() 方法,
 	override def receiveWithLogging = { 
	 	case CheckForWorkerTimeOut => {
	      timeOutDeadWorkers()
	    }
	}

	// 用來檢查並移除所有超時的workers
	def timeOutDeadWorkers(){
		// 事實上是移除了一個存有WorkInfo的HashSet[WrokInfo]中的物件
		val toRemove = workers.filter(_.lastHeartbeat < currentTime - WORKER_TIMEOUT_MS).toArray
		for (worker <- toRemove) {
	      if (worker.state != WorkerState.DEAD) {
	        removeWorker(worker)
	      }
	    }
	}

	def removeWorker(worker: WorkerInfo){
		// 刪除記憶體裡的workInfo
		idToWorker -= worker.id
	    addressToWorker -= worker.endpoint.address
	}
}
    
"""之後執行receive方法(1.3版本), 在後來的1.6版本中叫 def receive: PartialFunction[Any, Unit]"""
Master端
override def receiveWithLogging () {}
會不斷的接收actor傳送過來的請求




"""Worker啟動流程"""

Worker類
class Worker(
    host: String,
    port: Int,
    webUiPort: Int,
    cores: Int,
    memory: Int,
    masterAkkaUrls: Array[String],
    actorSystemName: String,
    actorName: String,
    workDirPath: String = null,
    val conf: SparkConf,
    val securityMgr: SecurityManager)
  extends Actor

def preStart() => {
  registerWithMaster()
}

// 向Master註冊的方法
def registerWithMaster() {
  	// 向所有的Master註冊Worker
  	tryRegisterAllMasters()
  	
  	// 其中內容
  	def tryRegisterAllMasters()=>{
	  	// 通過Master的Url獲取Master的actor
		val actor = context.actorSelection(masterAkkaUrl)
		// 向Master傳送註冊資訊
	    actor ! RegisterWorker(workerId, host, port, cores, memory, webUi.boundPort, publicAddress)
	}	
 }

Master端
// 接收Worker傳送的註冊資訊
override def receiveWithLogging = {
	case RegisterWorker(id, workerHost, workerPort, cores, memory, workerUiPort, publicAddress) =>{
		// 判斷是否是StandBy狀態, doNothing
		idToWorker.contains(id), 已經註冊過, doNothing
		
		正常情況下(Active狀態, 且沒有註冊過):{
			// 把傳送來的 WorkerInfo 新增到 Master的 WorkerInfo中
			val worker = new WorkerInfo(id, workerHost, workerPort, cores, memory, sender, workerUiPort, publicAddress)
		}
		// 如果將Worker Info存入記憶體成功, 則呼叫持久化引擎, 將資訊存入磁碟中, 
		// 目的是防止資料丟失. 如果Master宕機, 記憶體中會丟失資料, 
		// 切換狀態(Standby和Active)後, 需要切換的節點拿不到WorkerInfo, Worker會再次註冊, 非常消耗資源, 存在磁碟則可以直接去磁碟拿取資料不需要重新註冊
		if (registerWorker(worker)) {
	      persistenceEngine.addWorker(worker)
	      sender ! RegisteredWorker(masterUrl, masterWebUiUrl)
	      schedule()
	    }

		// 向worker響應註冊成功資訊
		sender ! RegisteredWorker(masterUrl, masterWebUiUrl)
		// 開始排程資源, 排程資源不僅僅是叢集啟動的時候調動資源, 執行Job的時候也會排程資源, 其有兩種方式 一種是儘量分散, 一種是儘量集中
		schedule()
	}
}

Worker端
// 接收註冊成功的資訊, 其實是將 Active Master 的Url和rWebUiUrl傳回並更新, 之後向他傳送心跳~
def receiveWithLogging() = {
	case RegisteredWorker(masterUrl, masterWebUiUrl) =>{
		//更新MasterUrl
		changeMaster(masterUrl, masterWebUiUrl)
		//向Master傳送心跳資訊, HEARTBEAT_MILLIS =15秒, 每十五秒傳送一次心跳資訊, 傳送邏輯為 SendHeartbeat
  		context.system.scheduler.schedule(0 millis, HEARTBEAT_MILLIS millis, self, SendHeartbeat)
	}

  	//向Master傳送心跳資訊, 實際上是將自己的WorkerId傳送給Master
  	case SendHeartbeat =>
    	if (connected) { master ! Heartbeat(workerId) }
}

Master端 
def receiveWithLogging() = {
	case Heartbeat(workerId) => {
		//正常情況下, 更新上次心跳時間
		workerInfo.lastHeartbeat = System.currentTimeMillis()
		//啟動完成
	}
}

Spark-原始碼-Spark-StartAll Master Worler啟動流程

Spark start-all>> """Master啟動流程""" Master類 class Master( host: String, port: Int, webUiPort: Int, val securityMgr: SecurityMa

spark原始碼分析之Master原始碼主備切換機制分析

Master原始碼分析之主備切換機制 1.當選為leader之後的操作 //ElectedLeader 當選leader case ElectedLeader => {

Spark原始碼分析之Master資源排程演算法原理

Master是通過schedule方法進行資源排程，告知worker啟動executor等。一schedule方法 1判斷master狀態，只有alive狀態的master才可以進行資源排程，sta

Spark原始碼分析之Master註冊機制原理

一 Worker向Master註冊 1.1 Worker啟動，呼叫registerWithMaster，向Master註冊當worker啟動的時候，會呼叫registerWithMaster方法

Spark-原始碼-Spark-Submit 任務提交

Spark 版本:1.3 呼叫shell, spark-submit.sh args[] 首先是進入 org.apache.spark.deploy.SparkSubmit 類中呼叫他的 main() 方法 def main(args: Array[String])

Netty原始碼分析:1.4伺服器啟動流程

第一章節是主要是伺服器啟動的程式碼分析。章節目錄有： |———1.1初始化NioEventLoopGroup |———1.2初始化NioEventLoop |———1.3初始化NioServerSocketChannel |———1.4伺服器啟動流程為什麼先從初始化開

mysql 原始碼學習筆記：mysqld啟動流程

版本 CentOS release 6.7環境下mysql-5.7.16 社群版概述主要從原始碼層面梳理mysql-5.7.16啟動過程中呼叫函式的順序和作用。主要函式和流程包括： 1. 初始化系統變數和系統狀態 2. 初始化伺服器的各個模組原始碼分析 mai

Jvm(jdk8)原始碼分析1-java命令啟動流程詳解

1.概述現在大多數網際網路公司都是使用java技術體系搭建自己的系統，所以對java開發工程師以及java系統架構師的需求非常的多，雖然普遍的要求都是需要熟悉各種java開發框架（如目前比較流行ssi或者ssh框架），但是對於java語言本身的理解才是本質。如果你熟悉jvm原

原始碼分析Dubbo服務提供者啟動流程-上篇

本節將詳細分析Dubbo服務提供者的啟動流程，請帶著如下幾個疑問進行本節的閱讀，因為這幾個問題將是接下來幾篇文章分析的重點內容。 1、什麼時候建立與註冊中心的連線。 2、服務提供者什麼時候向註冊中心註冊服務。 3、服務提供者與註冊中心的心跳機制。從上文

Netty原始碼分析-Netty服務端啟動流程解析

前言上一章節中,我們講解了java的普通的IO和NIO,總結了它們的優缺點,然後使用netty提供的api將我們之前的程式碼進行了改造,本章就讓我們來進行netty的服務端啟動流程的分析,首先還是先上一下程式碼例項(看本章之前最好對NIO和Netty的服務端編寫有一

以太坊原始碼分析(39）geth啟動流程分析

geth是我們的go-ethereum最主要的一個命令列工具。也是我們的各種網路的接入點(主網路main-net 測試網路test-net 和私有網路)。支援執行在全節點模式或者輕量級節點模式。其他程式可以通過它暴露的JSON RPC呼叫來訪問以太坊網路的功能。如果什麼命令都不輸入直接執行geth。就會

SpringBoot原始碼解析內建Tomcat啟動流程

開啟原始碼過程略去不談，找到入口方法之後發現有兩次呼叫，而我們實際需要開始關注的是下面這個方法。 public static ConfigurableApplicationContext run(Object[] sources, String[] arg

Caddy原始碼閱讀（二）啟動流程與 Event 事件通知

Caddy原始碼閱讀（二）啟動流程與 Event 事件通知 Preface Caddy 是 Go 語言構建的輕量配置化伺服器。https://github.com/caddyserver/caddy Caddy 整個軟體可以說是由不同的外掛堆砌起來的。自己本身僅提供 Plugin 的註冊執行邏輯和 Se

頭禿了，二十三張圖帶你從原始碼瞭解Spring Boot 的啟動流程~

持續原創輸出,點選上方藍字關注我目錄前言原始碼版本從哪入手？原始碼如何切分？如何建立SpringApplication？設定應用型別設定初始化器(Initializer)設定監聽器(Listener)設定監聽器(Listener) 執行run()方法獲取、啟動執行過程監聽器環境構建建立IOC

Spark叢集啟動流程-Master啟動-原始碼分析

Spark叢集啟動流程-Master啟動-原始碼分析總結： 1.初始化一些用於啟動Master的引數 2.建立ActorSystem物件，並啟動Actor 3.呼叫工具類AkkaUtils工具類來建立actorSystem（用來建立Actor的物件） 4.建立屬於Master的ac

Spark原始碼學習（二）---Master和Worker的啟動以及Actor通訊流程

在《Spark原始碼學習（一）》中通過Spark的啟動指令碼，我們看到Spark啟動Master的時候實際上是啟動了org.apache.spark.deploy.master.Master，下面我們就從這2個類入手，通過閱讀Spark的原始碼，瞭解Spark的啟動流程。

Spark叢集啟動流程-Worker啟動-原始碼分析

Spark叢集啟動流程-Worker啟動-原始碼分析上篇文章介紹了Master啟動（Master啟動點選：https://blog.csdn.net/weixin_43637653/article/details/84073849 ），接下來，我們在原始碼裡繼續分析Worker的啟動

Spark學習之1：Master啟動流程

1. 啟動指令碼 sbin/start-master.sh "$sbin"/spark-daemon.sh start org.apache.spark.deploy.master.Master 1 --ip $SPARK_MASTER_IP --port $SPARK_

spark叢集啟動流程

今天來說一下spark叢集的啟動流程： 1.通過呼叫start-all.sh來啟動Master和Worker，首先啟動的是Mastor 2.Master服務啟動後，在PreStart方法中會啟動一個定時器定時檢查超時的Worker 3.執行receive方法，不斷地接受其他Act

第二天 -- Spark叢集啟動流程 -- 任務提交流程 -- RDD依賴關係 -- RDD快取 -- 兩個案例

第二天 – Spark叢集啟動流程 – 任務提交流程 – RDD依賴關係 – RDD快取 – 兩個案例文章目錄第二天 -- Spark叢集啟動流程 -- 任務提交流程 -- RDD依賴關係 -- RDD快取 -- 兩個案例一、Spa

Spark-原始碼-Spark-StartAll Master Worler啟動流程

相關推薦