Spark Master資源排程--worker向master註冊

阿新 • • 發佈：2018-12-05

Spark Master資源排程–Worker向Master註冊

Youtube 視訊

youtube (Spark Master資源排程–Worker向Master註冊) https://youtu.be/SFqXaIKt-yI

Bilibili 視訊

bilibili (Spark Master資源排程–Worker向Master註冊)

https://www.bilibili.com/video/av37442280/

Worker向Master註冊

worker傳送註冊訊息(RegisterWorker)

 override def onStart() {
    assert(!registered)
    logInfo("Starting Spark worker %s:%d with %d cores, %s RAM".format(
      host, port, cores, Utils.megabytesToString(memory)))
    logInfo(s"Running Spark version ${org.apache.spark.SPARK_VERSION}")
    logInfo("Spark home: " + sparkHome)
    createWorkDir()
    shuffleService.startIfEnabled()
    webUi = new WorkerWebUI(this, workDir, webUiPort)
    webUi.bind()

    val scheme = if (webUi.sslOptions.enabled) "https" else "http"
    workerWebUiUrl = s"$scheme://$publicAddress:${webUi.boundPort}"
    registerWithMaster()

    metricsSystem.registerSource(workerSource)
    metricsSystem.start()
    // Attach the worker metrics servlet handler to the web ui after the metrics system is started.
    metricsSystem.getServletHandlers.foreach(webUi.attachHandler)
  }

  private def registerWithMaster() {
    // onDisconnected may be triggered multiple times, so don't attempt registration
    // if there are outstanding registration attempts scheduled.
    registrationRetryTimer match {
      case None =>
        registered = false
        registerMasterFutures = tryRegisterAllMasters()
        connectionAttemptCount = 0
        registrationRetryTimer = Some(forwordMessageScheduler.scheduleAtFixedRate(
          new Runnable {
            override def run(): Unit = Utils.tryLogNonFatalError {
              Option(self).foreach(_.send(ReregisterWithMaster))
            }
          },
          INITIAL_REGISTRATION_RETRY_INTERVAL_SECONDS,
          INITIAL_REGISTRATION_RETRY_INTERVAL_SECONDS,
          TimeUnit.SECONDS))
      case Some(_) =>
        logInfo("Not spawning another attempt to register with the master, since there is an" +
          " attempt scheduled already.")
    }
  }

  private def tryRegisterAllMasters(): Array[JFuture[_]] = {
    masterRpcAddresses.map { masterAddress =>
      registerMasterThreadPool.submit(new Runnable {
        override def run(): Unit = {
          try {
            logInfo("Connecting to master " + masterAddress + "...")
            val masterEndpoint =
              rpcEnv.setupEndpointRef(Master.SYSTEM_NAME, masterAddress, Master.ENDPOINT_NAME)
            registerWithMaster(masterEndpoint)
          } catch {
            case ie: InterruptedException => // Cancelled
            case NonFatal(e) => logWarning(s"Failed to connect to master $masterAddress", e)
          }
        }
      })
    }
  }

  private def registerWithMaster(masterEndpoint: RpcEndpointRef): Unit = {
    masterEndpoint.ask[RegisterWorkerResponse](RegisterWorker(
      workerId, host, port, self, cores, memory, workerWebUiUrl))
      .onComplete {
        // This is a very fast action so we can use "ThreadUtils.sameThread"
        case Success(msg) =>
          Utils.tryLogNonFatalError {
            handleRegisterResponse(msg)
          }
        case Failure(e) =>
          logError(s"Cannot register with master: ${masterEndpoint.address}", e)
          System.exit(1)
      }(ThreadUtils.sameThread)
  }

Master處理Worker的註冊訊息

receiveAndReply接收訊息

在master上new WorkerInfo資訊
WorkerInfo資訊註冊到master上(記憶體中)
把WorkerInfo資訊儲存到master的儲存引擎中
給Worker傳送訊息: RegisteredWorker
呼叫master的資源除錯方法，一般在worker啟動時，此時還沒有新的作業提交，所以此時資源排程是沒有實際分配的

  override def receiveAndReply(context: RpcCallContext): PartialFunction[Any, Unit] = {
    case RegisterWorker(
        id, workerHost, workerPort, workerRef, cores, memory, workerWebUiUrl) => {
      logInfo("Registering worker %s:%d with %d cores, %s RAM".format(
        workerHost, workerPort, cores, Utils.megabytesToString(memory)))
      if (state == RecoveryState.STANDBY) {
        context.reply(MasterInStandby)
      } else if (idToWorker.contains(id)) {
        context.reply(RegisterWorkerFailed("Duplicate worker ID"))
      } else {
        val worker = new WorkerInfo(id, workerHost, workerPort, cores, memory,
          workerRef, workerWebUiUrl)
        if (registerWorker(worker)) {
          persistenceEngine.addWorker(worker)
          context.reply(RegisteredWorker(self, masterWebUiUrl))
          schedule()
        } else {
          val workerAddress = worker.endpoint.address
          logWarning("Worker registration failed. Attempted to re-register worker at same " +
            "address: " + workerAddress)
          context.reply(RegisterWorkerFailed("Attempted to re-register worker at same address: "
            + workerAddress))
        }
      }
    }

private def registerWorker(worker: WorkerInfo): Boolean = {
    // There may be one or more refs to dead workers on this same node (w/ different ID's),
    // remove them.
    workers.filter { w =>
      (w.host == worker.host && w.port == worker.port) && (w.state == WorkerState.DEAD)
    }.foreach { w =>
      workers -= w
    }

    val workerAddress = worker.endpoint.address
    if (addressToWorker.contains(workerAddress)) {
      val oldWorker = addressToWorker(workerAddress)
      if (oldWorker.state == WorkerState.UNKNOWN) {
        // A worker registering from UNKNOWN implies that the worker was restarted during recovery.
        // The old worker must thus be dead, so we will remove it and accept the new worker.
        removeWorker(oldWorker)
      } else {
        logInfo("Attempted to re-register worker at same address: " + workerAddress)
        return false
      }
    }

    workers += worker
    idToWorker(worker.id) = worker
    addressToWorker(workerAddress) = worker
    true
  }

Spark Master資源排程--worker向master註冊

Spark Master資源排程–Worker向Master註冊更多資源 github: https://github.com/opensourceteams/spark-scala-maven csdn(彙總視訊線上看): https://blog.csdn.net

Spark Master資源排程--SparkContext向所有master註冊

Spark Master資源排程–SparkContext向所有master註冊更多資源 github: https://github.com/opensourceteams/spark-scala-maven csdn(彙總視訊線上看): https://blog.

Spark原始碼分析之Master資源排程演算法原理

Master是通過schedule方法進行資源排程，告知worker啟動executor等。一schedule方法 1判斷master狀態，只有alive狀態的master才可以進行資源排程，sta

spark學習-Master資源排程分配演算法

Master資源排程分配演算法：1.Application的排程演算法有兩種，一種是spreadOutApps，另一種是非spreadOutApps。2.spreadOutApps，會將每個Application要啟動的executor都平均分配到各個worker上去。（比如

Spark的資源排程

1、緒論上圖是Spark程式執行時的一個超級簡單的概括。我們執行一個Spark應用程式時，首先第一步肯定是寫一個Spark Application應用程式，然後呼叫資源排程器為Driver

spark學習記錄（五、Spark基於資源排程管理器的提交模式）

一、Standalone（Spark自帶） 1.1 Standalone-client模式提交命令： ./spark-submit --master spark://hadoop1:7077 --class org.apache.spark.examples.Spar

Master原理剖析與原始碼分析：資源排程機制原始碼分析（schedule()，兩種資源排程演算法）

1、主備切換機制原理剖析與原始碼分析 2、註冊機制原理剖析與原始碼分析 3、狀態改變處理機制原始碼分析 4、資源排程機制原始碼分析（schedule()，兩種資源排程演算法） * Dri

Spark核心原始碼深度剖析：Master註冊機制原理剖析與原始碼分析

1.Master註冊機制原理剖析（圖解） 2.部分原始碼分析 master.scala中的Application註冊原理程式碼分析： case RegisterApplication(

Spark原始碼學習（二）---Master和Worker的啟動以及Actor通訊流程

在《Spark原始碼學習（一）》中通過Spark的啟動指令碼，我們看到Spark啟動Master的時候實際上是啟動了org.apache.spark.deploy.master.Master，下面我們就從這2個類入手，通過閱讀Spark的原始碼，瞭解Spark的啟動流程。

Spark學習(四)資源排程與任務排程的整合

文章目錄一、資源排程二、任務排程三、資源排程與任務排程整合四、粗細粒度資源排程 1、什麼是粗粒度資源排程？ 2、什麼是細粒度資源排程？一、資源排程 1、待叢集Spark叢集啟動成功後，W

Spark資源排程和任務排程

轉自：https://blog.csdn.net/lhworldblog/article/details/79300025 一、前述 Spark的資源排程是個很重要的模組，只要搞懂原理，才能具體明白Spark是怎麼執行的，所以尤其重要。自願申請的話，本文分粗粒度和細粒度模式分別介紹。

Spark-資源排程

目錄 Master中的物件資源排程流程資源排程結論影響Executor個數的因素 Master中的物件在Spark資源排程過程中，Master中有三個物件比較重要。 va

【資源排程總綱】Yarn原始碼剖析（零） --- spark任務提交到yarn的流程

前言本系列的目的在於試圖剖析spark任務提交至hadoop yarn上的整個過程，從yarn的啟動，以及spark-submit提交任務到yarn上，和在yarn中啟動任務包括yarn元件之間的通訊，用以提升自身知識儲備，記錄學習的過程為目的，由於個人能力有限文章中或許

Spark-任務排程與資源排程的整合

目錄排程流程排程流程 1.原始碼打成jar包，放到叢集上 2.提交Application,客戶端會生成一個Driver程序。 spark-submit --master --class jarPath 3.當TaskSchedul

Spark一些基礎原理——資源排程

自學知識：RDD的生命週期，DAG任務排程 lv0 在Spark中，資源排程是Master負責管理的，Worker通過註冊的形式在Master註冊相關資源。而在執行過程中，是通過sc即Driver向Master申請計算資源（Master根據叢集設定啟動不同的

27課：SPARK 執行在yarn資源排程框架 client 、cluster方式！！

分散式叢集 [email protected]:/usr/local/hadoop-2.6.0/etc/hadoop# vi /etc/hosts 127.0.0.1 localhost 192.168.189.1 master 192.168.189

spark資源排程流程總結

初學spark在Standalone模式下的資源排程機制，發現學習原始碼是理解spark一切機制的根本。現在對相關spark2.1.0原始碼的學習做個梳理。一應用程式提交時Master中對Driv

spark提交任務的模式—— standalone模式與yarn模式、資源排程與任務排程

standalone模式在客戶端提交Application，Driver在客戶端啟動；客戶端向Master申請資源，Master返回Worker節點； Driver向Worker節點發送task，監控task執行，回收結果。在客戶端提交App

Spark的資源管理和排程模式

1.Spark-standalone Standalone的模式下，spark的資源管理和排程是自己來管理和排程的，主要由master來管理。 2.Spark-yarn ResourceManager NodeManager ApplicationMaster Contai

大資料：Spark Standalone 叢集排程（二）如何建立、分配Executors的資源

Standalone 的整體架構在Spark叢集中的3個角色Client, Master, Worker, 下面的圖是Client Submit 一個任務的流程圖：完整的流程：Driver 提交任務給Master, 由Master節點根據任務的引數對進行Worker

Spark Master資源排程--worker向master註冊

Spark Master資源排程–Worker向Master註冊

更多資源

Youtube 視訊

Bilibili 視訊

Worker向Master註冊

worker傳送註冊訊息(RegisterWorker)

Master處理Worker的註冊訊息

receiveAndReply接收訊息

相關推薦