1. 程式人生 > >Spark核心概念

Spark核心概念

ont kcon 相關 font image ogr 分享圖片 行操作 spa

Spark核心概念 

  每個Spark應用都由一個驅動器程序(driver program)來發起集群上的各種 並行操作。

驅動器程序包含應用的 main 函數,並且定義了集群上的分布式數據集,還對這 些分布式數據集應用了相關操作。 ?

  驅動器程序通過一個 SparkContext 對象來訪問 Spark。這個對象代表對計算集群的一個連 接。

shell 啟動時已經自動創建了一個 SparkContext 對象,是一個叫作 sc 的變量。

  驅動器程序一般要管理多個執行器(executor)節點。

技術分享圖片

Spark核心概念