1. 程式人生 > >剖析MapReduce作業執行機制

剖析MapReduce作業執行機制

摘自《Hadoop權威指南-第4版》--- Tom White著,王海等譯 --- 7.1節 P184~P189

Hadoop執行作業時的流程大致如下

在最高層,有以下5個獨立的實體:

  • 客戶端,提交MapReduce作業。
  • YARN資源管理器,負責協調叢集上計算機資源的分配。
  • YRAN節點管理器,負責啟動和監視叢集中機器上的計算容器(container)。
  • MapReduce的application master,負責協調執行MapReduce作業的任務。它和MapReduce任務在容器中執行,這些容器由資源管理器分配並由節點管理器進行管理。
  • 分散式檔案系統(一般為HDFS),用來與其它實體間共享作業檔案。