1. 程式人生 > >MR(mapreduce)的工作原理圖解

MR(mapreduce)的工作原理圖解

二、jobClient:提交作業
JobTracker:初始化作業,分配作業,TaskTracker與其進行通訊,協調監控整個作業
TaskTracker:定期與JobTracker通訊,執行Map和Reduce任務
HDFS:儲存作業的資料、配置、jar包、結果

三、提交作業之前,需要對作業進行配置
編寫自己的MR程式
配置作業,包括輸入輸出路徑等等
提交作業
配置完成後,通過JobClient提交
具體功能
與JobTracker通訊得到一個jar的儲存路徑和JobId
輸入輸出路徑檢查
將jobj ar拷貝到的HDFS
計算輸入分片,將分片資訊寫入到job.split中
寫job.xml
真正提交作業
四、作業初始化