1. 程式人生 > >Hive中SQL查詢轉MapReduce作業過程------學習筆記

Hive中SQL查詢轉MapReduce作業過程------學習筆記

說明:

當啟動MapReduce程式時,Hive本身是不會生成MapReduce演算法程式的
需要通過一個表示“Job執行計劃”的XML檔案驅動執行內建的、原生的Mapper和Reducer模組
Hive通過和JobTracker通訊來初始化MapReduce任務,不必直接部署在JobTracker所在的管理節點上執行
通常在大型叢集上,會有專門的閘道器機來部署Hive工具。閘道器機的作用主要是遠端操作和管理節點上的JobTracker通訊來執行任務
資料檔案通常儲存在HDFS上,HDFS由名稱節點管理