1. 程式人生 > >大資料BigData之hive的執行過程是怎麼樣的?(概括)

大資料BigData之hive的執行過程是怎麼樣的?(概括)

hive的執行過程,大體上是這樣的:

  1. hive 客戶端(一般是hive cli,入口類為CliDriver)把HQL翻譯成MR執行計劃(Operator樹)並序列化到 plan.xml
  2. plan.xml 上傳到hdfs上
  3. hive 客戶端新起一程序,提交MapReduce程式,其入口類為ExecDriver,ExecDriver的Mapper會在setup階段讀取plan.xml,反序列化成Operator樹結構,然後執行。