hive ：簡單查詢不走mapreduce

阿新 • • 發佈：2018-10-31

在hadoop生態圈中屬於資料倉庫的角色。他能夠管理hadoop中的資料，同時可以查詢hadoop中的資料。
本質上講，hive是一個SQL解析引擎。Hive可以把SQL查詢轉換為MapReduce中的job來執行。
hive有一套對映工具，可以把SQL轉換為MapReduce中的job，可以把SQL中的表、欄位轉換為HDFS中的檔案(夾)以及檔案中的列。
這套對映工具稱之為metastore，一般存放在derby、mysql中。

hive在hdfs中的預設位置是/user/hive/warehouse，是由配置檔案hive-conf.xml中屬性hive.metastore.warehouse.dir決定的。

hive 0.10.0為了執行效率考慮，簡單的查詢，就是隻是select，不帶count,sum,group by這樣的，都不走map/reduce，直接讀取hdfs檔案進行filter過濾。

這樣做的好處就是不新開mr任務，執行效率要提高不少，但是不好的地方就是使用者介面不友好，有時候資料量大還是要等很長時間，但是又沒有任何返回。

1、本地模式下，hive可以簡單的讀取目錄路徑下的資料，然後輸出格式化後的資料到控制檯，比如有本地員工employee，當執行 select * from employee 時，直接將檔案中資料格式化輸出。
2、查詢語句中的過濾條件只是分割槽欄位的情況下不會進行Mapreduce。

設定：
在hive-site.xml裡面有個配置引數叫

hive.fetch.task.conversion = more

將這個引數設定為more，簡單查詢就不走map/reduce了，設定為minimal，就任何簡單select都會走map/reduce。

hive ：簡單查詢不走mapreduce

hive ：簡單查詢不走mapreduce

Hive：簡單查詢不啟用Mapreduce job而啟用Fetch task

Hive select 過程中不走mapreduce，join記憶體溢位

oracle 查詢不走索引的範例分析

Update關聯查詢不走索引，效率低下

MySql的簡單查詢不等於，NULL

hive：條件查詢、join關聯查詢、分組聚合、子查詢

Hive快捷查詢：不啟用Mapreduce job啟用Fetch task三種方式介紹

海量數據查詢關系型數據庫存儲大數據，要點就是：簡單存儲、分區分表、高效索引、批量寫入

Oracle：簡單分析火車票餘票查詢和座位剩餘

JS：dataTable查詢/重新整理後不返回首頁

前端程式設計師市場分析：前有狼，後有虎，走還是不走？

網路協議 12 - HTTP 協議：常用而不簡單

es：實現查詢某個欄位為固定值，另一個欄位必須不能存在

學大偉業：如果競賽不考好，只能裸考走到黑

前端程序員市場分析：前面是火海，後面是刀山，走還是不走？

清華學生被面試官吐槽：簡單的演算法問題都不知道，清華的就這水平

二分查詢變形記：從迴圈不變數說起

SQL錯誤排查：子查詢返回的值不止一個。子查詢用作表示式時，這種情況是不允許的...

MapReduce：超大機群上的簡單資料處理- [Google MapReduce]·中譯本

hive ：簡單查詢不走mapreduce

相關推薦