Hive SQL查詢引數優化

阿新 • • 發佈：2020-12-09

【引數一】 hive.fetch.task.conversion 決定sql查詢是否以叢集模式執行

查詢sql ：
select trans_params,trans_result from ods.tablename where trans_code=‘CF000078’ limit 10
耗時很長，期間沒有走叢集，檢視日誌查詢會fetch HDFS每日資料分割槽

檢視該引數值為more：
在這裡插入圖片描述

檢視執行計劃：

explain select trans_params,trans_result from ods.tablename  where
trans_code= 
'CF000078' limit 10;

在這裡插入圖片描述
可見只有一個stage，即Fetch Operator，只進行HDFS對應目錄下資料的抓取。

hive中可以通過引數控制查詢是否走叢集：
hive.fetch.task.conversion=more時，全域性查詢，欄位查詢，filter查詢（如id>1），limit查詢等都不走叢集，直接fetch，建議在資料量小時使用fetch。
當hive.fetch.task.conversion=none時，關閉fetch task優化，所有查詢都會以叢集模式執行。

【引數二】 hive.compute.query.using.stats 統計sql查詢結果是否從統計資訊中獲取

當hive.compute.query.using.stats=false時，select count(*) from直接從元資料儲存的統計資訊中獲取表中記錄條數；

ANALYZE TABLE wktest.test_decimal  COMPUTE STATISTICS;

在這裡插入圖片描述
如上圖所示，numRows=4，即該表元資料統計資訊中已記錄條數為4。

當hive.compute.query.using.stats=true時，該sql查詢會以叢集模式執行返回結果。
說明：當向表中以hadoop fs -put的方式上傳資料檔案時，直接從元資料無法獲取到最新的表記錄條數。

Hive SQL查詢引數優化

Hive SQL查詢引數優化

20條Tips：高效能SQL查詢，優化取數速度方案轉載 https://ithelp.ithome.com.tw/articles/10213001

(轉)SQL 查詢效率優化原則

MySQL 常用30種SQL查詢語句優化方法

MySQL千萬級大資料SQL查詢優化知識點總結

30個mysql千萬級大資料SQL查詢優化技巧詳解

必備 SQL 查詢優化技巧提升網站訪問速度

mysql 優化 sql查詢優化

實戰5：如何優化你的SQL查詢

Hive SQL 優化面試題整理

優化介面效能 - 單表優化sql查詢語句

看看PHP大神是如何對900W+的資料表的SQL 查詢優化分析的

一次SQL查詢優化原理分析（900W+資料，從17s到300ms）

shell實操1-在shell指令碼內連線hive做sql查詢

oracle 查null或空字串；根據引數順序查詢；exists 使用；sql 查詢時固定一列，到java 後臺資料型別為Character

mongotemplate 查詢子文件_Oracle之SQL查詢突破效能瓶頸的引數

QueryWrapper.in幾種查詢方式QueryWrapper.in查詢不準優化結果，如何使用QueryWrapper.in的SQL查詢幾種方式講解

SQL查詢時，引數個數不定時，自動過濾select語句where

優化SQL 查詢效能

大資料開發之Hive SQL優化思路分享

Hive SQL查詢引數優化

相關推薦