一個拖垮效能的過濾條件引發的SQL優化

阿新 • • 發佈：2018-12-27

作者介紹

黃浩：從業十年，始終專注於SQL。十年一劍，十年磨礪。3年通訊行業，寫就近3萬條SQL；5年製造行業，遨遊在ETL的浪潮；2年效能優化，厚積薄發自成一家。

在《SQL優化案例之五味雜陳》之後的若干天，開發人員來到我座位，不說話，只是端看著我，還似笑非笑。看著這詭異的一幕，從他不懷好意的神情中，隱隱感覺到一絲絲不祥之感。果真，又出現了效能問題。剎那間，我心裡瘮得慌，因為當時我曾斷言，在經過對資料模型進行大刀闊斧的優化後，效能撐個一年兩年的是沒問題的。而現在還不到一個月的時間，就在開發人員痴痴的笑聲中被啪啪啪打臉了。

是福不是禍，是禍躲不過

我故作鎮定地與開發做了一番交談：

“是突然變慢了嗎？”

此時，我希望是執行計劃變化引發的效能問題。

“是的。”

開發人員的回答讓我稍稍輕鬆了下，但是他接下來的描述如同一盆冷水，又澆滅了我剛剛點燃的星星火苗

“這次是增加了活動流過濾條件，就變慢了。之前的條件還是蠻快的。”

……….哎，被赤裸裸地調戲了一番呀。

找開發人員拿到了SQL，如下：

SQL

這個SQL我是相當的熟悉了，根據開發人員的說法，只是比之前的SQL多了一個過濾條件：

AND (T1.TASKLOWIDS IN (18061000))

這個非常簡單的過濾條件居然會有如此大的魔力，將我千辛萬苦優化的SQL，輕而易舉地讓效能從2秒變成了90秒，不僅打回原形，還“變本加厲”了。面對如此赤裸裸的挑釁，也激發了我的應戰情緒。

沉著冷靜，從容不迫

在展開分析之前，結合之前的優化過程，我梳理了下思路：

這次效能問題特徵很明顯：由一個過濾條件引發的效能問題；
增加一個過濾條件，正常情況下對效能的影響不會太大，但是可能會對執行計劃產生一系列影響，比如如果該過濾欄位有索引，很可能會將之前的TABLE ACESS FULL變成INDEX RANGE SCAN，繼而，其與其他表的關聯方式會從之前的NESTED LOOP變成HASH JOIN。

因此，我初步判定這個條件過濾引發了執行計劃的變化，為了印證我的判定，我對比了執行計劃，如下：

我先來看下帶有TASK_FLOW_ID條件的執行計劃

簡單解讀如下：

驅動表是SDS_DU_TF_RELEASE_T，該表的訪問方式是TABLE ACCESS BY INDEX ROWID，因為在該表上，分別在欄位TASK_FLOW_ID和PROJECT_NUMBER上建立了索引，所以ORACLE優化器選擇了兩個索引BITMAP AND操作。需要注意的是，此時出現的索引SDS_SDS_DU_TF_RELEASE_TFID_I正是因為過濾條件AND (T1.TASKLOWIDS IN (18061000)) 引起的；

SQL中的主體表RP_PLAN_LOG_T的訪問方式是TABLE ACESS BY LOCAL INDEX ROWID，被訪問的索引是INX_OPERATETIME_PROJECTNUMBER，即過濾條件中PROJECT_NUMBER和OPERATE_TIME的欄位組合索引。由於OPERATE_TIME命中的是多個分割槽，所以最終是PARTITION RANGE ITERATOR；
結果1和結果2兩個集合通過DU_IID做了HASH JOIN。

接下來我們看看沒有TASK_FLOW_ID過濾條件的執行計劃：

驅動表為SQL中的主體表RP_PLAN_LOG_T，訪問方式是TABLE ACESS BY LOCAL INDEX ROWID，被訪問的索引是INX_OPERATETIME_PROJECTNUMBER，即過濾條件中PROJECT_NUMBER和OPERATE_TIME的欄位組合索引。由於OPERATE_TIME命中的是多個分割槽，所以最終是PARTITION RANGE ITERATOR；
SDS_DU_TF_RELEASE_T，該表的訪問方式是TABLE ACCESS BY INDEX ROWID；
結果集1和結果集2通過DU_IID，進行了NESTED LOOPS關聯。

不比不知道，一比嚇一跳

通過上述對比，我們發現：

RP_PLAN_LOG_T的訪問方式是沒有變化的，前後都是：

驅動表發生了變化，沒有TASK_FLOW_ID過濾條件時，驅動表為RP_PLAN_LOG_T表。而後變成了SDS_DU_TF_RELEASE_T
RP_PLAN_LOG_T與SDS_DU_TF_RELEASE_T的關聯方式也發生了變化，沒有TASK_FLOW_ID過濾條件時，關聯方式為NESTED LOOPS，而後變成了HASH JOIN

至此，我的心情有些失落。一開始，我是做了打一場大戰硬戰的準備，而這場戰鬥才剛開始，就似乎要結束了。這個起初“山雨欲來風滿樓，劍拔弩張馬齊嘶”的效能問題突然變成了一個非常常見又平常的案例：由一個查詢條件引發了執行計劃變化，從而導致了效能問題。而此類問題的藥方也通用：干擾Oracle優化器。比如這次的方案，可以通過HINT，或者LEADING指定驅動表，或者NO_INDEX強制不使用TASK_FLOW_ID的索引，或者USE_NL指定關聯方式。

水落石未出，疑雲層層來

該案例的優化工作就這樣在大起大落中平淡收場了。然而，有兩個問題並沒有隨著優化結束而水落石出，其一是為何增加了一個過濾條件會引發執行計劃變化？其二是為何RP_PLAN_LOG_T做驅動表的效能會高？尤其是第二個問題，要知道，RP_PLAN_LOG_T通過PROJECT_NUMBER和OPERATE_TIME綜合過濾後，其資料量達到了百萬級，是資料量最大的結果集，這明顯有違小表驅動的基本原理。

剝開第一層疑雲

我們先看看第一個問題，這個問題相對簡單。為了弄清這個問題，我們首先要看看SDS_DU_TF_RELEASE_T的模型結構，在該SQL中，關於這個表的關鍵欄位有三個欄位，分別是DU_IID、TASK_FLOW_ID、PROJECT_NUMBER。三者之間的關係如下：

從PROJECT_NUMBER—>TASK_FLOW_ID—>DU_IID，資料粒度越來越細，所以當TASK_FLOW_ID作為了過濾條件，Oracle就認為可以過濾掉大量的資料，而且TASK_FLOW_ID上又存在索引，從而認定可以作為驅動表。

剝開第二層疑雲

現在重點看看第二個問題：為何RP_PLAN_LOG_T做驅動表的效能會高？

帶著這個疑問，為了便於說明，我們簡化下這個SQL，砍掉枝枝葉葉，只保留RP_PLAN_LOG_T這個“孤家寡人”，同時我們也略作改動，即將ORDER BY的欄位由OPERATE_TIME修改為CDESCRIPTOIN。如下：

SQL

其中RP_PLAN_LOG_T的表結構如下：

表的索引如下：

執行計劃如下：

索引還是那個索引，表還是那個表，只是SORT ORDER BY STOPKEY不見了，成本降低了，執行效率達到了毫秒級。

辯論時刻

這裡，有一個大寫的疑問：明明是ORDER BY OPERATE_TIME，為何在執行計劃裡面沒有SORT ORDER BY STOPKEY步驟了？難道是Oracle優化器的BUG？此時，你會不會因為發現了Oracle的BUG而歡呼雀躍？很遺憾的告訴你，這並非Oracle的BUG，反而是Oracle優化器的高明之處。

索引的特性之一就是有序，我們先通過OPERATE_TIME欄位上的索引獲取到了有序的OPERATE_TIME（及其對應的ROWID），以此為基礎，通過TABLE ACCESS BY LOCAL INDEX ROWID獲取其它欄位資訊，這樣得到的結果集自然是已經按照OPERATE_TIME排好序的有序結果：

請問，這還需要“教條”般的再次排序嗎？

除了大寫的疑問外，還有一個小寫的疑問：不考慮排序，同樣的查詢條件，同樣的索引掃描，為何成本差異如此之大？在無SORT的情況下，INDEX RANGE SCAN的COST值為11，而如果進行了SORT，COST值為1910。

難道是SORT會影響到INDEX RANGE SCAN的成本？事實上ORACLE引擎是先執行INDEX RANGE SCAN，再執行SORT，也只能是：INDEX RANGE SCAN的結果集會影響到SORT的成本，因為INDEX RANGE SCAN的結果集越大，SORT的成本會越高。

那麼，這裡面到底發生了什麼呢？還得要從根本說起：在正常情況下，我們如果想要獲取前N條資料，就必須要按照既定欄位排序，那就意味著我們首先要獲取到全部的資料；但是，如果我們拿到的是已經按照既定欄位排好序的資料，那麼就可以直接獲取前N條資料，而無需獲取全部資料。這就是同樣是INDEX RANGE SCAN，而COST相距甚遠的玄妙所在。

這個猜想也是可以在執行計劃中得到印證：就是INDEX RANGE SCAN這步操作的實際返回ROWS，如下：

看到這裡，你是否會有些小激動？因為你發現：在排序欄位上建立一個索引，就能將分頁時排序產生的效能開銷幻滅於無形。其實並非絕對。為了印證，我們繼續以上述案例為例舉證。

在RP_PLAN_LOG_T表中，欄位PLAN_LOG_ID的值由序列號填充，並且在上面建立了UNIQUE INDEX：

現在，我們將ORDER BY的欄位由OPERATE_TIME修改為PLAN_LOG_ID，我們來看看執行計劃：

嘿，還真如我們所料：利用了索引資料有序的特性，COST也相當得低。

是真實的效能呢？通過SQL*MONITOR，我們發現耗時竟達66S。

其中IO等待耗時54S，為何？原來這個執行計劃實際載入了45M的資料量，這個就是全表的資料量。

由此可見，理想是豐滿的，而現實卻一地排骨。利用索引資料有序的特性做分頁排序，是要講究緣分的，可遇而不可求。必須要滿足如下兩個條件：

排序欄位上必須要建有（字首）索引；
在多表關聯的SQL中，排序欄位所在表，必須為執行計劃中的驅動表

否則，反而事與願違適得其反。

化腐朽為神奇，以四兩撥千斤

至此，為何RP_PLAN_LOG_T做驅動表的效能會高？這個問題就迎刃而解了。

我們再次通過SQL*MONITOR來回顧下執行計劃：

表面上，我們看到的是通過PROJECT_NUMBER和OPERATE_TIME過濾後的結果集多大170萬，而事實上，Oracle優化器巧妙的利用了OPERATE_TIME索引欄位的排序：

只獲取了15條記錄，用這15條記錄來驅動，即便千萬級集合，也會是彈指一揮間；
省卻了龐大結果集排序的開銷，SORT的COST灰飛煙滅

文章來自微信公眾號：DBAplus社群

一個拖垮效能的過濾條件引發的SQL優化

作者介紹黃浩：從業十年，始終專注於SQL。十年一劍，十年磨礪。3年通訊行業，寫就近3萬條SQL；5年製造行業，遨遊在ETL的浪潮；2年效能優化，厚積薄發自成一家。在《SQL優化案例之五味雜陳》之後的若干天，開發人員來到我座位，不說話，只是端看著我，還似笑非笑。看著這詭異的一幕，從他不懷好意的神情

一個跨庫複雜查詢的SQL優化的案例

導讀為了幫客戶出一個報表，需要跨三個庫進行一個複雜的查詢，用到了 in，union all，left join等關鍵字，其中幾個欄位還需要進行SUM，Count等計算。未優化前查詢耗時368秒。待優化場景先看一下客戶程式設計師寫的這個複雜的SQL語句吧，看了都頭大

在模糊查詢中過濾容易引發SQL語句執行異常的符號

比如在A表中的USERID中有admin% 和admin這2個帳號。用模糊查詢出包含%的帳號語句如下 SELECT A. USERID FROM A WHERE　A. USERID LIKE '%輸入的查詢字元%' 如果“輸入的查詢字元”為 “%” 執行語句後會同

一個執行計劃異常變更引發的Oracle效能診斷優化

作者介紹 bisal，Oracle技術愛好者。利用業餘時間學習並通過了SCJP1.4、Oracle 10g/11g OCP、Oracle 11g OCM認證，國內首批加入Oracle YEP的成員。訂閱號：bisal的個人雜貨鋪。最近有一個OLTP應用使用的Oracle資料庫突然出現效能問題，DB

【語法】SQL中的case when then else end用法-解決一個字段根據條件取不同值

where 運行 pos 功能 enter cnblogs logs wro img Case具有兩種格式。簡單Case函數和Case搜索函數。 --簡單Case函數 CASE sex WHEN ‘1‘ THEN ‘男‘ WHEN

工作總結 sql 中過濾條件中的 (where中的) and

sts 如果 9.png 聯系 .com 處理 src 分享圖片 http 總結：在where 後面做過濾的時候如果有字段1 必須滿足某種值字段2 要滿足某種或某值的時候直接 and 字段1 = ‘a’ an

SQL一次性查詢一個字段不同條件下的統計結果

類型 bubuko detail 根據 ron tps AI AS HERE 參考了一下這篇文章：https://blog.csdn.net/xichenguan/article/details/51764100 ，感謝原作者有兩個表，分別存放了【操作員】和【單據】，要

Mybatis plus中一個框多條件查詢 SQL拼接

條件查詢 filter array ryu toc suse return 多條 pen 遇到多條件查詢時，只用框架自帶的方法搞不定，只能自己寫方法拼接 EntityWrapper<YcejShopEntity> wrapper = new EntityWra

SQL server 使用內聯結(INNER JOIN) 聯結多個表（以及過濾條件 WHERE, AND使用區別）

INNER JOIN ……ON的語法格式： FROM (((表1 INNER JOIN 表2 ON 表1.欄位號=表2.欄位號) INNER JOIN 表3 ON 表1.欄位號=表3.欄位號) INNER JOIN 表4 ON Member.欄位號=表4.欄位號) INNER JOIN 表X ON

面試被問之-----sql優化中in與exists的區別 Mysql中 in or exists not exists not in區別（網路整理） Sql語句中IN和exists的區別及應用 [筆記] SQL效能優化 - 避免使用 IN 和 NOT IN

曾經一次去面試,被問及in與exists的區別,記得當時是這麼回答的:''in後面接子查詢或者(xx,xx,xx,,,),exists後面需要一個true或者false的結果",當然這麼說也不算錯,但別人想聽的是sql優化相關,肯定是效率的問題,只是那個時候確實不知道它們在sql優化上的區別,只知道用in會進

一個拖垮效能的過濾條件引發的SQL優化

一個拖垮效能的過濾條件引發的SQL優化

一個跨庫複雜查詢的SQL優化的案例

在模糊查詢中過濾容易引發SQL語句執行異常的符號

一個執行計劃異常變更引發的Oracle效能診斷優化

【語法】SQL中的case when then else end用法-解決一個字段根據條件取不同值

工作總結 sql 中過濾條件中的 (where中的) and

SQL一次性查詢一個字段不同條件下的統計結果

Mybatis plus中一個框多條件查詢 SQL拼接

SQL server 使用內聯結(INNER JOIN) 聯結多個表（以及過濾條件 WHERE, AND使用區別）

面試被問之-----sql優化中in與exists的區別 Mysql中 in or exists not exists not in區別（網路整理） Sql語句中IN和exists的區別及應用 [筆記] SQL效能優化 - 避免使用 IN 和 NOT IN

【MySql】Sql優化（二）——影響效能的因素

分享一個基於小米 soar 的開源 sql 分析與優化的 WEB 圖形化工具

SQL筆記二：過濾條件欄位多個取值、模糊匹配和兩個值之間取值、去重

【Sql Server】使用觸發器把一個表中滿足條件的資料部分欄位插入到另一個表中

高階SQL優化(二) ——《12年資深DBA教你Oracle開發與優化——效能優化部分》

記錄一個sql優化後大大提高查詢效率的情形

關於SQL語句外連線中的過濾條件

Oracle效能優化之高階SQL優化(一)

高階SQL優化(三) 常用優化工具 ——《12年資深DBA教你Oracle開發與優化——效能優化部分》

高階SQL優化(一) ——《12年資深DBA教你Oracle開發與優化——效能優化部分》

一個拖垮效能的過濾條件引發的SQL優化

相關推薦