Oracle的優化器Optimizer詳解
阿新 • • 發佈:2019-01-02
Oracle在執行一個SQL之前,首先要分析一下語句的執行計劃,然後再按執行計劃去執行。分析語句的執行計劃的工作是由優化器(Optimizer)來完成的。不同的情況,一條SQL可能有多種執行計劃,但在某一時點,一定只有一種執行計劃是最優的,花費時間是最少的。
相信你一定會用Pl/sql Developer、Toad等工具去看一個語句的執行計劃,不過你可能對Rule、Choose、First rows、All rows這幾項有疑問,因為我當初也是這樣的,那時我也疑惑為什麼選了以上的不同的項,執行計劃就變了?
1、優化器的優化方式
Oracle的優化器共有兩種的優化方式,即基於規則的優化方式(Rule-Based Optimization,簡稱為RBO)和基於代價的優化方式(Cost-Based Optimization,簡稱為CBO)。
A、RBO方式:優化器在分析SQL語句時,所遵循的是Oracle內部預定的一些規則。比如我們常見的,當一個where子句中的一列有索引時去走索引。
B、CBO方式:依詞義可知,它是看語句的代價(Cost)了,這裡的代價主要指Cpu和記憶體。優化器在判斷是否用這種方式時,主要參照的是表及索引的統計資訊。統計資訊給出表的大小 、有少行、每行的長度等資訊。這些統計資訊起初在庫內是沒有的,是你在做analyze後才出現的,很多的時侯過期統計資訊會令優化器做出一個錯誤的執行計劃,因些我們應及時更新這些資訊。在Oracle8及以後的版本,Oracle列推薦用CBO的方式。
我們要明瞭,不一定走索引就是優的 ,比如一個表只有兩行資料,一次IO就可以完成全表的檢索,而此時走索引時則需要兩次IO,這時對這個表做全表掃描(full table scan)是最好的。
新版本的oracle逐漸拋棄對Rule方式的支援,即使是Rule方式,最後sql執行效率的衡量標準都是,sql執行消耗了多少資源?對代價(COST)的優化方式,需要表,索引的統計資訊,需要每天多表和索引進行定時的分析,但是統計資訊也是歷史的,有時候也不一定是最優的,統計資訊等於就是一個人的經驗,根據以前的經驗來判斷sql該怎麼執行(得到優化的sql執行路徑),所以具體優化執行的時候,先手工分析sql,看是用RBO方式消耗大,還是CBO消耗大;DBA的工作就是要根據當前oracle的執行日誌,進行各種調整,使當前的oracle執行效率儘量達到最優.可以在執行期間,採用hint靈活地採用優化方式.
2、優化器的優化模式(Optermizer Mode)
優化模式包括Rule,Choose,First rows,All rows這四種方式,也就是我們以上所提及的。如下我解釋一下:
Rule:不用多說,即走基於規則的方式。 (RBO優化方式)
Choolse:這是我們應觀注的,預設的情況下Oracle用的便是這種方式。指的是當一個表或或索引有統計資訊,則走CBO的方式,如果表或索引沒統計資訊,表又不是特別的小,而且相應的列有索引時,那麼就走索引,走RBO的方式。
在預設情況下,ORACLE採用CHOOSE優化器,為了避免那些不必要的全表掃描(full table scan),你必須儘量避免使用CHOOSE優化器,而直接採用基於規則或者基於成本的優化器。
First Rows:它與Choose方式是類似的,所不同的是當一個表有統計資訊時,它將是以最快的方式返回查詢的最先的幾行,從總體上減少了響應時間。 (CBO優化方式,提供一個最快的反應時間,根據系統的需求,使用情況)
All Rows:也就是我們所說的Cost的方式,當一個表有統計資訊時,它將以最快的方式返回表的所有的行,從總體上提高查詢的吞吐量。沒有統計資訊則走基於規則的方式。 (CBO優化方式,提供最大的吞吐量,就是使執行總量達到最大) [Page]
First Rows和All Rows是有衝突的.如果想最快第返回給使用者,就不可能傳遞更多的結果,這就是First Rows返回最先檢索到的行(或記錄);而All Rows是為了儘量將所有的結果返回給使用者,由於量大,使用者就不會很快得到返回結果.就象空車能跑得很快,重灌車只能慢慢地跑;
3、如何設定選用哪種優化模式
a、Instance級別
我們可以通過在init<SID>.ora檔案中設定OPTIMIZER_MODE=RULE、OPTIMIZER_MODE=CHOOSE、OPTIMIZER_MODE=FIRST_ROWS、OPTIMIZER_MODE=ALL_ROWS去選用3所提的四種方式,如果你沒設定OPTIMIZER_MODE引數則預設用的是Choose這種方式。
init.ora和init<SID>.ora都在$ORACLE_HOME/dbs目錄下,可以用find $ORACLE_HOME -name init*.ora檢視該目錄下的init檔案.
init.ora是對全體例項有效的;init<SID>.ora只對指定的例項有效.
B、Sessions級別
通過SQL> ALTER SESSION SET OPTIMIZER_MODE=<Mode>;來設定。 將覆蓋init.ora,init<sid>.ora設定的優化模式,也可以在sql語句中採用hint強制選定優化模式.如下:
C、語句級別
這些需要用到Hint,比如:
SQL> SELECT /*+ RULE */ a.userid,
2 b.name,
3 b.depart_name
4 FROM tf_f_yhda a,
5 tf_f_depart b
6 WHERE a.userid=b.userid;
在這兒採用hint,強制採用基於規則(rule)的優化模式;
hint語法,/*+開頭,*/結尾,中間填寫強制採用的優化模式.
4、為什麼有時一個表的某個欄位明明有索引,當觀察一些語的執行計劃確不走索引呢?如何解決呢 ?
A、不走索引大體有以下幾個原因
♀你在Instance級別所用的是all_rows的方式
♀你的表的統計資訊(最可能的原因)
♀你的表很小,上文提到過的,Oracle的優化器認為不值得走索引。
B、解決方法
♀可以修改init<SID>.ora中的OPTIMIZER_MODE這個引數,把它改為Rule或Choose,重起資料庫。也可以使用4中所提的Hint.
♀刪除統計資訊
SQL>analyze table table_name delete statistics;
♀表小不走索引是對的,不用調的。
5、其它相關
A、如何看一個表或索引是否是統計資訊
SQL>SELECT * FROM user_tables 2 WHERE table_name=<table_name>
3 AND num_rows is not null;
SQL>SELECT * FROM user_indexes
2 WHERE table_name=<table_name>
3 AND num_rows is not null;
b、如果我們先用CBO的方式,我們應及時去更新表和索引的統計資訊,以免生形不切合實的執行計劃。
SQL> ANALYZE TABLE table_name COMPUTE STATISTICS;
SQL> ANALYZE INDEX index_name ESTIMATE STATISTICS;
相信你一定會用Pl/sql Developer、Toad等工具去看一個語句的執行計劃,不過你可能對Rule、Choose、First rows、All rows這幾項有疑問,因為我當初也是這樣的,那時我也疑惑為什麼選了以上的不同的項,執行計劃就變了?
1、優化器的優化方式
Oracle的優化器共有兩種的優化方式,即基於規則的優化方式(Rule-Based Optimization,簡稱為RBO)和基於代價的優化方式(Cost-Based Optimization,簡稱為CBO)。
A、RBO方式:優化器在分析SQL語句時,所遵循的是Oracle內部預定的一些規則。比如我們常見的,當一個where子句中的一列有索引時去走索引。
B、CBO方式:依詞義可知,它是看語句的代價(Cost)了,這裡的代價主要指Cpu和記憶體。優化器在判斷是否用這種方式時,主要參照的是表及索引的統計資訊。統計資訊給出表的大小 、有少行、每行的長度等資訊。這些統計資訊起初在庫內是沒有的,是你在做analyze後才出現的,很多的時侯過期統計資訊會令優化器做出一個錯誤的執行計劃,因些我們應及時更新這些資訊。在Oracle8及以後的版本,Oracle列推薦用CBO的方式。
我們要明瞭,不一定走索引就是優的 ,比如一個表只有兩行資料,一次IO就可以完成全表的檢索,而此時走索引時則需要兩次IO,這時對這個表做全表掃描(full table scan)是最好的。
新版本的oracle逐漸拋棄對Rule方式的支援,即使是Rule方式,最後sql執行效率的衡量標準都是,sql執行消耗了多少資源?對代價(COST)的優化方式,需要表,索引的統計資訊,需要每天多表和索引進行定時的分析,但是統計資訊也是歷史的,有時候也不一定是最優的,統計資訊等於就是一個人的經驗,根據以前的經驗來判斷sql該怎麼執行(得到優化的sql執行路徑),所以具體優化執行的時候,先手工分析sql,看是用RBO方式消耗大,還是CBO消耗大;DBA的工作就是要根據當前oracle的執行日誌,進行各種調整,使當前的oracle執行效率儘量達到最優.可以在執行期間,採用hint靈活地採用優化方式.
2、優化器的優化模式(Optermizer Mode)
優化模式包括Rule,Choose,First rows,All rows這四種方式,也就是我們以上所提及的。如下我解釋一下:
Rule:不用多說,即走基於規則的方式。 (RBO優化方式)
Choolse:這是我們應觀注的,預設的情況下Oracle用的便是這種方式。指的是當一個表或或索引有統計資訊,則走CBO的方式,如果表或索引沒統計資訊,表又不是特別的小,而且相應的列有索引時,那麼就走索引,走RBO的方式。
在預設情況下,ORACLE採用CHOOSE優化器,為了避免那些不必要的全表掃描(full table scan),你必須儘量避免使用CHOOSE優化器,而直接採用基於規則或者基於成本的優化器。
First Rows:它與Choose方式是類似的,所不同的是當一個表有統計資訊時,它將是以最快的方式返回查詢的最先的幾行,從總體上減少了響應時間。 (CBO優化方式,提供一個最快的反應時間,根據系統的需求,使用情況)
All Rows:也就是我們所說的Cost的方式,當一個表有統計資訊時,它將以最快的方式返回表的所有的行,從總體上提高查詢的吞吐量。沒有統計資訊則走基於規則的方式。 (CBO優化方式,提供最大的吞吐量,就是使執行總量達到最大) [Page]
First Rows和All Rows是有衝突的.如果想最快第返回給使用者,就不可能傳遞更多的結果,這就是First Rows返回最先檢索到的行(或記錄);而All Rows是為了儘量將所有的結果返回給使用者,由於量大,使用者就不會很快得到返回結果.就象空車能跑得很快,重灌車只能慢慢地跑;
3、如何設定選用哪種優化模式
a、Instance級別
我們可以通過在init<SID>.ora檔案中設定OPTIMIZER_MODE=RULE、OPTIMIZER_MODE=CHOOSE、OPTIMIZER_MODE=FIRST_ROWS、OPTIMIZER_MODE=ALL_ROWS去選用3所提的四種方式,如果你沒設定OPTIMIZER_MODE引數則預設用的是Choose這種方式。
init.ora和init<SID>.ora都在$ORACLE_HOME/dbs目錄下,可以用find $ORACLE_HOME -name init*.ora檢視該目錄下的init檔案.
init.ora是對全體例項有效的;init<SID>.ora只對指定的例項有效.
B、Sessions級別
通過SQL> ALTER SESSION SET OPTIMIZER_MODE=<Mode>;來設定。 將覆蓋init.ora,init<sid>.ora設定的優化模式,也可以在sql語句中採用hint強制選定優化模式.如下:
C、語句級別
這些需要用到Hint,比如:
SQL> SELECT /*+ RULE */ a.userid,
2 b.name,
3 b.depart_name
4 FROM tf_f_yhda a,
5 tf_f_depart b
6 WHERE a.userid=b.userid;
在這兒採用hint,強制採用基於規則(rule)的優化模式;
hint語法,/*+開頭,*/結尾,中間填寫強制採用的優化模式.
4、為什麼有時一個表的某個欄位明明有索引,當觀察一些語的執行計劃確不走索引呢?如何解決呢 ?
A、不走索引大體有以下幾個原因
♀你在Instance級別所用的是all_rows的方式
♀你的表的統計資訊(最可能的原因)
♀你的表很小,上文提到過的,Oracle的優化器認為不值得走索引。
B、解決方法
♀可以修改init<SID>.ora中的OPTIMIZER_MODE這個引數,把它改為Rule或Choose,重起資料庫。也可以使用4中所提的Hint.
♀刪除統計資訊
SQL>analyze table table_name delete statistics;
♀表小不走索引是對的,不用調的。
5、其它相關
A、如何看一個表或索引是否是統計資訊
SQL>SELECT * FROM user_tables 2 WHERE table_name=<table_name>
3 AND num_rows is not null;
SQL>SELECT * FROM user_indexes
2 WHERE table_name=<table_name>
3 AND num_rows is not null;
b、如果我們先用CBO的方式,我們應及時去更新表和索引的統計資訊,以免生形不切合實的執行計劃。
SQL> ANALYZE TABLE table_name COMPUTE STATISTICS;
SQL> ANALYZE INDEX index_name ESTIMATE STATISTICS;