1. 程式人生 > >SQL語句優化淺談

SQL語句優化淺談

一、操作符優化  

1、IN 操作符   

  用IN寫出來的SQL的優點是比較容易寫及清晰易懂,這比較適合現代軟體開發的風格。但是用IN的SQL效能總是比較低的,從Oracle執行的步驟來分析用IN的SQL與不用IN的SQL有以下區別:  

  ORACLE試圖將其轉換成多個表的連線,如果轉換不成功則先執行IN裡面的子查詢,再查詢外層的表記錄,如果轉換成功則直接採用多個表的連線方式查詢。由此可見用IN的SQL至少多了一轉換的過程。一般的SQL都可以轉換成功,但對於含有分組統計等方面的SQL就不能轉換了。  

  推薦方案:在業務密集的SQL當中儘量不採用IN操作符,用EXISTS 方案代替。  

EXISTS表示存在,與in類似,如下兩句意思一致:

2、NOT IN操作符   

  此操作是強列不推薦使用的,因為它不能應用表的索引。   

  推薦方案:用NOT EXISTS 方案代替

3、IS NULL 或IS NOT NULL操作  

  判斷欄位是否為空一般是不會應用索引的,因為索引是不索引空值的。  

  推薦方案:用其它相同功能的操作運算代替,如:a is not null 改為 a>0 a>’’等。不允許欄位為空,而用一個預設值代替空值,如申請中狀態欄位不允許為空,預設為申請。

4、> 及 < 操作符

  大於或小於操作符一般情況下是不用調整的,因為它有索引就會採用索引查詢,但有的情況下可以對它進行優化,如一個表有100萬記錄,一個數值型欄位A,30萬記錄的A=0,30萬記錄的A=1,39萬記錄的A=2,1萬記錄的A=3。那麼執行A>2與A>=3的效果就有很大的區別了,因為A>2

ORACLE會先找出為2的記錄索引再進行比較,而A>=3ORACLE則直接找到=3的記錄索引。   

5、LIKE操作符   

  LIKE操作符可以應用萬用字元查詢,裡面的萬用字元組合可能達到幾乎是任意的查詢,但是如果用得不好則會產生效能上的問題,如LIKE ‘%5400%’ 這種查詢不會引用索引,而LIKE ‘X5400%’則會引用範圍索引。   

一個實際例子:用YW_YHJBQK表中營業編號後面的戶標識號可來查詢營業編號YY_BH LIKE ‘%5400%’ 這個條件會產生全表掃描,如果改成YY_BH LIKE ’X5400%’ OR YY_BH LIKE ’B5400%’ 則會利用YY_BH的索引進行兩個範圍的查詢,效能肯定大大提高。

  

推薦方案:儘量縮小查詢範圍,提高速度;

6、UNION操作符

UNION 操作符用於合併兩個或多個 SELECT 語句的結果集。請注意,UNION 內部的 SELECT 語句必須擁有相同數量的列。列也必須擁有相似的資料型別。同時,每條 SELECT 語句中的列的順序必須相同。

  UNION在進行錶鏈接後會篩選掉重複的記錄,所以在錶鏈接後會對所產生的結果集進行排序運算,刪除重複的記錄再返回結果。實際大部分應用中是不會產生重複的記錄,最常見的是過程表與歷史表UNION。如:

  select *from gc_dfys

  union

  select *from ls_jg_dfys

  這個SQL在執行時先取出兩個表的結果,再用排序空間進行排序刪除重複的記錄,最後返回結果集,如果表資料量大的話可能會導致用磁碟進行排序。  

  推薦方案:採用UNION ALL操作符替代UNION,因為UNIONALL操作只是簡單的將兩個結果合併後就返回。  

  select *from gc_dfys

  union all

  select *from ls_jg_dfys  

二、SQL書寫的影響  

1、同一功能同一性能不同寫法SQL的影響。  

如一個SQL

A程式設計師寫的為 Select * from zl_yhjbqk  

  B程式設計師寫的為 Select * from dlyx.zl_yhjbqk(帶表所有者的字首)   

  C程式設計師寫的為 Select * from DLYX.ZLYHJBQK(大寫表名)   

D程式設計師寫的為 Select * from DLYX.ZLYHJBQK(中間多了空格)

  以上四個SQL在ORACLE分析整理之後產生的結果及執行的時間是一樣的,但是從ORACLE共享記憶體SGA的原理,可以得出ORACLE 對每個SQL 都會對其進行一次分析,並且佔用共享記憶體,如果SQL的字串及格式寫得完全相同,則ORACLE只會分析一次,共享記憶體也只會留下一次的分析結果,這不僅可以減少分析SQL的時間,而且可以減少共享記憶體重複的資訊,ORACLE也可以準確統計SQL的執行頻率。   

2、WHERE後面的條件順序影響   

  WHERE子句後面的條件順序對大資料量表的查詢會產生直接的影響。如:

  Select *from zl_yhjbqk where dy_dj = '1KV以下' and xh_bz=1

  Select *from zl_yhjbqk where xh_bz=1 and dy_dj = '1KV以下'

  以上兩個SQL中dy_dj(電壓等級)及xh_bz(銷戶標誌)兩個欄位都沒進行索引,所以執行的時候都是全表掃描,第一條SQL的 dy_dj = '1KV以下'條件在記錄集內比率為99%,而xh_bz=1的比率只為0.5%,在進行第一條SQL的時候99%條記錄都進行dy_dj及xh_bz的比較,而在進行第二條SQL的時候0.5%條記錄都進行dy_dj及xh_bz的比較,以此可以得出第二條SQL的CPU佔用率明顯比第一條低。   

推薦方案:合適的排序能降低,資料比較的次數,提高速度;

3、FROM查詢表順序的影響   

在FROM後面的表中的列表順序會對SQL執行效能影響,在沒有索引及ORACLE沒有對錶進行統計分析的情況下,ORACLE會按表出現的順序進行連結,由此可見表的順序不對時會產生十分耗服物器資源的資料交叉。

注:如果對錶進行了統計分析,ORACLE會自動先進小表的連結,再進行大表的連結。   

三、SQL語句索引的利用   

1、操作符優化(同上)  

2、對條件欄位的一些優化   

Ø  採用函式處理的欄位不能利用索引

如:substr(hbs_bh,1,4)=’5400’,優化處理:hbs_bh like ‘5400%’   

  trunc(sk_rq)=trunc(sysdate), 優化處理:sk_rq>=trunc(sysdate) and sk_rq

Ø  進行了顯式或隱式的運算的欄位不能進行索引

如:ss_df+20>50,優化處理:ss_df>30   

  ‘X’    hbs_bh>’X5400021452’,優化處理:hbs_bh>’5400021542’  

  sk_rq+5=sysdate,優化處理:sk_rq=sysdate-5   

hbs_bh=5401002554,優化處理:hbs_bh=’ 5401002554’(注:此條件對hbs_bh 進行隱式的to_number轉換,因為hbs_bh欄位是字元型。)

Ø  條件內包括了多個本表的欄位運算時不能進行索引

如:ys_df>cx_df,無法進行優化

  qc_bh   kh_bh=’5400250000’,優化處理:qc_bh=’5400’ and kh_bh=’250000’  

四、其他  

ORACLE的提示功能是比較強的功能,也是比較複雜的應用,並且提示只是給ORACLE執行的一個建議,有時如果出於成本方面的考慮ORACLE也可能不會按提示進行。根據實踐應用,一般不建議開發人員應用ORACLE提示,因為各個資料庫及伺服器效能情況不一樣,很可能一個地方效能提升了,但另一個地方卻下降了。

ORACLE在SQL執行分析方面已經比較成熟,如果分析執行的路徑不對首先應在資料庫結構(主要是索引)、伺服器當前效能(共享記憶體、磁碟檔案碎片)、資料庫物件(表、索引)統計資訊是否正確這幾方面分析。