1. 程式人生 > >教你建立Oracle複合索引(精)

教你建立Oracle複合索引(精)

什麼是複合索引?

複合索引顧名思義,區別於單列索引,是由兩個或多個列一起構成的索引。其在B樹上的資料結構是什麼樣?如下圖,是一個包含兩列的複合索引。
在這裡插入圖片描述
如果你觀察仔細,還會發現它的葉子節點是ASC遞增排序的。現根據第一個值排序,然後根據第二個值排序。查的時候也一樣,先查第一個值,在查第二個值。你可以想象以下,三個列組成的複合索引資料結構該是什麼樣的。

在實際開發中,我們經常會遇到建立表的情況。一開始,只會建立一個主鍵id,oracle會為主鍵預設建立索引。隨著經驗的增加,開始心有餘力去考慮效能,會開始研究索引,比如查詢報表、訂單等業務場景。這時候多多少少都會建立索引了,然後開始研究複合索引。複合索引首先帶來的問題是你如何在腦海中構建一個B樹上的複合索引結構?接下來就到了如何建立複合索引的問題。
索引的建立,是為了提高查詢效率,但索引設計不合理,又很影響寫效能,這就像CAP只能滿足其中兩個條件一樣。所以完美的東西不存在,萬物是在矛盾中前行。說白了,就是要用最少、結構最簡單的索引來達到目標。

例項

我們有這樣一張表

id a b c
1 1 201 7
2 1 202 6
3 1 203 43
4 1 204 23
5 1 204 33
6 0 208 31
7 0 202 34

這張表有什麼特點?
第一、經a、b和c都經常要被查詢,並且有經常a、b、c組合查詢的可能性。這就給了我們建索引的理由。
第二、a列區分度不大,b和c都有區分度。請問這種場景如何建索引?

下面看我們思考的邏輯:

  1. 很直觀的想法,分別在a、b和c上分別建單列索引,即我們最終有三個索引,分別是(a)、(b)、(c)。這當然可以。但還有沒有更好的?
  2. 比如在(a、b)、(b、c)、(a、c)上建複合索引。這樣當然也可以。但維護起來開銷比較大,還有沒有更好的?
  3. 在(a、b、c)上建複合索引。這樣維護起來開銷也很大。並且a作為先導列,區分度不大,不是一個很好的選擇。
  4. 最好的,應該是在(b、c)上建立複合索引,在c上建單列索引,這樣(b、c)索引可以覆蓋到a and b和b and c查詢,c單列索引可以覆蓋到a和b查詢。當然口說無憑,最終的效果還要看oracle的執行計劃。這裡不在貼執行計劃了,感興趣可以自己嘗試以下。

2018.11.29補充執行計劃

首先建立表

CREATE TABLE sunyang_test( 
        id number, 
        a number, 
 b number, 
 c number 
)tablespace ebiz; 
alter table sunyang_test add constraint pk_sunyang_test primary key (id) using index tablespace ebiz; 

插入資料

begin 
        for i in 1 .. 100000 loop 
                insert into sunyang_test values(i,mod(i,2),mod(i,20000),mod(i,20000)); 
        end loop; 
        commit; 
end; 

建立索引

create index idx_sunyang_test_bc on sunyang_test(b,c) tablespace ebiz; 
create index idx_sunyang_test_c on sunyang_test(c) tablespace ebiz; 

我們開始執行下面的SQL
1.

select * from sunyang_test where b=5000; 

執行計劃:
在這裡插入圖片描述
2.

select * from sunyang_test where c=5000; 

執行計劃:
在這裡插入圖片描述
3.

select * from sunyang_test where a=1 and b=5000; 

執行計劃:
在這裡插入圖片描述
4.

select * from sunyang_test where a=1 and c=5000; 

執行計劃:
在這裡插入圖片描述
5.

select * from sunyang_test where b=5000 and c=5000; 

執行計劃:
在這裡插入圖片描述
6.

select * from sunyang_test where a=1 and b=5000 and c=5000; 

執行計劃:
在這裡插入圖片描述

可以看到,在a列區分度不大,且需要a、b、c單列查詢或組合查詢時,這樣建索引將所有查詢情況都覆蓋到了,並且索引不復雜。

結束語

複合索引的設計,對於前導列的選擇(也就是複合索引中的第一個列)非常重要,至少不應該在這裡選擇a作為一個複合索引的前導列,因為a的區分度太低了。有人說,不是有INDEX SKIP SCAN嗎?這個確實要看a的實際值,如果a的取值很少,比如這裡的兩個,那麼可以走INDEX SKIP SCAN,否則開銷是很大的,往往Oracle直接去FULL TABLE SCAN了,也不會去INDEX SKIP SCAN,因為其涉及到索引分裂。