教你建立Oracle複合索引(精)
什麼是複合索引?
複合索引顧名思義,區別於單列索引,是由兩個或多個列一起構成的索引。其在B樹上的資料結構是什麼樣?如下圖,是一個包含兩列的複合索引。
如果你觀察仔細,還會發現它的葉子節點是ASC遞增排序的。現根據第一個值排序,然後根據第二個值排序。查的時候也一樣,先查第一個值,在查第二個值。你可以想象以下,三個列組成的複合索引資料結構該是什麼樣的。
在實際開發中,我們經常會遇到建立表的情況。一開始,只會建立一個主鍵id,oracle會為主鍵預設建立索引。隨著經驗的增加,開始心有餘力去考慮效能,會開始研究索引,比如查詢報表、訂單等業務場景。這時候多多少少都會建立索引了,然後開始研究複合索引。複合索引首先帶來的問題是你如何在腦海中構建一個B樹上的複合索引結構?接下來就到了如何建立複合索引的問題。
索引的建立,是為了提高查詢效率,但索引設計不合理,又很影響寫效能,這就像CAP只能滿足其中兩個條件一樣。所以完美的東西不存在,萬物是在矛盾中前行。說白了,就是要用最少、結構最簡單的索引來達到目標。
例項
我們有這樣一張表
id | a | b | c |
---|---|---|---|
1 | 1 | 201 | 7 |
2 | 1 | 202 | 6 |
3 | 1 | 203 | 43 |
4 | 1 | 204 | 23 |
5 | 1 | 204 | 33 |
6 | 0 | 208 | 31 |
7 | 0 | 202 | 34 |
這張表有什麼特點?
第一、經a、b和c都經常要被查詢,並且有經常a、b、c組合查詢的可能性。這就給了我們建索引的理由。
第二、a列區分度不大,b和c都有區分度。請問這種場景如何建索引?
下面看我們思考的邏輯:
- 很直觀的想法,分別在a、b和c上分別建單列索引,即我們最終有三個索引,分別是(a)、(b)、(c)。這當然可以。但還有沒有更好的?
- 比如在(a、b)、(b、c)、(a、c)上建複合索引。這樣當然也可以。但維護起來開銷比較大,還有沒有更好的?
- 在(a、b、c)上建複合索引。這樣維護起來開銷也很大。並且a作為先導列,區分度不大,不是一個很好的選擇。
- 最好的,應該是在(b、c)上建立複合索引,在c上建單列索引,這樣(b、c)索引可以覆蓋到a and b和b and c查詢,c單列索引可以覆蓋到a和b查詢。當然口說無憑,最終的效果還要看oracle的執行計劃。這裡不在貼執行計劃了,感興趣可以自己嘗試以下。
2018.11.29補充執行計劃
首先建立表
CREATE TABLE sunyang_test(
id number,
a number,
b number,
c number
)tablespace ebiz;
alter table sunyang_test add constraint pk_sunyang_test primary key (id) using index tablespace ebiz;
插入資料
begin
for i in 1 .. 100000 loop
insert into sunyang_test values(i,mod(i,2),mod(i,20000),mod(i,20000));
end loop;
commit;
end;
建立索引
create index idx_sunyang_test_bc on sunyang_test(b,c) tablespace ebiz;
create index idx_sunyang_test_c on sunyang_test(c) tablespace ebiz;
我們開始執行下面的SQL
1.
select * from sunyang_test where b=5000;
執行計劃:
2.
select * from sunyang_test where c=5000;
執行計劃:
3.
select * from sunyang_test where a=1 and b=5000;
執行計劃:
4.
select * from sunyang_test where a=1 and c=5000;
執行計劃:
5.
select * from sunyang_test where b=5000 and c=5000;
執行計劃:
6.
select * from sunyang_test where a=1 and b=5000 and c=5000;
執行計劃:
可以看到,在a列區分度不大,且需要a、b、c單列查詢或組合查詢時,這樣建索引將所有查詢情況都覆蓋到了,並且索引不復雜。
結束語
複合索引的設計,對於前導列的選擇(也就是複合索引中的第一個列)非常重要,至少不應該在這裡選擇a作為一個複合索引的前導列,因為a的區分度太低了。有人說,不是有INDEX SKIP SCAN嗎?這個確實要看a的實際值,如果a的取值很少,比如這裡的兩個,那麼可以走INDEX SKIP SCAN,否則開銷是很大的,往往Oracle直接去FULL TABLE SCAN了,也不會去INDEX SKIP SCAN,因為其涉及到索引分裂。