1. 程式人生 > >oracle-btree和bitmap索引

oracle-btree和bitmap索引

在關係資料庫中,索引是一種與表有關的資料庫結構,它可以使對應於表的SQL語句執行得更快。索引的作用相當於圖書的目錄,可以根據目錄中的頁碼快速找到所需的內容。 

對於資料庫來說,索引是一個必選項,但對於現在的各種大型資料庫來說,索引可以大大提高資料庫的效能,以至於它變成了資料庫不可缺少的一部分。

索引分類:

邏輯分類

single column or concatenated     對一列或多列建所引

unique or nonunique    唯一的和非唯一的所引,也就是對某一列或幾列的鍵值(key)是否是唯一的。

Function-based    基於某些函式索引,當執行某些函式時需要對其進行計算,可以將某些函式的計算結果事先儲存並加以索引,提高效率。 

Doman    索引資料庫以外的資料,使用相對較少

物理分類

B-Tree :normal or reverse key   B-Tree索引也是我們傳統上常見所理解的索引,它又可以分為正常所引和倒序索引。

Bitmap  : 點陣圖所引,後面會細講

B-Tree 索引                                                                                 

  B-Tree index 也是我們傳統上常見所理解的索引。B-tree (balance tree)即平衡樹,左右兩個分支相對平衡。

B-Tree index

Root為根節點,branch 為分支節點,leaf 到最下面一層稱為葉子節點。每個節點表示一層,當查詢某一資料時先讀根節點,再讀支節點,最後找到葉子節點。葉子節點會存放index entry (索引入口),每個索引入口對應一條記錄。

Index entry 的組成部分:

Indexentry entry  header    存放一些控制資訊。

Key column length     某一key的長度

Key column value      某一個key 的值

ROWID    指標,具體指向於某一個數據

建立索引:

使用者登入:
SQL> conn as1/as1
Connected.

建立表:
SQL> create table dex (id int,sex char(1),name char(10));
Table created.

向表中插入1000條資料
SQL> begin
  2  for i in 1..1000
  3  loop
  4  insert into dex values(i,'M','chongshi');
  5  end loop;
  6  commit;
  7  end;
  8  /

PL/SQL procedure successfully completed.

查看錶記錄
SQL> select * from dex;
        ID SE NAME
---------- -- --------------------
       ... . .....

       991 M  chongshi
       992 M  chongshi
       993 M  chongshi
       994 M  chongshi
       995 M  chongshi
       996 M  chongshi
       997 M  chongshi
       998 M  chongshi
       999 M  chongshi
      1000 M  chongshi

1000 rows selected.

建立索引:
SQL> create index dex_idx1 on dex(id);
Index created.
注:對錶的第一列(id)建立索引。

檢視建立的表與索引
SQL> select object_name,object_type from user_objects;

OBJECT_NAME                  OBJECT_TYPE
--------------------------------------------------------------------------------
DEX                           TABLE
DEX_IDX1                      INDEX

  索引分離於表,作為一個單獨的個體存在,除了可以根據單個欄位建立索引,也可以根據多列建立索引。Oracle要求建立索引最多不可超過32列。

SQL> create index dex_index2 on dex(sex,name);
Index created.

SQL>  select object_name,object_type from user_objects;

OBJECT_NAME                           OBJECT_TYPE
--------------------------------------------------------------------------------
DEX                                       TABLE
DEX_IDX1                                 INDEX
DEX_INDEX2                               INDEX

這裡需要理解:

  編寫一本書,只有章節頁面定好之後再設定目錄;資料庫索引也是一樣,只有先插入好資料,再建立索引。那麼我們後續對資料庫的內容進行插入、刪除,索引也需要隨之變化。但索引的修改是由oracle自動完成的。

上面這張圖能更加清晰的描述索引的結構。

跟節點記錄0至50條資料的位置,分支節點進行拆分記錄0至10.......42至50,葉子節點記錄每第資料的長度和值,並由指標指向具體的資料。

最後一層的葉子節是雙向連結,它們是被有序的連結起來,這樣才能快速鎖定一個數據範圍。

如:

SQL> select * from dex where id>23 and id<32;

        ID SE NAME
---------- -- --------------------
        24 M  chongshi
        25 M  chongshi
        26 M  chongshi
        27 M  chongshi
        28 M  chongshi
        29 M  chongshi
        30 M  chongshi
        31 M  chongshi

8 rows selected.

  如上面查詢的列子,通過索引的方式先找到第23條資料,再找到第32條資料,這樣就能快速的鎖定一個查詢的範圍,如果每條資料都要從根節點開始查詢的話,那麼效率就會非常低下。

點陣圖索引                                                                        

  點陣圖索引主要針對大量相同值的列而建立。拿全國居民登入一第表來說,假設有四個欄位:姓名、性別、年齡、和身份證號,年齡和性別兩個欄位會產生許多相同的值,性別只有男女兩種值,年齡,1到120(假設最大年齡120歲)個值。那麼不管一張表有幾億條記錄,但根據性別欄位來區分的話,只有兩種取值(男、女)。那麼點陣圖索引就是根據欄位的這個特性所建立的一種索引。

Bitmap Index

  從上圖,我們可以看出,一個葉子節點(用不同顏色標識)代表一個key , start rowid 和 end rowid規定這種型別的檢索範圍,一個葉子節點標記一個唯一的bitmap值。因為一個數值型別對應一個節點,當時行查詢時,點陣圖索引通過不同點陣圖取值直接的位運算(與或),來獲取到結果集合向量(計算出的結果)。

舉例講解:

假設存在資料表T,有兩個資料列A和B,取值如下,我們看到A和B列中存在相同的資料。

對兩個資料列A、B分別建立點陣圖索引:idx_t_bita和idx_t_bitb。兩個索引對應的儲存邏輯結構如下:

Idx_t_bita索引結構,對應的是葉子節點:

Idx_t_bitb索引結構,對應的是葉子節點:

對查詢“select * from t where b=1 and (a=’L’ or a=’M’)”

分析:點陣圖索引使用方面,和B*索引有很大的不同。B*索引的使用,通常是從根節點開始,經過不斷的分支節點比較到最近的符合條件葉子節點。通過葉子節點上的不斷Scan操作,“掃描”出結果集合rowid。

而點陣圖索引的工作方式截然不同。通過不同點陣圖取值直接的位運算(與或),來獲取到結果集合向量(計算出的結果)。

針對例項SQL,可以拆分成如下的操作:

1、a=’L’ or a=’M’

a=L:向量:1010

a=M:向量:0001

or操作的結果,就是兩個向量的或操作:結果為1011。

2、結合b=1的向量

中間結果向量:1011

B=1:向量:1001

and操作的結果,1001。翻譯過來就是第一和第四行是查詢結果。

3、獲取到結果rowid

目前知道了起始rowid和終止rowid,以及第一行和第四行為操作結果。可以通過試算的方法獲取到結果集合rowid。

點陣圖索引的特點

1.Bitmap索引的儲存空間節省 

2.Bitmap索引建立的速度快

3.Bitmap索引允許鍵值為空 

4.Bitmap索引對錶記錄的高效訪問

建立點陣圖索引:

查看錶記錄
SQL> select * from dex;
...................
        ID SEX NAME
---------- -- --------------------
       991 M  chongshi
       992 M  chongshi
       993 G  chongshi
       994 G  chongshi
       995 G  chongshi
       996 M  chongshi
       997 G  chongshi
       998 G  chongshi
       999 G  chongshi
      1000 M  chongshi

1000 rows selected.

對於上面表來說sex(性別)只有兩種值,最適合用來建立點陣圖所引
建立索引:
SQL> create bitmap index my_bit_idx on dex(sex);

Index created.

檢視建立的所引
SQL>  select object_name,object_type from user_objects;

OBJECT_NAME                           OBJECT_TYPE
--------------------------------------------------------------------------------
MY_BIT_IDX                               INDEX

建立索引的一些規則                                                   

1、權衡索引個數與DML之間關係,DML也就是插入、刪除資料操作。

這裡需要權衡一個問題,建立索引的目的是為了提高查詢效率的,但建立的索引過多,會影響插入、刪除資料的速度,因為我們修改的表資料,索引也要跟著修改。這裡需要權衡我們的操作是查詢多還是修改多。

2、把索引與對應的表放在不同的表空間。

     當讀取一個表時表與索引是同時進行的。如果表與索引和在一個表空間裡就會產生資源競爭,放在兩個表這空就可並行執行。

3、最好使用一樣大小是塊。

     Oracle預設五塊,讀一次I/O,如果你定義6個塊或10個塊都需要讀取兩次I/O。最好是5的整數倍更能提高效率。

4、如果一個表很大,建立索引的時間很長,因為建立索引也會產生大量的redo資訊,所以在建立索引時可以設定不產生或少產生redo資訊。只要表資料存在,索引失敗了大不了再建,所以可以不需要產生redo資訊。

5、建索引的時候應該根據具體的業務SQL來建立,特別是where條件,還有where條件的順序,儘量將過濾大範圍的放在後面,因為SQL執行是從後往前的。(小李飛菜刀)

索引常見操作                                                            

改變索引

SQL> alter index employees_last _name_idx storage(next 400K maxextents 100);

索引建立後,感覺不合理,也可以對其引數進行修改。詳情檢視相關文件

調整索引的空間:

新增加空間
SQL> alter index orders_region_id_idx allocate extent (size 200K datafile '/disk6/index01.dbf');

釋放空間
SQL> alter index oraers_id_idx deallocate unused;

索引在使用的過程中可能會出現空間不足或空間浪費的情況,這個時候需要新增或釋放空間。上面兩條命令完成新增與釋放操作。關於空間的新增oracle可以自動幫助,如果瞭解資料庫的情況下手動增加可以提高效能。

重新建立索引

所引是由oracle自動完成,當我們對資料庫頻繁的操作時,索引也會跟著進行修改,當我們在資料庫中刪除一條記錄時,對應的索引中並沒有把相應的索引只是做一個刪除標記,但它依然佔據著空間。除非一個塊中所有的標記全被刪除的時,整個塊的空間才會被釋放。這樣時間久了,索引的效能就會下降。這個時候可以重新建立一個乾淨的索引來提高效率。

SQL> alter index orders_region_id_idx rebuild tablespace index02;

通過上面的命令就可以重現建立一個索引,oracle重建立索引的過程:

1、鎖表,鎖表之後其他人就不能對錶做任何操作。

2、建立新的(乾淨的)臨時索引。

3、把老的索引刪除掉

4、把新的索引重新命名為老索引的名字

5、對錶進行解鎖。

移動所引

其實,我們移動索引到其它表空間也同樣使用上面的命令,在指定表空間時指定不同的表空間。新的索引建立在別位置,把老的幹掉,就相當於移動了。

SQL> alter index orders_region_id_idx rebuild tablespace index03;

線上重新建立索引

上面介紹,在建立索引的時候,表是被鎖定,不能被使用。對於一個大表,重新建立索引所需要的時間較長,為了滿足使用者對錶操作的需求,就產生的這種線上重新建立索引。

SQL> alter index orders_id_idx  rebuild  online;

建立過程:

1、鎖住表

2、建立立臨時的和空的索引和IOT表用來存在on-going DML。普通表存放的鍵值,IOT所引表直接存放的表中資料;on-gong DML也就是使用者所做的一些增刪改的操作。

3、對錶進行解鎖

4、從老的索引建立一個新的索引。

5、IOT表裡存放的是on-going DML資訊,IOT表的內容與新建立的索引合併。

6、鎖住表

7、再次將IOT表的內容更新到新索引中,把老的索引幹掉。

8、把新的索引重新命名為老索引的名字

9、對錶進行解鎖

整合索引碎片

如上圖,在很多索引中有剩餘的空間,可以通過一個命令把剩餘空間整合到一起。  

SQL> alter index orders_id_idx  coalesce;

刪除索引

SQL> drop  index  hr.departments_name_idx;

分析索引                                                                                  

  檢查所引的有效果,前面介紹,索引用的時間久了會產生大量的碎片、垃圾資訊與浪費的剩餘空間了。可以通過重新建立索引來提高所引的效能。

可以通過一條命令來完成分析索引,分析的結果會存放在在index_stats表中。

檢視存放分析資料的表:
SQL> select count(*) from index_stats;

  COUNT(*)
----------
         0
執行分析索引命令:
SQL> analyze index my_bit_idx validate structure;

Index analyzed.

再次檢視 index_stats 已經有了一條資料
SQL> select count(*) from index_stats;

  COUNT(*)
----------
         1

把資料查詢出來:
SQL> select height,name,lf_rows,lf_blks,del_lf_rows from index_stats;

    HEIGHT   NAME              LF_ROWS   LF_BLKS   DEL_LF_ROWS
---------- ---------------------------------------------------------------------- ---------- -----------
         2   MY_BIT_IDX            1000          3            100  

分析資料分析

(HEIGHT)這個所引高度是2 ,(NAME)索引名為MY_BIT_IDX  ,(LF_ROWS)所引表有1000行資料,(LF_BLKS)佔用3個塊,(DEL_LF_ROWS)刪除100條記錄。

  這裡也驗證了前面所說的一個問題,刪除的100條資料只是標記為刪除,因為總的資料條數依然為1000條,佔用3個塊,那麼每個塊大於333條記錄,只有刪除的資料大於333條記錄,這時一個塊被清空,總的資料條數才會減少。