1. 程式人生 > 其它 >【Mysql】覆蓋索引

【Mysql】覆蓋索引

覆蓋索引

如果一個索引包含(或者覆蓋)所有需要查詢的欄位值,我們就稱之為“覆蓋索引”

覆蓋索引的優化及限制

覆蓋索引是一種非常強大的工具,能大大提高查詢效能,只需要讀取索引而不需要讀取資料,有以下優點:
  1. 索引項通常比記錄要小,所以MySQL訪問更少的資料。

  2. 索引都按值得大小儲存,相對於隨機訪問記錄,需要更少的I/O。

  3. 資料引擎能更好的快取索引,比如MyISAM只快取索引。

  4. 覆蓋索引對InnoDB尤其有用,因為InnoDB使用聚集索引組織資料,如果二級索引包含查詢所需的資料,就不再需要在聚集索引中查找了。

限制:
  1. 覆蓋索引也並不適用於任意的索引型別,索引必須儲存列的值。

  2. Hash和full-text索引不儲存值,因此MySQL只能使用BTree。

  3. 不同的儲存引擎實現覆蓋索引都是不同的,並不是所有的儲存引擎都支援覆蓋索引。

  4. 如果要使用覆蓋索引,一定要注意SELECT列表值取出需要的列,不可以SELECT * ,因為如果將所有欄位一起做索引會導致索引檔案過大,查詢效能下降.

案例用法

當發起一個被索引覆蓋的查詢(也叫作索引覆蓋查詢)時,在EXPLAIN的Extra列可以看到“Using index”的資訊。

從執行結果上看,這個SQL語句只通過索引,就取到了所需要的資料,這個過程就叫做索引覆蓋。

優化場景
1、 無WHERE條件的查詢優化:
執行計劃中,type 為ALL,表示進行了全表掃描 如何改進?優化措施很簡單,就是對這個查詢列建立索引。如下, ```sql ALERT TABLE t1 ADD KEY(staff_id); ``` 再看一下執行計劃. ```sql explain select sql_no_cache count(staff_id) from t1

*************************** 1. row ***************************
id: 1
select_type: SIMPLE
table: t1
type: index
possible_keys: NULL
key: staff_id
key_len: 1
ref: NULL
rows: 1023849      Extra: Using index
1 row in set (0.00 sec)

possible_key: NULL,說明沒有WHERE條件時查詢優化器無法通過索引檢索資料,這裡使用了索引的另外一個優點,即從索引中獲取資料,減少了讀取的資料塊的數量。 無where條件的查詢,可以通過索引來實現索引覆蓋查詢,但前提條件是,查詢返回的欄位數足夠少,更不用說select *之類的了。畢竟,建立key length過長的索引,始終不是一件好事情。

###### 2、二次檢索優化
如下這個查詢:
```sql
select sql_no_cache rental_date from t1 where inventory_id<80000;
…
…
| 2005-08-23 15:08:00 |
| 2005-08-23 15:09:17 |
| 2005-08-23 15:10:42 |
| 2005-08-23 15:15:02 |
| 2005-08-23 15:15:19 |
| 2005-08-23 15:16:32 |
+---------------------+
79999 rows in set (0.13 sec)

執行計劃:

explain select sql_no_cache rental_date from t1 where inventory_id<80000*************************** 1. row ***************************
           id: 1
  select_type: SIMPLE
        table: t1
         type: range
possible_keys: inventory_id
          key: inventory_id
      key_len: 3
          ref: NULL
         rows: 153734
        Extra: Using index condition
1 row in set (0.00 sec)

Extra:Using index condition 表示使用的索引方式為二級檢索,即79999個書籤值被用來進行回表查詢。可想而知,還是會有一定的效能消耗的

  嘗試針對這個SQL建立聯合索引,如下:

alter table t1 add key(inventory_id,rental_date);

執行計劃:

explain select sql_no_cache rental_date from t1 where inventory_id<80000*************************** 1. row ***************************
          id: 1
 select_type: SIMPLE
       table: t1
        type: range
possible_keys: inventory_id,inventory_id_2
         key: inventory_id_2
     key_len: 3
         ref: NULL
        rows: 162884
       Extra: Using index
1 row in set (0.00 sec)

Extra:Using index 表示沒有會標查詢的過程,實現了索引覆蓋。

3、分頁查詢優化

  如下這個查詢場景

select tid,return_date from t1 order by inventory_id limit 50000,10;
+-------+---------------------+
| tid   | return_date         |
+-------+---------------------+
| 50001 | 2005-06-17 23:04:36 |
| 50002 | 2005-06-23 03:16:12 |
| 50003 | 2005-06-20 22:41:03 |
| 50004 | 2005-06-23 04:39:28 |
| 50005 | 2005-06-24 04:41:20 |
| 50006 | 2005-06-22 22:54:10 |
| 50007 | 2005-06-18 07:21:51 |
| 50008 | 2005-06-25 21:51:16 |
| 50009 | 2005-06-21 03:44:32 |
| 50010 | 2005-06-19 00:00:34 |
+-------+---------------------+
10 rows in set (0.75 sec)

在未優化之前,我們看到它的執行計劃是如此的糟糕

explain select tid,return_date from t1 order by inventory_id limit 50000,10*************************** 1. row ***************************
           id: 1
  select_type: SIMPLE
        table: t1
         type: ALL
possible_keys: NULL
          key: NULL
      key_len: NULL
          ref: NULL
         rows: 1023675
        
1 row in set (0.00 sec)

看出是全表掃描。加上而外的排序,效能消耗是不低的

  如何通過覆蓋索引優化呢?

  我們建立一個索引,包含排序列以及返回列,由於tid是主鍵欄位,因此,下面的複合索引就包含了tid的欄位值.

alter table t1 add index liu(inventory_id,return_date);

那麼,效果如何呢?

select tid,return_date from t1 order by inventory_id limit 50000,10;
+-------+---------------------+
| tid   | return_date         |
+-------+---------------------+
| 50001 | 2005-06-17 23:04:36 |
| 50002 | 2005-06-23 03:16:12 |
| 50003 | 2005-06-20 22:41:03 |
| 50004 | 2005-06-23 04:39:28 |
| 50005 | 2005-06-24 04:41:20 |
| 50006 | 2005-06-22 22:54:10 |
| 50007 | 2005-06-18 07:21:51 |
| 50008 | 2005-06-25 21:51:16 |
| 50009 | 2005-06-21 03:44:32 |
| 50010 | 2005-06-19 00:00:34 |
+-------+---------------------+
10 rows in set (0.03 sec)

 可以發現,新增複合索引後,速度提升0.7s!
  我們看一下改進後的執行計劃

explain select tid,return_date from t1 order by inventory_id limit 50000,10\G
*************************** 1. row ***************************
         id: 1
select_type: SIMPLE
      table: t1
       type: index
possible_keys: NULL
        key: liu
    key_len: 9
        ref: NULL
       rows: 50010
    Extra: Using index
1 row in set (0.00 sec)  
4、建了索引但是查詢不走索引
CREATE TABLE `t_order` (
`id` bigint(20) unsigned NOT NULL AUTO_INCREMENT,
`order_code` char(12) NOT NULL,
`order_amount` decimal(12,2) NOT NULL,
PRIMARY KEY (`id`),
UNIQUE KEY `uni_order_code` (`order_code`) USING BTREE )
ENGINE=InnoDB AUTO_INCREMENT=1 DEFAULT CHARSET=utf8;

查詢語句:

select order_code,order_amount from t_order order by order_code limit 1000; 
發現雖然在order_code上建了索引,但是看查詢計劃卻不走索引,為什麼呢?因為資料行讀取order_amount,所以是隨機IO。那怎麼辦?重新建索引,使用覆蓋索引。
ALTER TABLE `t_order` ADD INDEX `idx_ordercode_orderamount` USING BTREE (`order_code` ASC, `order_amount` ASC);

這樣再檢視SQL的執行計劃,就發現可以走到索引了。

好學若飢,謙卑若愚