1. 程式人生 > >(譯)MySQL 8.0實驗室---MySQL中的倒敘索引(Descending Indexes)

(譯)MySQL 8.0實驗室---MySQL中的倒敘索引(Descending Indexes)

mysql 重新 .cn 創建表 https 正序 tro 一個 刪除

譯者註:
MySQL 8.0之前,不管是否指定索引建的排序方式,都會忽略創建索引時候指定的排序方式(語法上不會報錯),最終都會創建為ASC方式的索引,
在執行查詢的時候,只存在forwarded(正向)方式對索引進行掃描。
關於正向索引和反向索引,邏輯上很容易理解,這裏有兩個相關的概念:
正向索引或者反向索引,兩者都是在構建B樹索引時候的相關字段排序方式,是B索引樹的邏輯存儲方式
正向掃描(forward)和反向掃描( Backward index scan;)是執行查詢的過程中對B樹索引的掃描方式,是數據執行計劃時候的一種索引掃描方式
關於正向掃描或者反向掃描不是隨意的,受sql語句中(正/反向)排序方式以及(正/反向)索引的影響

之前在sqlserver中簡單寫過一點類似的東西,https://www.cnblogs.com/wy123/p/5552719.html

整體上看,拋開正向索引和反向索引,在掃描掃描的過程中,正向索引掃描的在性能上,稍微優於反向索引掃描。
不過,即便是反向索引掃描,也是優化器根據具體查詢進行優化的結果,並非一個不好的選擇。

以下為譯文:


從8.0優化器實驗室發布開始,MySQL開始支持倒敘索引。
正如我將在本文中詳細介紹的,這個新特性可以用來消除對結果排序的需求,並在許多查詢中帶來性能改進。

簡介

在此版本之前,所有索引都是按升序創建的。當語法本身被解析時,元數據不會被保留。例如在MySQL 5.7中:

mysql 5.7> CREATE TABLE t1 (a INT, b INT, INDEX a_desc_b_asc (a DESC, b ASC));
Query OK, 0 rows affected (0.47 sec)

mysql 5.7> SHOW CREATE TABLE t1\G
*************************** 1. row ***************************
       Table: t1
Create Table: CREATE TABLE `t1` (
  `a` int(11) DEFAULT
NULL, `b` int(11) DEFAULT NULL, KEY `a_desc_b_asc` (`a`,`b`) <-- 創建索引時候的元數據沒有被保留 ) ENGINE=InnoDB DEFAULT CHARSET=latin1 1 row in set (0.00 sec)

應該註意的是,MySQL 5.7 optimizer能夠向後掃描一個升序索引(按照降序排列),其成本較高。
如下面所示,我們可以看到正向索引掃描比反向索引掃描好~15%。
不能支持倒敘索引的主要限制是,優化器必須對混合順序(如DESC、b ASC的順序)使用文件排序。

MySQL 8.0中的改進

引入反向索引後,InnoDB現在可以按照降序順序存儲數據行,優化器將在查詢中請求降序時利用它。
重復上面的例子,我們可以看到在創建表時索引順序信息被正確地保留了:

mysql 8.0> CREATE TABLE t1 (a INT, b INT, INDEX a_desc_b_asc (a DESC, b ASC));
Query OK, 0 rows affected (0.47 sec)
 
mysql 8.0> show create table t1;
+-------+--------------------------------------------------------------------------------------------------------------------------------------------------------+
| Table | Create Table |
+-------+--------------------------------------------------------------------------------------------------------------------------------------------------------+
| t1 | CREATE TABLE `t1` (
`a` int(11) DEFAULT NULL,
`b` int(11) DEFAULT NULL,
KEY `a_desc_b_asc` (`a` DESC,`b`)
) ENGINE=InnoDB DEFAULT CHARSET=latin1 |
+-------+--------------------------------------------------------------------------------------------------------------------------------------------------------+
1 row in set (0.00 sec)

為了區分向後和向前索引掃描,還改進了EXPLAIN的輸出。
對於MySQL-5.7,除了查詢2和查詢6之外,我們對所有查詢都使用反向索引掃描或文件排序,因為這兩個查詢只需要升序。

Query 1: SELECT * FROM t1 ORDER BY a DESC;

mysql 8.0> explain SELECT * FROM t1 ORDER BY a DESC;
+----+-------------+-------+------------+-------+---------------+--------------+---------+------+------+----------+-------------+
| id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
+----+-------------+-------+------------+-------+---------------+--------------+---------+------+------+----------+-------------+
| 1  | SIMPLE    | t1    | NULL    | index  | NULL | a_desc_b_asc | 10 | NULL | 10 | 100.00 | Using index |
+----+-------------+-------+------------+-------+---------------+--------------+---------+------+------+----------+-------------+
1 row in set, 1 warning (0.00 sec)

Query 2: SELECT * FROM t1 ORDER BY a ASC;

mysql 8.0> explain SELECT * FROM t1 ORDER BY a ASC;
+----+-------------+-------+------------+-------+---------------+--------------+---------+------+------+----------+----------------------------------+
| id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
+----+-------------+-------+------------+-------+---------------+--------------+---------+------+------+----------+----------------------------------+
| 1 | SIMPLE | t1 | NULL | index | NULL | a_desc_b_asc | 10 | NULL | 10 | 100.00 | Backward index scan; Using index |
+----+-------------+-------+------------+-------+---------------+--------------+---------+------+------+----------+----------------------------------+
1 row in set, 1 warning (0.00 sec)

Query 3: SELECT * FROM t1 ORDER BY a DESC, b ASC;

mysql 8.0> EXPLAIN SELECT * FROM t1 ORDER BY a DESC, b ASC;
+----+-------------+-------+------------+-------+---------------+--------------+---------+------+------+----------+-------------+
| id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
+----+-------------+-------+------------+-------+---------------+--------------+---------+------+------+----------+-------------+
| 1 | SIMPLE | t1 | NULL | index | NULL | a_desc_b_asc | 10 | NULL | 10 | 100.00 | Using index |
+----+-------------+-------+------------+-------+---------------+--------------+---------+------+------+----------+-------------+
1 row in set, 1 warning (0.00 sec)

Query 4: SELECT * FROM t1 ORDER BY a ASC, b DESC;

mysql 8.0> EXPLAIN SELECT * FROM t1 ORDER BY a ASC, b DESC;
+----+-------------+-------+------------+-------+---------------+--------------+---------+------+------+----------+----------------------------------+
| id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
+----+-------------+-------+------------+-------+---------------+--------------+---------+------+------+----------+----------------------------------+
| 1 | SIMPLE | t1 | NULL | index | NULL | a_desc_b_asc | 10 | NULL | 10 | 100.00 | Backward index scan; Using index |
+----+-------------+-------+------------+-------+---------------+--------------+---------+------+------+----------+----------------------------------+
1 row in set, 1 warning (0.00 sec)

Query 5: SELECT * FROM t1 ORDER BY a DESC, b DESC;

mysql 8.0> EXPLAIN SELECT * FROM t1 ORDER BY a DESC, b DESC;
+----+-------------+-------+------------+-------+---------------+--------------+---------+------+------+----------+-----------------------------+
| id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
+----+-------------+-------+------------+-------+---------------+--------------+---------+------+------+----------+-----------------------------+
| 1 | SIMPLE | t1 | NULL | index | NULL | a_desc_b_asc | 10 | NULL | 10 | 100.00 | Using index; Using filesort |
+----+-------------+-------+------------+-------+---------------+--------------+---------+------+------+----------+-----------------------------+
1 row in set, 1 warning (0.01 sec)

Query 5: SELECT * FROM t1 ORDER BY a ASC, b ASC;

mysql 8.0> EXPLAIN SELECT * FROM t1 ORDER BY a ASC, b ASC;
+----+-------------+-------+------------+-------+---------------+--------------+---------+------+------+----------+-----------------------------+
| id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
+----+-------------+-------+------------+-------+---------------+--------------+---------+------+------+----------+-----------------------------+
| 1 | SIMPLE | t1 | NULL | index | NULL | a_desc_b_asc | 10 | NULL | 10 | 100.00 | Using index; Using filesort |
+----+-------------+-------+------------+-------+---------------+--------------+---------+------+------+----------+-----------------------------+
1 row in set, 1 warning (0.00 sec)

當表中有一個索引a_desc_b_asc (a DESC, b ASC)時,以下是上述6個查詢的性能指標。

數據大小為1000萬行。在MySQL-5.7中,它是a_asc_b_asc(a ASC, b ASC),因為不支持倒敘索引。

技術分享圖片

性能指標的解釋:

1, 對於查詢1,也即ORDER BY a DESC;:
我們看到查詢1中性能的提升,因為請求的訂單是“a”列的DESC
譯者註:因為MySQL8.0中可以建立倒敘索引,查詢1按照a字段desc排序,直接走正向(forwarded)索引掃描即可完成查詢,
避免了在MySQL5.7中查詢出來數據之後再進行排序操作的步驟

2,對於查詢2:
由於查詢2的排序為正序(譯者註:與索引的順序相反,因此需要反向掃描),由於反向索引掃描,
在MySQL-8.0中(相對於查詢1)執行向反向索引掃描需要更多的時間
(註意,從圖中可以看出,MySQL-8.0總體上表現更好。MySQL 5.7中正向索引掃描,與MySQL 8.0中反向索引掃描花費的時間(幾乎)相同)

3,對於查詢3 也即ORDER BY a DESC, b ASC;:
查詢3的排序方式與查詢1類似,然而在MySQL-5.7中,對於任何請求混合順序的查詢,會對查詢結果重新排序,因此性能差別是巨大的。

4,對於查詢4 也即 ORDER BY a ASC, b DESC;
可以看到,在MySQL 8.0中,查詢4執行的是反向索引掃描,因此比查詢3花費了更多的時間,
盡管如此,在查詢5和查詢6中,排序的方式是(a DESC, b DESC)/(a ASC, b ASC),不管是正向掃描還是反向掃描,都無法滿足排序需求,因此會用到filesort
但是,在這種情況下,由於在MySQL-5.7中ASC/DESC索引標誌被忽略(譯者註:MySQL 5.7中沒有正向和反向索引的概念),因此MySQL-5.7可以使用(正向/反向)索引掃描來給出請求的順序。

5,如果用戶想要避免查詢5和查詢6的filesorts,可以修改表以添加一個鍵(a ASC, b ASC)。
此外,如果用戶也想避免反向索引掃描,可以同時添加(a ASC, b DESC)和(a DESC, b DESC)。

下面是添加了第5點下的額外索引後的MySQL-5.7.14和MySQL-8.0-labs的最後對比:

技術分享圖片

註意,在MySQL-5.7中,我們不能添加額外的索引來提高上述查詢的性能。
而且,有了這個特性,在某些情況下可以避免物化,比如在連接中的第一個表上請求混合順序。
在一些用例中,反向索引提高了性能。區間掃描訪問方法也使用反向索引。
雖然並不是所有的範圍掃描訪問方法都使用反向索引,但我們將在未來嘗試消除這些限制。

改進

隨著降序索引的引入,我們已經刪除了對隱式排序的支持,結果是作為GROUP BY的一部分提到的列的升序。
除了上述改進外,我們還看到在一些情況下性能得到了改善,這些情況下的順序是隱含的,但可能不是必需的。

總結

我們很高興能夠解決MySQL社區長期存在的功能請求之一。請了解反向索引的特性,讓我們知道你的想法!

(譯)MySQL 8.0實驗室---MySQL中的倒敘索引(Descending Indexes)