mysql查詢時，offset過大影響效能的原因與優化方法

阿新 • • 發佈：2019-02-19

mysql查詢使用select命令，配合limit，offset引數可以讀取指定範圍的記錄。本文將介紹mysql查詢時，offset過大影響效能的原因及優化方法。

準備測試資料表及資料

1.建立表

CREATE TABLE `member` (
 `id` int(10) unsigned NOT NULL AUTO_INCREMENT,
 `name` varchar(10) NOT NULL COMMENT '姓名',
 `gender` tinyint(3) unsigned NOT NULL COMMENT '性別',
 PRIMARY KEY (`id`),
 KEY `gender` 
 (`gender`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8;

2.插入1000000條記錄

<?php
$pdo = new PDO("mysql:host=localhost;dbname=user","root",'');

for($i=0; $i<1000000; $i++){
    $name = substr(md5(time().mt_rand(000,999)),0,10);
    $gender = mt_rand(1,2);
    $sqlstr = "insert into member(name,gender) values('".$name."','".$gender."')"; 

    $stmt = $pdo->prepare($sqlstr);
    $stmt->execute();
}
?>

mysql> select count(*) from member;
+----------+
| count(*) |
+----------+
|  1000000 |
+----------+
1 row in set (0.23 sec)

3.當前資料庫版本

mysql> select version();
+-----------+
| version() |
+-----------+
| 5.6.24    |
+-----------+ 

1 row in set (0.01 sec)

分析offset過大影響效能的原因

1.offset較小的情況

mysql> select * from member where gender=1 limit 10,1;
+----+------------+--------+
| id | name       | gender |
+----+------------+--------+
| 26 | 509e279687 |      1 |
+----+------------+--------+
1 row in set (0.00 sec)

mysql> select * from member where gender=1 limit 100,1;
+-----+------------+--------+
| id  | name       | gender |
+-----+------------+--------+
| 211 | 07c4cbca3a |      1 |
+-----+------------+--------+
1 row in set (0.00 sec)

mysql> select * from member where gender=1 limit 1000,1;
+------+------------+--------+
| id   | name       | gender |
+------+------------+--------+
| 1975 | e95b8b6ca1 |      1 |
+------+------------+--------+
1 row in set (0.00 sec)

當offset較小時，查詢速度很快，效率較高。

2.offset較大的情況

mysql> select * from member where gender=1 limit 100000,1;
+--------+------------+--------+
| id     | name       | gender |
+--------+------------+--------+
| 199798 | 540db8c5bc |      1 |
+--------+------------+--------+
1 row in set (0.12 sec)

mysql> select * from member where gender=1 limit 200000,1;
+--------+------------+--------+
| id     | name       | gender |
+--------+------------+--------+
| 399649 | 0b21fec4c6 |      1 |
+--------+------------+--------+
1 row in set (0.23 sec)

mysql> select * from member where gender=1 limit 300000,1;
+--------+------------+--------+
| id     | name       | gender |
+--------+------------+--------+
| 599465 | f48375bdb8 |      1 |
+--------+------------+--------+
1 row in set (0.31 sec)

當offset很大時，會出現效率問題，隨著offset的增大，執行效率下降。

分析影響效能原因

select * from member where gender=1 limit 300000,1;

因為資料表是InnoDB，根據InnoDB索引的結構，查詢過程為：

通過二級索引查到主鍵值（找出所有gender=1的id)。
再根據查到的主鍵值通過主鍵索引找到相應的資料塊（根據id找出對應的資料塊內容）。
根據offset的值，查詢300001次主鍵索引的資料，最後將之前的300000條丟棄，取出最後1條。

不過既然二級索引已經找到主鍵值，為什麼還需要先用主鍵索引找到資料塊，再根據offset的值做偏移處理呢？

如果在找到主鍵索引後，先執行offset偏移處理，跳過300000條，再通過第300001條記錄的主鍵索引去讀取資料塊，這樣就能提高效率了。

如果我們只查詢出主鍵，看看有什麼不同

mysql> select id from member where gender=1 limit 300000,1;
+--------+
| id     |
+--------+
| 599465 |
+--------+
1 row in set (0.09 sec)

很明顯，如果只查詢主鍵，執行效率對比查詢全部欄位，有很大的提升。

推測

只查詢主鍵的情況
因為二級索引已經找到主鍵值，而查詢只需要讀取主鍵，因此mysql會先執行offset偏移操作，再根據後面的主鍵索引讀取資料塊。

需要查詢所有欄位的情況
因為二級索引只找到主鍵值，但其他欄位的值需要讀取資料塊才能獲取。因此mysql會先讀出資料塊內容，再執行offset偏移操作，最後丟棄前面需要跳過的資料，返回後面的資料。

證實

InnoDB中有buffer pool，存放最近訪問過的資料頁，包括資料頁和索引頁。

為了測試，先把mysql重啟，重啟後檢視buffer pool的內容。

mysql> select index_name,count(*) from information_schema.INNODB_BUFFER_PAGE where INDEX_NAME in('primary','gender') and TABLE_NAME like '%member%' group by index_name;
Empty set (0.04 sec)

可以看到，重啟後，沒有訪問過任何的資料頁。

查詢所有欄位，再檢視buffer pool的內容

mysql> select * from member where gender=1 limit 300000,1;
+--------+------------+--------+
| id     | name       | gender |
+--------+------------+--------+
| 599465 | f48375bdb8 |      1 |
+--------+------------+--------+
1 row in set (0.38 sec)

mysql> select index_name,count(*) from information_schema.INNODB_BUFFER_PAGE where INDEX_NAME in('primary','gender') and TABLE_NAME like '%member%' group by index_name;
+------------+----------+
| index_name | count(*) |
+------------+----------+
| gender     |      261 |
| PRIMARY    |     1385 |
+------------+----------+
2 rows in set (0.06 sec)

可以看出，此時buffer pool中關於member表有1385個數據頁，261個索引頁。

重啟mysql清空buffer pool，繼續測試只查詢主鍵

mysql> select id from member where gender=1 limit 300000,1;
+--------+
| id     |
+--------+
| 599465 |
+--------+
1 row in set (0.08 sec)

mysql> select index_name,count(*) from information_schema.INNODB_BUFFER_PAGE where INDEX_NAME in('primary','gender') and TABLE_NAME like '%member%' group by index_name;
+------------+----------+
| index_name | count(*) |
+------------+----------+
| gender     |      263 |
| PRIMARY    |       13 |
+------------+----------+
2 rows in set (0.04 sec)

可以看出，此時buffer pool中關於member表只有13個數據頁，263個索引頁。因此減少了多次通過主鍵索引訪問資料塊的I/O操作，提高執行效率。

因此可以證實，mysql查詢時，offset過大影響效能的原因是多次通過主鍵索引訪問資料塊的I/O操作。（注意，只有InnoDB有這個問題，而MYISAM索引結構與InnoDB不同，二級索引都是直接指向資料塊的，因此沒有此問題）。

InnoDB與MyISAM引擎索引結構對比圖

這裡寫圖片描述

優化方法

根據上面的分析，我們知道查詢所有欄位會導致主鍵索引多次訪問資料塊造成的I/O操作。

因此我們先查出偏移後的主鍵，再根據主鍵索引查詢資料塊的所有內容即可優化。

mysql> select a.* from member as a inner join (select id from member where gender=1 limit 300000,1) as b on a.id=b.id;
+--------+------------+--------+
| id     | name       | gender |
+--------+------------+--------+
| 599465 | f48375bdb8 |      1 |
+--------+------------+--------+
1 row in set (0.08 sec)

mysql查詢時，offset過大影響效能的原因與優化方法

準備測試資料表及資料

分析offset過大影響效能的原因

分析影響效能原因

推測

證實

優化方法

mysql查詢時，offset過大影響效能的原因與優化方法

mysql 證明為什麽用limit時，offset很大會影響性能

mysql 分頁查詢limit中偏移量offset過大導致效能問題

MySQL查詢時，將查詢時間更新為當前時間now()的sql語句寫法

mysql查詢時，查詢結果按where in陣列排序

Mysql分頁，資料量大時limit優化

Mysql中使用JDBC流式查詢避免資料量過大導致OOM

mysql主從複製，資料量大，高併發時，出現數據不一致

Navicat for MySQL 新建查詢時，報can't create file ...系統找不到指定的資料夾出現問題

servlet 向mysql 插入中文，在mysql 查詢時發現中文是亂碼

mysql查詢時取多條記錄中最大時間的記錄

mysql 分頁查詢時，如何正確的獲取總數

【sql技巧】mysql修改時，動態指定要修改的字段 update `table` set (case when ....) = 1 where id = xx

mybatis 關聯查詢時，從表只返回第一條記錄解決辦法

MySQL複製衝突，跳過事物

解決mysql使用innodb引擎ibdata1,過大

tp5關聯查詢時，join需要別名的情況

Oracle查詢時，時間精確到日

date存入mysql中時，多了一秒的解決方案

mysql 查詢今天，昨天，上個月sql語句

mysql查詢時，offset過大影響效能的原因與優化方法

準備測試資料表及資料

分析offset過大影響效能的原因

分析影響效能原因

推測

證實

優化方法

相關推薦