求求你別再用offset和limit分頁了

阿新 • • 發佈：2020-09-15

不需要擔心資料庫效能優化問題的日子已經一去不復返了。

隨著時代的進步，隨著野心勃勃的企業想要變成下一個 Facebook，隨著為機器學習預測收集儘可能多資料的想法的出現，作為開發人員，我們要不斷地打磨我們的 API，讓它們提供可靠和有效的端點，從而毫不費力地瀏覽海量資料。

如果你做過後臺開發或資料庫架構，你可能是這麼分頁的：

如果你真的是這麼分頁，那麼我不得不抱歉地說，你這樣做是錯的。

你不以為然？沒關係。Slack、Shopify 和 Mixmax 這些公司都在用我們今天將要討論的方式進行分頁。

我想你很難找出一個不使用 OFFSET 和 LIMIT 進行資料庫分頁的人。對於簡單的小型應用程式和資料量不是很大的場景，這種方式還是能夠“應付”的。

如果你想從頭開始構建一個可靠且高效的系統，在一開始就要把它做好。

今天我們將探討已經被廣泛使用的分頁方式存在的問題，以及如何實現高效能分頁。

1OFFSET 和 LIMIT 有什麼問題？

正如前面段落所說的那樣，OFFSET 和 LIMIT 對於資料量少的專案來說是沒有問題的。

但是，當資料庫裡的資料量超過伺服器記憶體能夠儲存的能力，並且需要對所有資料進行分頁，問題就會出現。

為了實現分頁，每次收到分頁請求時，資料庫都需要進行低效的全表掃描。

什麼是全表掃描？全表掃描 (又稱順序掃描) 就是在資料庫中進行逐行掃描，順序讀取表中的每一行記錄，然後檢查各個列是否符合查詢條件。這種掃描是已知最慢的，因為需要進行大量的磁碟 I/O，而且從磁碟到記憶體的傳輸開銷也很大。

這意味著，如果你有 1 億個使用者，OFFSET 是 5 千萬，那麼它需要獲取所有這些記錄 (包括那麼多根本不需要的資料)，將它們放入記憶體，然後獲取 LIMIT 指定的 20 條結果。

也就是說，為了獲取一頁的資料：

10萬行中的第5萬行到第5萬零20行

需要先獲取 5 萬行。這麼做是多麼低效？

如果你不相信，可以看看這個例子：

https://www.db-fiddle.com/f/3JSpBxVgcqL3W2AzfRNCyq/1?ref=hackernoon.com

左邊的 Schema SQL 將插入 10 萬行資料，右邊有一個性能很差的查詢和一個較好的解決方案。只需單擊頂部的 Run，就可以比較它們的執行時間。第一個查詢的執行時間至少是第二個查詢的 30 倍。

資料越多，情況就越糟。看看我對 10 萬行資料進行的 PoC。

https://github.com/IvoPereira/Efficient-Pagination-SQL-PoC?ref=hackernoon.com

現在你應該知道這背後都發生了什麼：OFFSET 越高，查詢時間就越長。

2替代方案

你應該這樣做：

這是一種基於指標的分頁。

你要在本地儲存上一次接收到的主鍵(通常是一個 ID) 和 LIMIT，而不是 OFFSET 和 LIMIT，那麼每一次的查詢可能都與此類似。

為什麼？因為通過顯式告知資料庫最新行，資料庫就確切地知道從哪裡開始搜尋（基於有效的索引），而不需要考慮目標範圍之外的記錄。

比較這個查詢：

和優化的版本：

返回同樣的結果，第一個查詢使用了 12.80 秒，而第二個僅用了 0.01 秒。

要使用這種基於遊標的分頁，需要有一個惟一的序列欄位 (或多個)，比如惟一的整數 ID 或時間戳，但在某些特定情況下可能無法滿足這個條件。

我的建議是，不管怎樣都要考慮每種解決方案的優缺點，以及需要執行哪種查詢。

如果需要基於大量資料做查詢操作，Rick James 的文章提供了更深入的指導。

http://mysql.rjweb.org/doc.php/lists

如果我們的表沒有主鍵，比如是具有多對多關係的表，那麼就使用傳統的 OFFSET/LIMIT 方式，只是這樣做存在潛在的慢查詢問題。我建議在需要分頁的表中使用自動遞增的主鍵，即使只是為了分頁。

求求你別再用offset和limit分頁了

求求你別再用offset和limit分頁了

求求你，別再用wait和notify了

面試官，ThreadLocal 你別再問了！

求求你們了，別再寫滿屏的 if/ else 了！

laravel自定義分頁的實現案例offset()和limit()

公司這套架構統一處理try...catch這麼香，求求你不要再滿屏寫了，再發現扣績效！

別再用老版雲效Projex專案協作了，該升級了

別再用 BeanUtils 了，這款 PO VO DTO 轉換神器不香麼？

你真的會用git和github嗎？

別再用 Redis List 實現訊息隊列了，Stream 專為佇列而生

請別再問Spring Bean的生命週期了

CPU：別再拿我當搬磚工了！

[轉]CPU：別再拿我當搬磚工了！

Mybatis基礎，limit分頁，和RowsBounds分頁

別隻用 console.log() 除錯 js 程式碼了

自動駕駛科普：別再談「接管」色變了

別再寫滿屏的 try catch 了

淺談mysql使用limit分頁優化方案的實現

mysql oracle和sqlserver分頁查詢例項解析

springboot整合mybatis，使用通用mapper和mapper分頁外掛

求求你別再用offset和limit分頁了

相關推薦