Mysql效能優化：為什麼你的count(*)這麼慢？

阿新 • • 發佈：2020-04-03

導讀

在開發中一定會用到統計一張表的行數，比如一個交易系統，老闆會讓你每天生成一個報表，這些統計資訊少不了 sql 中的count函式。
但是隨著記錄越來越多，查詢的速度會越來越慢，為什麼會這樣呢？Mysql內部到底是怎麼處理的？
今天這篇文章將從Mysql內部對於count函式是怎樣處理的？
本文首發於作者微信公眾號【碼猿技術專欄】Mysql效能優化：為什麼你的count(*)這麼慢？，原創不易，喜歡的請支援一下，謝謝！！！

count的實現方式

在Mysql中的不同的儲存引擎對count函式有不同的實現方式。
MyISAM引擎把一個表的總行數存在了磁碟上，因此執行count(*)的時候會直接返回這個數，效率很高（沒有where

查詢條件）。
InnoDB引擎並沒有直接將總數存在磁碟上，在執行count(*)函式的時候需要一行一行的將資料讀出來，然後累計總數。

為什麼InnoDB不將總數存起來？

說到InnoDB相信讀者總會想到其支援事務的特性，事務具有隔離性，如果將總數存起來，怎麼保證各個事務之間的總數的一致性呢？不明白的看圖
事務A和事務B中的count(*)的執行結果是不同的，因此InnoDB引擎在每個事務中返回多少行是不確定的，只能一行一行的讀出來用來判斷總數。

如何提升count效率

在InnoDB對於如何提升count(*)的查詢效率，網上有多種解決辦法，這裡主要介紹三種，並分析可行性。

show table status

show table status這個命令能夠很快的查詢出資料庫中每個表的行數，但是真的能夠替代count(*)嗎？
答案是不能。原因很簡單，這個命令統計出來的值是一個「估值」，因此是不準確的，官方文件說誤差大概在40%-50%。
因此這種方法直接pass，不準確還用它幹嘛。

快取系統儲存總數

這種方法也是最容易想到的，增加一行就+1，刪除一行就-1，並且快取系統讀取也是很快，既簡單又方便的為什麼不用？
快取系統和Mysql是兩個系統，比如redis和Mysql這兩個是典型的比較。兩個系統最難的就是在高併發下無法保證資料的一致性。
通過上面兩張圖，無論是redis計數+1還是insert into user先執行，最終都會導致資料在邏輯上的不一致。第一張圖會出現redis計數少了，第二張圖雖然計數正確了但是並沒有查詢出插入的那一行資料。
在併發系統裡面，我們是無法精確控制不同執行緒的執行時刻的，因為存在圖中的這種操作序列，所以，我們說即使Redis正常工作，這個計數值還是邏輯上不精確的。

在資料庫儲存計數

通過快取系統儲存的分析得知了使用快取無法保證資料在邏輯上的一致性，因此我們想到了直接使用資料庫來儲存，有了「事務」的支援，也就保證了資料的一致性了。
如何使用呢？很簡單，直接將計數儲存在一張表中（table_name,total）。
至於執行的邏輯只需要將快取系統中redis計數+1改成total欄位+1即可，如下圖：
由於在同一個事務中，保證了資料在邏輯上的一致性。

不同count的用法

count()是一個聚合函式，對於返回的結果集，一行行地判斷，如果count函式的引數不是NULL，累計值就加1，否則不加。最後返回累計值。
count的用法有多種，分別是count(*)、count(欄位)、count(1)、count(主鍵id)。那麼多種用法，到底有什麼差別呢？當然，「前提是沒有where條件語句」。
count(id)：InnoDB引擎會遍歷整張表，把每一行的id值都取出來，返回給server層。server層拿到id後，判斷是不可能為空的，就按行累加。
count(1)：InnoDB引擎遍歷整張表，但不取值。server層對於返回的每一行，放一個數字1進去，判斷是不可能為空的，按行累加。
count(欄位)：count(*)：不會把全部欄位取出來，而是專門做了優化，不取值。count(*)肯定不是null，按行累加。
- 如果這個“欄位”是定義為not null的話，一行行地從記錄裡面讀出這個欄位，判斷不能為null，按行累加；
- 如果這個欄位定義允許為null，那麼執行的時候，判斷到有可能是null，還要把值取出來再判斷一下，不是null才累加。
所以結論很簡單：「按照效率排序的話，count(欄位)<count(主鍵id)<count(1)≈count(*)，所以建議讀者，儘量使用count(*)。」
「注意」：這裡肯定有人會問，count(id)不是走的索引嗎，為什麼查詢效率和其他的差不多呢？陳某在這裡解釋一下，雖然走的索引，但是還是要一行一行的掃描才能統計出來總數。

總結

MyISAM表雖然count(*)很快，但是不支援事務；
show table status命令雖然返回很快，但是不準確；
InnoDB直接count(*)會遍歷全表(沒有where條件)，雖然結果準確，但會導致效能問題。
快取系統的儲存計數雖然簡單效率高，但是無法保證資料的一致性。
資料庫儲存計數很簡單，也能保證資料的一致性，建議使用。
「思考題，讀者留言區討論」：在系統高併發的情況下，使用資料庫儲存計數，是先更新計數+1,還是先插入資料。即是先update total+=1還是先insert into。

&nb

Mysql效能優化：為什麼你的count(*)這麼慢？

導讀在開發中一定會用到統計一張表的行數，比如一個交易系統，老闆會讓你每天生成一個報表，這些統計資訊少不了 sql 中的count函式。但是隨著記錄越來越多，查詢的速度會越來越慢，為什麼會這樣呢？Mysql內部到底是怎麼處理的？今天這篇文章將從Mysql內部對於count函式是怎樣處理的？本文首發於作

MySQL效能優化：MySQL中的隱式轉換造成的索引失效

資料庫優化是一個任重而道遠的任務，想要做優化必須深入理解資料庫的各種特性。在開發過程中我們經常會遇到一些原因很簡單但造成的後果卻很嚴重的疑難雜症，這類問題往往還不容易定位，排查費時費力最後發現是一個很小的疏忽造成的，又或者是因為不瞭解某個技術特性產生的。於資料庫層面，最常見的恐怕就是索引失效了，且一開始因為

Mysql效能優化：什麼是索引下推？

導讀索引下推（index condition pushdown ）簡稱ICP，在Mysql5.6的版本上推出，用於優化查詢。在不使用ICP的情況下，在使用非主鍵索引（又叫普通索引或者二級索引）進行查詢時，儲存引擎通過索引檢索到資料，然後返回給MySQL伺服器，伺服器然後判斷資料是否符合條件。

Mysql效能優化：如何給字串加索引？

導讀現代大部分的登入系統都支援郵箱、手機號碼登入兩種方式，那麼如何在郵箱或者手機號碼這個字串上建立索引才能保證效能最佳呢？今天這篇文章就來探討一下在Mysql中如何給一個字串加索引才能達到效能最佳。本文首發於作者的微信公眾號【碼猿技術專欄】，原創不易，喜歡的朋友支援一下，謝謝！！！陳某將會

MySQL (一) —— MySQL效能優化之慢查詢日誌

&nbs

MySQL效能優化(六)：分割槽

一: 分割槽簡介分割槽是根據一定的規則，資料庫把一個表分解成多個更小的、更容易管理的部分。就訪問資料庫應用而言，邏輯上就只有一個表或者一個索引，但實際上這個表可能有N個物理分割槽物件組成，每個分割槽都是一個獨立的物件，可以獨立處理，可以作為表的一部分進行處理。分割槽對應用來說是完全

mysql 效能優化之慢查詢

在執行mysql語句的時候，我們可能會遇到2003的錯誤(執行超時錯誤)，或者執行太耗時間了，這時我們需要定位到那些語句比較耗時，從而有目標的優化對應的sql語句。那麼怎麼定位到這些sql語句呢？這時，我們就需要考慮到mysql的慢查詢了。對於mysql的操作我覺得native非常好，

mysql效能優化（1）慢查詢

1.查詢是否有開啟慢查詢上面發現是OFF，說明沒有開啟。慢查詢日誌檔案儲存在/var/lib/mysql/master-slow.log(因為我主機名叫master)，預設的慢查詢時間是10秒。 2.臨時開啟慢查詢如果只是臨時開啟，下次重啟服務，就會失效，那麼執行下面兩條命

Java面試準備十六：資料庫——MySQL效能優化

這裡只是為了記錄，由於自身水平實在不怎麼樣，難免錯誤百出，有錯的地方還望大家多多指出，謝謝。 1. 為查詢快取優化你的查詢大多數的MySQL伺服器都開啟了查詢快取。這是提高性最有效的方法之一，而且這是被MySQL的資料庫引擎處理的。當有很多相同的查

java 效能優化：35 個小細節，讓你提升 java 程式碼的執行效率

前言程式碼優化，一個很重要的課題。可能有些人覺得沒用，一些細小的地方有什麼好修改的，改與不改對於程式碼的執行效率有什麼影響呢？這個問題我是這麼考慮的，就像大海里面的鯨魚一樣，它吃一條小蝦米有用嗎？沒用，但是，吃的小蝦米一多之後，鯨魚就被餵飽了。程式碼優化也是一樣，如果專案著眼於儘快無BUG上線，那

Android效能優化：手把手帶你全面瞭解記憶體洩露 & 解決方案

前言在Android中，記憶體洩露的現象十分常見；而記憶體洩露導致的後果會使得應用Crash 本文全面介紹了記憶體洩露的本質、原因 & 解決方案，最終提供一些常見的記憶體洩露分析工具，希望你們會喜歡。掃碼檢視公眾號：目錄 1. 簡介即 ML （

MYSQL語句優化：limit和count的優化

正文： SQL語句的優化大有學問，不同的寫法取得的效果大為不同。今例舉limit和count語句來作下探討1，limit語句的優化。常見的limit語句的形式為:LIMIT m,n;隨之偏移量m的增大，limit語句的執行效率也跟著下降。所以，優化limit的原則是儘量不

Mysql效能優化--慢查詢、索引、分表、增量備份還原

轉自 http://www.cnblogs.com/jiekzou/p/5371085.html Mysql資料庫的優化技術對mysql優化是一個綜合性的技術，主要包括表的設計合理化(符合3NF)新增適當索引(index) [四種: 普通索

mysql效能優化-慢查詢分析、優化索引和配置（慢查詢日誌，explain，profile）

一、優化概述二、查詢與索引優化分析 1效能瓶頸定位 Show命令慢查詢日誌 explain分析查詢 profiling分析查詢 2索引及查詢優化三、配置優化 1) max_connections 2) back_log 3) interactive_timeout 4)

Android效能優化：手把手帶你全面瞭解繪製優化

前言在 Android開發中，效能優化策略十分重要本文主要講解效能優化中的繪製優化，希望你們會喜歡。目錄 1. 影響的效能繪製效能的好壞主要影響：Android應用中的頁面顯示速度 2. 如何影響效能繪製

mysql效能優化-慢查詢分析、優化索引和配置

目錄一、優化概述二、查詢與索引優化分析 1效能瓶頸定位 Show命令慢查詢日誌 explain分析查詢 profiling分析查詢 2索引及查詢優化三、配置優化 1) max_connections 2) back_lo

Android效能優化：手把手教你如何讓App更快、更穩、更省（含記憶體、佈局優化等）

前言在 Android開發中，效能優化策略十分重要因為其決定了應

乾貨：MySQL效能優化，in和exists

in和exists哪個效能更優 sql指令碼：上面的sql中訂單表中（order

JAVA效能優化：35個小細節讓你提升java程式碼的執行效率

程式碼優化，一個很重要的課題。可能有些人覺得沒用，一些細小的地方有什麼好修改的，改與不改對於程式碼的執行效率有什麼影響呢？這個問題

MySQL(三) —— MySQL效能優化之索引優化

MySQL索引優化如何選擇合適的列建立索引？在where從句、group by 從句、order by 從句、on 從句中出現的列索引欄位越小越好離散度大的列放在聯合索引的前面如何判斷列的離散度？去重查詢看列的唯一值，唯一值越多則離散度越大。 mysql&

Mysql效能優化：為什麼你的count(*)這麼慢？

導讀

count的實現方式

為什麼InnoDB不將總數存起來？

如何提升count效率

show table status

快取系統儲存總數

在資料庫儲存計數

不同count的用法

總結

&nb

相關推薦