MySQL查詢快取的小知識
前言
我們知道,快取的設計思想在RDBMS資料庫中無處不在,就拿號稱2500w行程式碼,bug堆積如山的Oracle資料庫來說,SQL的執行計劃可以快取在library cache中避免再次執行相同SQL發生硬解析(語法分析->語義分析->生成執行計劃),SQL執行結果快取在RESULT CACHE記憶體元件中,有效的將物理IO轉化成邏輯IO,提高SQL執行效率。
MySQL的QueryCache跟Oracle類似,快取的是SQL語句文字以及對應的結果集,看起來是一個很棒的Idea,那為什麼從MySQL 4.0推出之後,5.6中預設禁用,5.7中被deprecated(廢棄)以及8.0版本被Removed,今天就聊聊MySQL QueryCache的前世今生。
QueryCache介紹
MySQL查詢緩(QC:QueryCache)在MySQL 4.0.1中引入,查詢快取儲存SELECT語句的文字以及傳送給客戶機的結果集,如果再次執行相同的SQL,Server端將從查詢快取中檢索結果返回給客戶端,而不是再次解析執行SQL,查詢快取在session之間共享,因此,一個客戶端生成的快取結果集,可以響應另一個客戶端執行同樣的SQL。
回到開頭的問題,如何判斷SQL是否共享?
通過SQL文字是否完全一致來判斷,包括大小寫,空格等所有字元完全一模一樣才可以共享,共享好處是可以避免硬解析,直接從QC獲取結果返回給客戶端,下面的兩個SQL是不共享滴,因為一個是from,另一個是From。
--SQL 1 select id,balance from account where id = 121; --SQL 2 select id,balance From account where id = 121;
下面是Oracle資料庫通過SQL_TEXT生成sql_id的演算法,如果sql_id不一樣說明就不是同一個SQL,就不共享,就會發生硬解析。
#!/usr/bin/perl -w use Digest::MD5 qw(md5 md5_hex md5_base64); use Math::BigInt; my $stmt = "select id,balance from account where id = 121\0"; my $hash = md5 $stmt; my($a,$b,$msb,$lsb) = unpack("V*",$hash); my $sqln = $msb*(2**32)+$lsb; my $stop = log($sqln) / log(32) + 1; my $sqlid = ''; my $charbase32 = '0123456789abcdfghjkmnpqrstuvwxyz'; my @chars = split '',$charbase32; for($i=0; $i < $stop-1; $i++){ my $x = Math::BigInt->new($sqln); my $seq = $x->bdiv(32**$i)->bmod(32); $sqlid = $chars[$seq].$sqlid; } print "SQL is:\n $stmt \nSQL_ID is\n $sqlid\n";
大家可以發現SQL 1和SQL 2通過程式碼生成的sql_id值是不一樣,所以不共享。
SQL is: select id,balance from account where id = 121 SQL_ID is dm5c6ck1g7bds SQL is: select id,balance From account where id = 121 SQL_ID is 6xb8gvs5cmc9b
如果讓你比較兩個Java程式碼檔案的內容的有何差異,只需要將這段程式碼理解透了,就可以改造實現自己的業務邏輯。
QueryCache配置
mysql> show variables like '%query_cache%'; +------------------------------+----------+ | Variable_name | Value | +------------------------------+----------+ | have_query_cache | YES | | query_cache_limit | 1048576 | | query_cache_min_res_unit | 4096 | | query_cache_size | 16777216 | | query_cache_type | OFF | | query_cache_wlock_invalidate | OFF |
Variable_name | Description |
---|---|
have_query_cache | 查詢快取是否可用,YES-可用;NO-不可用,如果用標準二進位制MySQL,值總是YES。 |
query_cache_limit | 控制單個查詢結果集的最大尺寸,預設是1MB。 |
query_cache_min_res_unit | 查詢快取分片資料塊的大小,預設是4KB,可以滿足大部分業務場景。 |
query_cache_size | 查詢快取大小,單位Bytes,設定為0是禁用QueryCache,注意:不要將快取的大小設定得太大,由於在更新過程中需要執行緒鎖定QueryCache,因此對於非常大的快取,您可能會看到鎖爭用問題。 |
query_cache_type | 當query_cache_size>0;該變數影響qc如何工作,有三個取值0,1,2,0:禁止快取或檢索快取結果;1:啟用快取,SELECT SQL_NO_CACHE的語句除外;2:只快取以SELECT SQL_CACHE開頭的語句。 |
query_cache_min_res_unit說明
預設大小是4KB,如果有很多查詢結果很小,那麼預設資料塊大小可能會導致記憶體碎片,由於記憶體不足,碎片可能會強制查詢快取從快取中刪除查詢。
在這種情況下,可以減小query_cache_min_res_unit的值,由於修剪而刪除的空閒塊和查詢的數量由Qcache_free_blocks和Qcache_lowmem_prunes狀態變數的值給出,如果大量的查詢有較大的結果集,可以增大該引數的值來提高效能。
通常開啟QueryCache方式
# 修改MySQL配置檔案/etc/my.cnf,新增如下配置,重啟MySQL server即可。 [mysqld] query_cache_size = 32M query_cache_type = 1
QueryCache使用
先搞點測試資料,分別對禁用和開啟QueryCache下的場景進行測試。
--建立一個使用者表users,並且插入100w資料。 CREATE TABLE `users` ( `id` bigint NOT NULL AUTO_INCREMENT,`name` varchar(20) NOT NULL DEFAULT '' COMMENT '姓名',`age` tinyint NOT NULL DEFAULT '0' COMMENT 'age',`gender` char(1) NOT NULL DEFAULT 'M' COMMENT '性別',`phone` varchar(16) NOT NULL DEFAULT '' COMMENT '手機號',`create_time` datetime NOT NULL DEFAULT CURRENT_TIMESTAMP COMMENT '建立時間',`update_time` datetime NOT NULL DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP COMMENT '修改時間',PRIMARY KEY (`id`) ) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COMMENT='使用者資訊表'; select count(*) from users; +----------+ | count(*) | +----------+ | 1000000 |
禁用queryCache場景
在不使用QueryCache的時候,每次執行相同的查詢語句,都要發生一次硬解析,消耗大量的資源。
#禁用QueryCache的配置 query_cache_size = 0 query_cache_type = 0
重複執行下面查詢,觀察執行時間。
--第一次執行查詢語句 mysql> select * from users order by create_time desc limit 10; +---------+------------+-----+--------+-------------+---------------------+---------------------+ | id | name | age | gender | phone | create_time | update_time | +---------+------------+-----+--------+-------------+---------------------+---------------------+ | 997855 | User997854 | 54 | M | 15240540354 | 2020-12-15 14:34:50 | 2020-12-15 14:34:50 | ....... 10 rows in set (0.89 sec) --第二次執行同樣的查詢語句 mysql> select * from users order by create_time desc limit 10; +---------+------------+-----+--------+-------------+---------------------+---------------------+ | id | name | age | gender | phone | create_time | update_time | +---------+------------+-----+--------+-------------+---------------------+---------------------+ | 997855 | User997854 | 54 | M | 15240540354 | 2020-12-15 14:34:50 | 2020-12-15 14:34:50 | ....... 10 rows in set (0.90 sec) -- profile跟蹤情況 mysql> show profile cpu,block io for query 1; +----------------------+----------+----------+------------+--------------+---------------+ | Status | Duration | CPU_user | CPU_system | Block_ops_in | Block_ops_out | +----------------------+----------+----------+------------+--------------+---------------+ | preparing | 0.000022 | 0.000017 | 0.000004 | 0 | 0 | | Sorting result | 0.000014 | 0.000009 | 0.000005 | 0 | 0 | | executing | 0.000011 | 0.000007 | 0.000004 | 0 | 0 | | Sending data | 0.000021 | 0.000016 | 0.000004 | 0 | 0 | | Creating sort index | 0.906290 | 0.826584 | 0.000000 | 0 | 0 |
可以看到,多次執行同樣的SQL查詢語句,執行時間都是0.89s左右,幾乎沒有差別,同時時間主要消耗在Creating sort index階段。
開啟queryCache場景
開啟查詢快取時,查詢語句第一次被執行時會將SQL文字及查詢結果快取在QC中,下一次執行同樣的SQL執行從QC中獲取資料返回給客戶端即可。
#禁用QueryCache的配置 query_cache_size = 32M query_cache_type = 1
--第一次執行查詢語句 mysql> select * from users order by create_time desc limit 10; +---------+------------+-----+--------+-------------+---------------------+---------------------+ | id | name | age | gender | phone | create_time | update_time | +---------+------------+-----+--------+-------------+---------------------+---------------------+ | 997855 | User997854 | 54 | M | 15240540354 | 2020-12-15 14:34:50 | 2020-12-15 14:34:50 | ....... 10 rows in set (0.89 sec) --第二次執行查詢語句 mysql> select * from users order by create_time desc limit 10; +---------+------------+-----+--------+-------------+---------------------+---------------------+ | id | name | age | gender | phone | create_time | update_time | +---------+------------+-----+--------+-------------+---------------------+---------------------+ | 997855 | User997854 | 54 | M | 15240540354 | 2020-12-15 14:34:50 | 2020-12-15 14:34:50 | ....... 10 rows in set (0.00 sec) -- profile跟蹤資料 mysql> show profile cpu,block io for query 3; +--------------------------------+----------+----------+------------+--------------+---------------+ | Status | Duration | CPU_user | CPU_system | Block_ops_in | Block_ops_out | +--------------------------------+----------+----------+------------+--------------+---------------+ | Waiting for query cache lock | 0.000016 | 0.000015 | 0.000001 | 0 | 0 | | checking query cache for query | 0.000007 | 0.000007 | 0.000000 | 0 | 0 | | checking privileges on cached | 0.000004 | 0.000003 | 0.000000 | 0 | 0 | | checking permissions | 0.000034 | 0.000033 | 0.000001 | 0 | 0 | | sending cached result to clien | 0.000018 | 0.000017 | 0.000001 | 0 | 0 |
可以看到,第一次執行QueryCache裡沒有快取SQL文字及資料,執行時間0.89s,由於開啟了QC,SQL文字及執行結果被快取在QC中,第二次執行執行同樣的SQL查詢語句,直接命中QC且返回資料,不需要發生硬解析,所以執行時間降低為0s,從profile裡看到sending cached result to client直接傳送QC中的資料返回給客戶端。
查詢快取命中率
查詢快取相關的status變數
mysql>SHOW GLOBAL STATUS LIKE 'QCache\_%'; +-------------------------+----------+ | Variable_name | Value | +-------------------------+----------+ | Qcache_free_blocks | 1 | --查詢快取中可用記憶體塊的數目。 | Qcache_free_memory | 33268592 | --查詢快取的可用記憶體量。 | Qcache_hits | 121 | --從QC中獲取結果集的次數。 | Qcache_inserts | 91 | --將查詢結果集新增到QC的次數,意味著查詢已經不在QC中。 | Qcache_lowmem_prunes | 0 | --由於記憶體不足而從查詢快取中刪除的查詢數。 | Qcache_not_cached | 0 | --未快取的查詢數目。 | Qcache_queries_in_cache | 106 | --在查詢快取中註冊的查詢數。 | Qcache_total_blocks | 256 | --查詢快取中的塊總數。
查詢快取命中率及平均大小
Qcache_hits Query cache hit rate = ------------------------------------------------ x 100% Qcache_hits + Qcache_inserts + Qcache_not_cached query_cache_size = Qcache_free_memory Query Cache Avg Query Size = --------------------------------------- Qcache_queries_in_cache
更新操作對QC影響
舉個例子,支付系統的裡轉賬邏輯,先要鎖定賬戶再修改餘額,主要步驟如下:
Query_ID | Query | Description |
1 | reset query cache | 清空查詢快取。 |
2 | select balance from account where id = 121 | 第一次執行,未命中QC,新增到QC。 |
3 | select balance from account where id = 121 | 命中QC,直接返回結果。 |
4 | update account set balance = balance - 1000 where id = 121 | 更新,鎖定query cche進行更新,快取資料失效。 |
5 | select balance from account where id = 121 | 快取已失效,未命中,新增到QC。 |
6 | select balance from account where id = 121 | 命中QC,直接返回結果。 |
為何放棄QueryCache
一般業務場景
從業務系統的操作型別,可以分為OLTP(OnLine Transaction Processing 聯機事務處理系統)和OLAP(OnLine Analysis Processing聯機分析處理系統),對於政企業務,也可以分為BOSS(Business Operation Support System-業務操作支撐系統,簡稱業支)和BASS(Business Analysis Support System-業務分析支撐系統,簡稱經分),來總結下這兩類系統的特點。
適合QueryCache的場景
首先,查詢快取QC的大小隻有幾MB,不適合將快取設定得太大,由於在更新過程中需要執行緒鎖定QueryCache,因此對於非常大的快取,可能會看到鎖爭用問題。那麼,哪些情況有助於從查詢快取中獲益呢?以下是理想條件:
- 相同的查詢是由相同或多個客戶機重複發出的。
- 被訪問的底層資料本質上是靜態或半靜態的。
- 查詢有可能是資源密集型和/或構建簡短但計算複雜的結果集,同時結果集比較小。
- 併發性和查詢QPS都不高。
這4種情況只是理想情況下,實際的業務系統都是有CRUD操作的,資料更新比較頻繁,查詢介面的QPS比較高,所以能滿足上面的理想情況下的業務場景實在很少,我能想到就是配置表,資料字典表這些基本都是靜態或半靜態的,可以時通過QC來提高查詢效率。
不適合QueryCache的場景
如果表資料變化很快,則查詢快取將失效,並且由於不斷從快取中刪除查詢,從而使伺服器負載升高,處理速度變得更慢,如果資料每隔幾秒鐘更新一次或更加頻繁,則查詢快取不太可能合適。
同時,查詢快取使用單個互斥體來控制對快取的訪問,實際上是給伺服器SQL處理引擎強加了一個單執行緒閘道器,在查詢QPS比較高的情況下,可能成為一個性能瓶頸,會嚴重降低查詢的處理速度。因此,MySQL 5.6中預設禁用了查詢快取。
刪除QueryCache
The query cache is deprecated as of MySQL 5.7.20,and is removed in MySQL 8.0. Deprecation includes query_cache_type,可以看到從MySQL 5.6的預設禁用,5.7的廢棄以及8.0的徹底刪除,Oracle也是綜合了各方面考慮做出了這樣的選擇。
上面聊了下適合和不適合的QueryCache的業務場景,發現這個特性對業務場景要求過於苛刻,與實際業務很難吻合,而且開啟之後,對資料庫併發度和處理能力都會降低很多,下面總結下為何MySQL從Disabled->Deprecated->Removed QueryCache的主要原因。
同時查詢快取碎片化還會導致伺服器的負載升高,影響資料庫的穩定性,在Oracle官方搜尋QueryCache可以發現,有很多Bug存在,這也就決定了MySQL 8.0直接果斷的Remove了該特性。
總結
上面為大家介紹了MySQL QueryCache從推出->禁用->廢棄->刪除的心路歷程,設計之初是為了減少重複SQL查詢帶來的硬解析開銷,同時將物理IO轉化為邏輯IO,來提高SQL的執行效率,但是MySQL經過了多個版本的迭代,同時在硬體儲存發展之快的今天,QC幾乎沒有任何收益,而且還會降低資料庫併發處理能力,最終在8.0版本直接Removd掉了。
其實快取設計思想在硬體和軟體領域無處不在,硬體方面:RAID卡,CPU都有自己快取,軟體方面就太多了,OS的cache,資料庫的buffer pool以及Java程式的快取,作為一名研發工程師,需要根據業務場景選擇合適快取方案是非常重要的,如果都不合適,就需進行定製化開發快取,來更好的Match自己的業務場景,今天就聊這麼多,希望對大家有所幫助。
我是敖丙,你知道的越多,你不知道的越多,感謝各位人才的:點贊、收藏和評論,我們下期見!
以上就是MySQL查詢快取的小知識的詳細內容,更多關於MySQL查詢快取的資料請關注我們其它相關文章!