MySQL查詢執行的基礎
當我們希望MySQL能夠以更高的效能執行查詢時,最好的辦法就是弄清楚MySQL是如何優化和執行查詢的。一旦理解了這一點,很多查詢優化工作實際上就是遵循一些原則讓優化器能夠按照預想的合理方式執行
當我們想向MySQL傳送了一個請求時,MySQL到底做了什麼:
- 客戶端首先發送一條查詢請求給伺服器
- 伺服器首先檢查查詢快取,如果命中了快取,則立刻返回儲存在快取中的結果,否則進入下一階段。
- 伺服器端進行SQL解析、預處理,再由優化器生成對應的執行計劃
- MySQL根據優化器生成的執行計劃,呼叫儲存引擎的API來執行查詢
- 將結果返回客戶端
MySQL客戶端/伺服器通訊協議
MySQL客戶端和伺服器之間的通訊協議是“半雙工”的,這意味著,在任何一個時刻,要麼是由伺服器向客戶端傳送資料,要麼是由客戶端向伺服器傳送資料,這兩個動作不能同時發生。所以,我們無法也無需將一個訊息切成小塊獨立來發送。
這種協議雖然讓MySQL通訊簡單快速,但是也從很多地方限制了MySQL。一個明顯的限制是,這意味著沒法進行流量控制。一旦一端開始傳送資訊,另一端要接收完整個資訊才能夠響應它。
客戶端使用一個單獨的資料包將查詢傳給伺服器,當查詢語句太長時,服務端就會拒絕接受更多的資料並且丟擲相應的錯誤。因此,當查詢語句很長時,引數max_allowed_packet就特別重要。
相反的,一般伺服器響應給使用者的資料通常很多,由多個數據包組成。當伺服器開始相應客戶端請求時,客戶端必須完整的接受整個返回結果,而不能簡單的只取前幾條結果。
換而言之,當客戶端從伺服器獲取資料時,MySQL會一直向客戶端推送資料,客戶端也沒法讓伺服器停下來。
查詢狀態
對於一個MySQL連線或者說一個執行緒,任何時刻都有一個狀態,該狀態表示了MySQL當前正在做什麼:
- Sleep: 執行緒正在等待客戶端傳送新的請求
- Query: 執行緒正在執行查詢或者正在將結果傳送給客戶端
- Locked: 在MySQL伺服器層,該執行緒正在等待表鎖
- Analyzing and statistics: 執行緒正在收集儲存引擎的統計資訊,並生成查詢的執行計劃
- Copying and tmp table [on disk]: 執行緒正在執行查詢,並將其結果集都複製到一個臨時表中,這種狀態要麼就是在做GROUP BY 操作,要麼就是檔案排序操作。如果這個狀態後面還有 on disk標記,那麼表示MySQL正在將一個記憶體臨時表存放在磁碟上
- Sorting result: 執行緒正在對結果集進行排序
- Sending data: 這表示多種情況:執行緒可能在多個狀態之間傳送資料,或者生成結果集,或者在向客戶端返回資料
查詢快取
在解析一個查詢語句之前,如果查詢快取是開啟的,那麼MySQL會優先檢查這個查詢是否命中查詢快取中的資料,這個檢查是通過一個對大小寫敏感的雜湊查詢實現的。
查詢和快取中的查詢即使只有一個位元組不同,也不會匹配快取結果。這種情況下查詢就會進入下一個階段。
如果當前的查詢恰好命中了查詢快取,那麼在返回查詢結果之前MySQL會檢查一次使用者許可權。這仍然是無需解析查詢SQL語句的,因為在查詢快取中已經存放了當前查詢所需要訪問的表資訊。
如果許可權沒有問題,MySQL就會跳過所有其他階段,直接從快取表中拿到結果並且返回給客戶端。在這種情況下,查詢不會被解析,不用生成執行計劃,不會被執行。
查詢優化處理
查詢的生命週期的下一步是將一個SQL轉換成一個執行接話,MySQL再按照這個執行計劃和儲存引擎進行互動。
這包括多個子階段:解析SQL、預處理、優化SQL執行接話。
這些過程中任何出錯都可能終止查詢。
查詢執行引擎
在解析和優化階段,MySQL將會生成查詢對應的執行接話,MySQL的查詢執行引擎則根據這個執行計劃來完成整個查詢。這裡的執行計劃是一個數據結構,而不是其他很多關係型資料庫那樣的位元組碼。
相對於查詢優化階段,查詢執行階段並不那麼複雜:MySQL只是簡單的根據執行計劃給出的指令逐步執行。在根據執行計劃逐步執行的過程中,有大量的操作需要通過呼叫儲存引擎實現的介面來完成。
返回結果給客戶端
查詢執行的最後一個階段是將結果返回給客戶端。及時查詢不需要返回結果給客戶端,MySQL仍然會返回這個查詢的資訊,如該查詢影響到的行數。
在這個階段中,如果查詢是可以被快取的,那麼MySQL在這個階段也將會被存放到查詢快取中。
MySQL將結果集返回給客戶端是一個增量地、逐步返回的過程。這樣做有兩個好處:伺服器端無需儲存太多的結果,也就不會因為要返回太多結果而消耗太多記憶體。這樣的處理也會讓MySQL客戶端第一時間獲得返回的結果。
結果集中的每一行都會以一個滿足MySQL客戶端/伺服器通訊協議的封包傳送,再通過TCP協議進行傳輸,在TCP傳輸中,可能會對MySQL的封包進行快取然後批量傳輸。