1. 程式人生 > >MySql 筆記 | MySQL架構總覽->查詢執行流程->SQL解析順序

MySql 筆記 | MySQL架構總覽->查詢執行流程->SQL解析順序

前言:一直是想知道一條SQL語句是怎麼被執行的,它執行的順序是怎樣的,然後檢視總結各方資料,就有了下面這一篇博文了。本文將從MySQL總體架構—>查詢執行流程—>語句執行順序來探討一下其中的知識。

一、MySQL架構總覽

架構最好看圖,再配上必要的說明文字。

下圖根據參考書籍中一圖為原本,再在其上新增上了自己的理解。 在這裡插入圖片描述

從上圖中我們可以看到,整個架構分為兩層:

  • 上層是MySQLD,被稱為“SQL Layer”;
  • 下層是各種各樣對上層提供介面的儲存引擎,被稱為“Storage Engine Layer”。

其它各個模組和元件,從名字上就可以簡單瞭解到它們的作用,這裡就不再累述了。

二、查詢執行流程

下面再向前走一些,容我根據自己的認識說一下查詢執行的流程是怎樣的:

  1. 連線

    1. 客戶端發起一條Query請求,監聽客戶端的“連線管理模組”接收請求;
    2. 將請求轉發到‘連線進/執行緒模組’;
    3. 呼叫“使用者模組”來進行授權檢查;
    4. 通過檢查後,‘連線進/執行緒模組’從‘執行緒連線池’中取出空閒的被快取的連線執行緒和客戶端請求對接,如果失敗則建立一個新的連線請求。
  2. 處理

    1. 先查詢快取,檢查Query語句是否完全匹配,接著再檢查是否具有許可權,都成功則直接取資料返回;
    2. 上一步有失敗則轉交給“命令解析器”,經過詞法分析,語法分析後生成解析樹;
    3. 接下來是預處理階段,處理解析器無法解決的語義,檢查許可權等,生成新的解析樹;
    4. 再轉交給對應的模組處理;
    5. 如果是SELECT查詢還會經由‘查詢優化器’做大量的優化,生成執行計劃;
    6. 模組收到請求後,通過“訪問控制模組”檢查所連線的使用者是否有訪問目標表和目標欄位的許可權;
    7. 有則呼叫“表管理模組”,先是檢視table cache中是否存在,有則直接對應的表和獲取鎖,否則重新開啟表文件;
    8. 根據表的meta資料,獲取表的儲存引擎型別等資訊,通過介面呼叫對應的儲存引擎處理;
    9. 上述過程中產生資料變化的時候,若開啟日誌功能,則會記錄到相應二進位制日誌檔案中。
  3. 結果

    1. Query請求完成後,將結果集返回給“連線進/執行緒模組”;
    2. 返回的也可以是相應的狀態標識,如成功或失敗等;
    3. “連線進/執行緒模組”進行後續的清理工作,並繼續等待請求或斷開與客戶端的連線。

一圖小總結: 在這裡插入圖片描述

三、SQL解析順序

接下來再走一步,讓我們看看一條SQL語句的前世今生。

首先看一下示例語句:

SELECT DISTINCT
    <select_list>
FROM
     <left_table> <join_type>
JOIN <right_table > ON <join_condition>
WHERE
    <where_condition>
GROUP BY
    <group_by_list>
HAVING
    <having_condition>
ORDER BY
    <order_by_condition>
LIMIT <limit_number>

然而它的執行順序是這樣的:

FROM <left_table>
ON <join_condition>
<join_type> JOIN <right_table>
WHERE <where_condition>
GROUP BY <group_by_list>
HAVING <having_condition>
SELECT 
DISTINCT <select_list>
ORDER BY <order_by_condition>
LIMIT <limit_number>

雖然自己沒想到是這樣的,不過一看還是很自然和諧的,從哪裡獲取,不斷的過濾條件,要選擇一樣或不一樣的,排好序,那才知道要取前幾條呢。

既然如此了,那就讓我們一步步來看看其中的細節吧。

1、準備工作
1.1 建立測試資料庫
create database testQuery
1.2 建立測試表
CREATE TABLE table1 (
    uid VARCHAR(10) NOT NULL,
    name VARCHAR(10) NOT NULL,
    PRIMARY KEY(uid)
)ENGINE=INNODB DEFAULT CHARSET=UTF8;

CREATE TABLE table2 (
    oid INT NOT NULL auto_increment,
    uid VARCHAR(10),
    PRIMARY KEY(oid)
)ENGINE=INNODB DEFAULT CHARSET=UTF8;
1.3 插入資料
INSERT INTO table1(uid,name) VALUES('aaa','mike'),('bbb','jack'),('ccc','mike'),('ddd','mike');
INSERT INTO table2(uid) VALUES('aaa'),('aaa'),('bbb'),('bbb'),('bbb'),('ccc'),(NULL);
1.4 最後想要的結果
SELECT
    a.uid,
    count(b.oid) AS total
FROM
    table1 AS a
LEFT JOIN table2 AS b ON a.uid = b.uid
WHERE
    a. NAME = 'mike'
GROUP BY
    a.uid
HAVING
    count(b.oid) < 2
ORDER BY
    total DESC
LIMIT 1;

!現在開始SQL解析之旅吧!

2、開始SQL解析
2.1 FROM

當涉及多個表的時候,左邊表的輸出會作為右邊表的輸入,之後會生成一個虛擬表 VT1

  • (1-J1)笛卡爾積

計算兩個相關聯表的笛卡爾積(CROSS JOIN) ,生成虛擬表VT1-J1

mysql> select * from table1,table2;
+-----+------+-----+------+
| uid | name | oid | uid  |
+-----+------+-----+------+
| aaa | mike |   1 | aaa  |
| bbb | jack |   1 | aaa  |
| ccc | mike |   1 | aaa  |
| ddd | mike |   1 | aaa  |
| aaa | mike |   2 | aaa  |
| bbb | jack |   2 | aaa  |
| ccc | mike |   2 | aaa  |
| ddd | mike |   2 | aaa  |
| aaa | mike |   3 | bbb  |
| bbb | jack |   3 | bbb  |
| ccc | mike |   3 | bbb  |
| ddd | mike |   3 | bbb  |
| aaa | mike |   4 | bbb  |
| bbb | jack |   4 | bbb  |
| ccc | mike |   4 | bbb  |
| ddd | mike |   4 | bbb  |
| aaa | mike |   5 | bbb  |
| bbb | jack |   5 | bbb  |
| ccc | mike |   5 | bbb  |
| ddd | mike |   5 | bbb  |
| aaa | mike |   6 | ccc  |
| bbb | jack |   6 | ccc  |
| ccc | mike |   6 | ccc  |
| ddd | mike |   6 | ccc  |
| aaa | mike |   7 | NULL |
| bbb | jack |   7 | NULL |
| ccc | mike |   7 | NULL |
| ddd | mike |   7 | NULL |
+-----+------+-----+------+
28 rows in set (0.00 sec)
  • (1-J2)ON過濾

基於虛擬表VT1-J1這一個虛擬表進行過濾,過濾出所有滿足ON 謂詞條件的列,生成虛擬表VT1-J2

注意:這裡因為語法限制,使用了’WHERE’代替,從中讀者也可以感受到兩者之間微妙的關係;

mysql> SELECT
    -> *
    -> FROM
    -> table1,
    -> table2
    -> WHERE
    -> table1.uid = table2.uid
    -> ;
+-----+------+-----+------+
| uid | name | oid | uid  |
+-----+------+-----+------+
| aaa | mike |   1 | aaa  |
| aaa | mike |   2 | aaa  |
| bbb | jack |   3 | bbb  |
| bbb | jack |   4 | bbb  |
| bbb | jack |   5 | bbb  |
| ccc | mike |   6 | ccc  |
+-----+------+-----+------+
6 rows in set (0.00 sec)
  • (1-J3)新增外部列

如果使用了外連線(LEFT,RIGHT,FULL),主表(保留表)中的不符合ON條件的列也會被加入到VT1-J2中,作為外部行,生成虛擬表VT1-J3

mysql> SELECT
    -> *
    -> FROM
    -> table1 AS a
    -> LEFT OUTER JOIN table2 AS b ON a.uid = b.uid;
+-----+------+------+------+
| uid | name | oid  | uid  |
+-----+------+------+------+
| aaa | mike |    1 | aaa  |
| aaa | mike |    2 | aaa  |
| bbb | jack |    3 | bbb  |
| bbb | jack |    4 | bbb  |
| bbb | jack |    5 | bbb  |
| ccc | mike |    6 | ccc  |
| ddd | mike | NULL | NULL |
+-----+------+------+------+
7 rows in set (0.00 sec)

下面從網上找到一張很形象的關於‘SQL JOINS’的解釋圖,如若侵犯了你的權益,請勞煩告知刪除,謝謝。 在這裡插入圖片描述

2.2 WHERE

VT1過程中生成的臨時表進行過濾,滿足WHERE子句的列被插入到VT2表中。

注意:此時因為分組,不能使用聚合運算;也不能使用SELECT中建立的別名;

ON的區別:

  • 如果有外部列,ON針對過濾的是關聯表,主表(保留表)會返回所有的列;
  • 如果沒有新增外部列,兩者的效果是一樣的。

應用:

  • 對主表的過濾應該放在WHERE;
  • 對於關聯表,先條件查詢後連線則用ON,先連線後條件查詢則用WHERE;
mysql> SELECT
    -> *
    -> FROM
    -> table1 AS a
    -> LEFT OUTER JOIN table2 AS b ON a.uid = b.uid
    -> WHERE
    -> a. NAME = 'mike';
+-----+------+------+------+
| uid | name | oid  | uid  |
+-----+------+------+------+
| aaa | mike |    1 | aaa  |
| aaa | mike |    2 | aaa  |
| ccc | mike |    6 | ccc  |
| ddd | mike | NULL | NULL |
+-----+------+------+------+
4 rows in set (0.00 sec)
2.3 GROUP BY

這個子句會把VT2中生成的表按照GROUP BY中的列進行分組,生成VT3表。

注意:其後處理過程的語句,如SELECT、HAVING,所用到的列必須包含在GROUP BY中,對於沒有出現的,得用聚合函式;

原因:GROUP BY改變了對錶的引用,將其轉換為新的引用方式,能夠對其進行下一級邏輯操作的列會減少;

我的理解是:根據分組欄位,將具有相同分組欄位的記錄歸併成一條記錄,因為每一個分組只能返回一條記錄,除非是被過濾掉了,而不在分組欄位裡面的欄位可能會有多個值,多個值是無法放進一條記錄的,所以必須通過聚合函式將這些具有多值的列轉換成單值;

mysql> SELECT
    -> *
    -> FROM
    -> table1 AS a
    -> LEFT OUTER JOIN table2 AS b ON a.uid = b.uid
    -> WHERE
    -> a. NAME = 'mike'
    -> GROUP BY
    -> a.uid;
+-----+------+------+------+
| uid | name | oid  | uid  |
+-----+------+------+------+
| aaa | mike |    1 | aaa  |
| ccc | mike |    6 | ccc  |
| ddd | mike | NULL | NULL |
+-----+------+------+------+
3 rows in set (0.00 sec)
2.4 HAVING

這個子句對VT3表中的不同的組進行過濾,只作用於分組後的資料,滿足HAVING條件的子句被加入到VT4表中。

mysql> SELECT
    -> *
    -> FROM
    -> table1 AS a
    -> LEFT OUTER JOIN table2 AS b ON a.uid = b.uid
    -> WHERE
    -> a. NAME = 'mike'
    -> GROUP BY
    -> a.uid
    -> HAVING
    -> count(b.oid) < 2;
+-----+------+------+------+
| uid | name | oid  | uid  |
+-----+------+------+------+
| ccc | mike |    6 | ccc  |
| ddd | mike | NULL | NULL |
+-----+------+------+------+
2 rows in set (0.00 sec)
2.5 SELECT

這個子句對SELECT子句中的元素進行處理,生成VT5表。

  • (5-J1)計算表示式

計算 SELECT 子句中的表示式,生成 VT5-J1

  • (5-J2)DISTINCT

尋找 VT5-1 中的重複列,並刪掉,生成 VT5-J2

如果在查詢中指定了 DISTINCT 子句,則會建立一張記憶體臨時表(如果記憶體放不下,就需要存放在硬碟了)。這張臨時表的表結構和上一步產生的虛擬表 VT5 是一樣的,不同的是對進行 DISTINCT 操作的列增加了一個唯一索引,以此來除重複資料。

mysql> SELECT
    -> a.uid,
    -> count(b.oid) AS total
    -> FROM
    -> table1 AS a
    -> LEFT OUTER JOIN table2 AS b ON a.uid = b.uid
    -> WHERE
    -> a. NAME = 'mike'
    -> GROUP BY
    -> a.uid
    -> HAVING
    -> count(b.oid) < 2;
+-----+-------+
| uid | total |
+-----+-------+
| ccc |     1 |
| ddd |     0 |
+-----+-------+
2 rows in set (0.00 sec)
2.6 ORDER BY

VT5-J2 中的表中,根據 ORDER BY 子句的條件對結果進行排序,生成 VT6 表。

注意:唯一可使用SELECT中別名的地方。

mysql> SELECT
    -> a.uid,
    -> count(b.oid) AS total
    -> FROM
    -> table1 AS a
    -> LEFT OUTER JOIN table2 AS b ON a.uid = b.uid
    -> WHERE
    -> a. NAME = 'mike'
    -> GROUP BY
    -> a.uid
    -> HAVING
    -> count(b.oid) < 2
    -> ORDER BY
    -> total DESC;
+-----+-------+
| uid | total |
+-----+-------+
| ccc |     1 |
| ddd |     0 |
+-----+-------+
2 rows in set (0.00 sec)
2.7 LIMIT

LIMIT 子句從上一步得到的 VT6 虛擬表中選出從指定位置開始的指定行資料。

注意:offset和rows的正負帶來的影響。

當偏移量很大時效率是很低的,可以這麼做:

  • 採用子查詢的方式優化,在子查詢裡先從索引獲取到最大id,然後倒序排,再取N行結果集;
  • 採用INNER JOIN優化,JOIN子句裡也優先從索引獲取ID列表,然後直接關聯查詢獲得最終結果。
mysql> SELECT
    -> a.uid,
    -> count(b.oid) AS total
    -> FROM
    -> table1 AS a
    -> LEFT JOIN table2 AS b ON a.uid = b.uid
    -> WHERE
    -> a. NAME = 'mike'
    -> GROUP BY
    -> a.uid
    -> HAVING
    -> count(b.oid) < 2
    -> ORDER BY
    -> total DESC
    -> LIMIT 1;
+-----+-------+
| uid | total |
+-----+-------+
| ccc |     1 |
+-----+-------+
1 row in set (0.00 sec)

至此SQL的解析之旅就結束了,上圖總結一下: 在這裡插入圖片描述

參考書籍:

  • 《MySQL效能調優與架構實踐》
  • 《MySQL技術內幕:SQL程式設計》

文章來源:如需轉載,請保留AnnsShadoW和本文地址http://www.cnblogs.com/annsshadow/p/5037667.html