(轉)MySQL join語法解析與性能分析
文章轉載的:http://www.cnblogs.com/BeginMan/p/3754322.html
一、join語法概述
join用於多表中字段之間的聯系,語法如下:
... FROM table1 INNER|LEFT|RIGHT JOIN table2 ON conditiona
table1:左表;table2:右表
JOIN按照功能大致分為如下三類:
(1)INNER JOIN(內連接或等值連接):取得兩個表中存在連接匹配關系的記錄。
(2)LEFT JOIN(左連接):取得左表(table1)完全記錄,即是右表(table2)並無對應匹配記錄。
(3)RIGHT JOIN(右連接):與LEFT JOIN相反,取得右表(table2)完全記錄,即是左表(table1)並無匹配對應記錄。
註意:MySQL不支持FULL JOIN,不過可以通過UNION關鍵字來合並LEFT JOIN與RIGHT JOIN來模擬FULL JOIN。
接下來給出一個例子用於解釋下面幾種分類。如下兩個表(A,B)
mysql> select A.id,A.name,B.name from A,B where A.id=B.id; +----+-----------+-------------+ | id | name | name | +----+-----------+-------------+ | 1 | Pirate | Rutabaga | | 2 | Monkey | Pirate | | 3 | Ninja | Darth Vader | | 4 | Spaghetti | Ninja | +----+-----------+-------------+ 4 rows in set (0.00 sec)
二、Inner Join
內連接,也叫作等值連接,Inner join產生同時符合A和B的一組數據
mysql> select * from A inner join B on A.name = B.name; +----+--------+----+--------+ | id | name | id | name | +----+--------+----+--------+ | 1 | Pirate | 2 | Pirate | | 3 | Ninja | 4 | Ninja | +----+--------+----+--------+
三、Left Join
mysql> select * from A left join B on A.name = B.name; #或者:select * from A left outer join B on A.name = B.name; +----+-----------+------+--------+ | id | name | id | name | +----+-----------+------+--------+ | 1 | Pirate | 2 | Pirate | | 2 | Monkey | NULL | NULL | | 3 | Ninja | 4 | Ninja | | 4 | Spaghetti | NULL | NULL | +----+-----------+------+--------+
left join,(或left outer join:在MySQL中兩者等價,推薦使用left join) 做鏈接從左表(A)產生一套完整的記錄,與匹配的記錄(右表(B))。如果沒有匹配,右側將包含null。
如果想只從左表(A)中產生一套記錄,但不包含右表(B)的記錄,可以通過設置where語句來執行,如下:
mysql> select * from A left join B on A.name=B.name where A.id is null or B.id is null; +----+-----------+------+------+ | id | name | id | name | +----+-----------+------+------+ | 2 | Monkey | NULL | NULL | | 4 | Spaghetti | NULL | NULL | +----+-----------+------+------+ 2 rows in set (0.00 sec)
同理,還可以模擬inner join,如下:
mysql> select * from A left join B on A.name=B.name where A.id is not null and B.id is not null; +----+--------+------+--------+ | id | name | id | name | +----+--------+------+--------+ | 1 | Pirate | 2 | Pirate | | 3 | Ninja | 4 | Ninja | +----+--------+------+--------+ 2 rows in set (0.00 sec)
求差集:
根據上面的例子可以求差集,如下:
SELECT * FROM A LEFT JOIN B ON A.name = B.name WHERE B.id IS NULL union SELECT * FROM A right JOIN B ON A.name = B.name WHERE A.id IS NULL; # 結果 +------+-----------+------+-------------+ | id | name | id | name | +------+-----------+------+-------------+ | 2 | Monkey | NULL | NULL | | 4 | Spaghetti | NULL | NULL | | NULL | NULL | 1 | Rutabaga | | NULL | NULL | 3 | Darth Vader | +------+-----------+------+-------------+
四、Right Join
mysql> select * from A right join B on A.name = B.name; +------+--------+----+-------------+ | id | name | id | name | +------+--------+----+-------------+ | NULL | NULL | 1 | Rutabaga | | 1 | Pirate | 2 | Pirate | | NULL | NULL | 3 | Darth Vader | | 3 | Ninja | 4 | Ninja | +------+--------+----+-------------+ 4 rows in set (0.00 sec)
同left join。
五、Cross join
cross join:交叉連接,得到的結果是兩個表的乘積,即笛卡爾積
笛卡爾(Descartes)乘積又叫直積。假設集合A={a,b},集合B={0,1,2},則兩個集合的笛卡爾積為{(a,0),(a,1),(a,2),(b,0),(b,1), (b,2)}。可以擴展到多個集合的情況。類似的例子有,如果A表示某學校學生的集合,B表示該學校所有課程的集合,則A與B的笛卡爾積表示所有可能的選課情況。
mysql> select * from A cross join B; +----+-----------+----+-------------+ | id | name | id | name | +----+-----------+----+-------------+ | 1 | Pirate | 1 | Rutabaga | | 2 | Monkey | 1 | Rutabaga | | 3 | Ninja | 1 | Rutabaga | | 4 | Spaghetti | 1 | Rutabaga | | 1 | Pirate | 2 | Pirate | | 2 | Monkey | 2 | Pirate | | 3 | Ninja | 2 | Pirate | | 4 | Spaghetti | 2 | Pirate | | 1 | Pirate | 3 | Darth Vader | | 2 | Monkey | 3 | Darth Vader | | 3 | Ninja | 3 | Darth Vader | | 4 | Spaghetti | 3 | Darth Vader | | 1 | Pirate | 4 | Ninja | | 2 | Monkey | 4 | Ninja | | 3 | Ninja | 4 | Ninja | | 4 | Spaghetti | 4 | Ninja | +----+-----------+----+-------------+ 16 rows in set (0.00 sec) #再執行:mysql> select * from A inner join B; 試一試 #在執行mysql> select * from A cross join B on A.name = B.name; 試一試
實際上,在MySQL中(僅限於MySQL)CROSS JOIN 與INNER JOIN的表現是一樣的,在不指定ON條件得到的結果都是笛卡爾積,反之取得兩個表完全匹配的結果
INNER JOIN與CROSS JOIN可以省略INNER或CROSS關鍵字,因此下面的sql效果是一樣的:
... FROM table1 INNER JOIN table2 ... FROM table1 CROSS JOIN table2 ... FROM table1 JOIN table2
六、Full Join
mysql> select * from A left join B on B.name = A.name -> union -> select * from A right join B on B.name = A.name; +------+-----------+------+-------------+ | id | name | id | name | +------+-----------+------+-------------+ | 1 | Pirate | 2 | Pirate | | 2 | Monkey | NULL | NULL | | 3 | Ninja | 4 | Ninja | | 4 | Spaghetti | NULL | NULL | | NULL | NULL | 1 | Rutabaga | | NULL | NULL | 3 | Darth Vader | +------+-----------+------+-------------+ 6 rows in set (0.00 sec)
全連接產生的所有記錄(雙方匹配記錄)在表A和表B。如果沒有匹配,則對面將包含null。
七、性能優化
1、顯示(explicit)inner join VS 隱式(implicit)inner join
如:
select * from table a inner join table b on a.id = b.id;
VS
select a.*, b.* from table a, table b where a.id = b.id;
我在數據庫中比較(10w數據)得之,它們用時幾乎相同,第一個是顯示的inner join,後一個是隱式的inner join。
參照:Explicit vs implicit SQL joins
2、left join/right join VS inner join
盡量用inner join,避免left join 和null
在使用left join(或right join)時,應該清楚的知道以下幾點:
(1)on與where的執行順序
ON 條件(“A LEFT JOIN B ON 條件表達式”中的ON)用來決定如何從 B 表中檢索數據行。如果 B 表中沒有任何一行數據匹配 ON 的條件,將會額外生成一行所有列為 NULL 的數據,在匹配階段 WHERE 子句的條件都不會被使用。僅在匹配階段完成以後,WHERE 子句條件才會被使用。它將從匹配階段產生的數據中檢索過濾。
所以我們要註意:在使用left(right)join的時候,一定要在先給出盡可能多的匹配滿足條件,減少where的執行。如:
PS, 這部分有些不妥,感謝 wxweven 指正:
這部分的內容,博主寫的有些欠妥當,不知道博主有沒有實際運行測試過,下面說說我的看法:
(1)首先關於on和where的用法,如果直接把where裏面的條件拿到on裏面去,結果是跟原來的不一致的,所以博主說的“在使用Left (right) join的時候,一定要在先給出盡可能多的匹配滿足條件,減少Where的執行”是不成立的,因為篩選條件放在on或者where,產生的是不同的結果,不能說為了性能就把where中的條件放到on中。
可參考sql語句中join on和where用法的區別和聯系
PASS
select * from A inner join B on B.name = A.name left join C on C.name = B.name left join D on D.id = C.id where C.status>1 and D.status=1;
Great
select * from A inner join B on B.name = A.name left join C on C.name = B.name and C.status>1 left join D on D.id = C.id and D.status=1
從上面例子可以看出,盡可能滿足ON的條件,而少用Where的條件。從執行性能來看第二個顯然更加省時。
(2)盡量避免子查詢,而用join
往往性能這玩意兒,更多時候體現在數據量比較大的時候,此時,我們應該避免復雜的子查詢。如下:
PASS
insert into t1(a1) select b1 from t2 where not exists(select 1 from t1 where t1.id = t2.r_id);
Great
insert into t1(a1) select b1 from t2 left join (select distinct t1.id from t1 ) t1 on t1.id = t2.r_id where t1.id is null;
這個可以參考mysql的exists與inner join 和 not exists與 left join 性能差別驚人
補充:MySQL STRAIGHT_JOIN 與 NATURAL JOIN的使用
感謝網友** 折翼的鳥** 給出的提醒。
長話短說:straight_join實現強制多表的載入順序,從左到右,如:
...A straight_join B on A.name = B.name
straight_join完全等同於inner join 只不過,join語法是根據“哪個表的結果集小,就以哪個表為驅動表”來決定誰先載入的,而straight_join 會強制選擇其左邊的表先載入。
往往我們在分析mysql處理性能時,如(Explain),如果發現mysql在載入順序不合理的情況下,可以使用這個語句,但往往mysql能夠自動的分析並處理好。
更多內容參考:MySQL STRAIGHT_JOIN 與 NATURAL JOIN
和MySQL優化的奇技淫巧之STRAIGHT_JOIN
八.參考:
A Visual Explanation of SQL Joins
五種提高 SQL 性能的方法
關於 MySQL LEFT JOIN 你可能需要了解的三點
(轉)MySQL join語法解析與性能分析