1. 程式人生 > 實用技巧 >MySQL裡面的子查詢

MySQL裡面的子查詢

轉自 :https://www.cnblogs.com/zhuiluoyu/p/5822481.html

一、子查詢定義

  定義:

  子查詢允許把一個查詢巢狀在另一個查詢當中。

  子查詢,又叫內部查詢,相對於內部查詢,包含內部查詢的就稱為外部查詢。

  子查詢可以包含普通select可以包括的任何子句,比如:distinct、 group by、order by、limit、join和union等;但是對應的外部查詢必須是以下語句之一:select、insert、update、delete、set或 者do。

  子查詢的位置:
    select 中、from 後、where 中.group by 和order by 中無實用意義。

二、子查詢分類

  子查詢分為如下幾類:
    1. 標量子查詢:返回單一值的標量,最簡單的形式。
    2. 列子查詢:返回的結果集是 N 行一列。
    3. 行子查詢:返回的結果集是一行 N 列。
    4. 表子查詢:返回的結果集是 N 行 N 列。
  可以使用的操作符:= > < >= <= <> ANY IN SOME ALL EXISTS

  一個子查詢會返回一個標量(就一個值)、一個行、一個列或一個表,這些子查詢稱之為標量、行、列和表子查詢。

  如果子查詢返回一個標量值(就一個值),那麼外部查詢就可以使用:=、>、<、>=、<=和<>符號進行比較判斷;如果子查詢返回的不是一個標量值,而外部查詢使用了比較符和子查詢的結果進行了比較,那麼就會丟擲異常。

  1. 標量子查詢:

    是指子查詢返回的是單一值的標量,如一個數字或一個字串,也是子查詢中最簡單的返回形式。 可以使用 = > < >= <= <> 這些操作符對子查詢的標量結果進行比較,通常子查詢的位置在比較式的右側
    示例:   

1 2 3 SELECT * FROM article WHERE uid = (SELECT uid FROM user WHERE status=1 ORDER BY uid DESC LIMIT 1) SELECT * FROM t1 WHERE column1 = (SELECT MAX(column2) FROM t2)
SELECT * FROM article AS t WHERE 2 = (SELECT COUNT(*) FROM article WHERE article.uid = t.uid)

  2.MySQL 列子查詢:

    指子查詢返回的結果集是 N 行一列,該結果通常來自對錶的某個欄位查詢返回。
    可以使用 = > < >= <= <> 這些操作符對子查詢的標量結果進行比較,通常子查詢的位置在比較式的右側
    可以使用 IN、ANY、SOME 和 ALL 操作符,不能直接使用 = > < >= <= <> 這些比較標量結果的操作符。
    示例:

1 2 3 SELECT * FROM article WHERE uid IN(SELECT uid FROM user WHERE status=1) SELECT s1 FROM table1 WHERE s1 > ANY (SELECT s2 FROM table2) SELECT s1 FROM table1 WHERE s1 > ALL (SELECT s2 FROM table2)


    NOT IN 是 <> ALL 的別名,二者相同。
    特殊情況
      如果 table2 為空表,則 ALL 後的結果為 TRUE;
      如果子查詢返回如 (0,NULL,1) 這種儘管 s1 比返回結果都大,但有空行的結果,則 ALL 後的結果為 UNKNOWN 。
    注意:對於 table2 空表的情況,下面的語句均返回 NULL:

1 2 SELECT s1 FROM table1 WHERE s1 > (SELECT s2 FROM table2) SELECT s1 FROM table1 WHERE s1 > ALL (SELECT MAX(s1) FROM table2)

  3.MySQL 行子查詢:

    指子查詢返回的結果集是一行 N 列,該子查詢的結果通常是對錶的某行資料進行查詢而返回的結果集。
    例子:

1 2 3 SELECT * FROM table1 WHERE (1,2) = (SELECT column1, column2 FROM table2) 注:(1,2) 等同於 row(1,2) SELECT * FROM article WHERE (title,content,uid) = (SELECT title,content,uid FROM blog WHERE bid=2)

  4.MySQL 表子查詢:

    指子查詢返回的結果集是 N 行 N 列的一個表資料。
    例子:

1 SELECT * FROM article WHERE (title,content,uid) IN (SELECT title,content,uid FROM blog)

三、字查詢例舉

  1. ANY進行子查詢

  any關鍵詞的意思是“對於子查詢返回的列中的任何一個數值,如果比較結果為TRUE,就返回TRUE”。

  好比“10 >any(11, 20, 2, 30)”,由於10>2,所以,該該判斷會返回TRUE;只要10與集合中的任意一個進行比較,得到TRUE時,就會返回TRUE。  

1 2 3 4 5 6 7 8 9 10 11 selecttable1.customer_id,city,count(order_id) fromtable1jointable2 ontable1.customer_id=table2.customer_id wheretable1.customer_id<>'tx'and table1.customer_id<>'9you' groupbycustomer_id having count(order_id) > any ( selectcount(order_id) fromtable2 wherecustomer_id='tx'or customer_id='9you' groupbycustomer_id);

  any的意思比較好明白,直譯就是任意一個,只要條件滿足任意的一個,就返回TRUE。


  2. 使用IN進行子查詢

  使用in進行子查詢,這個我們在日常寫sql的時候是經常遇到的。in的意思就是指定的一個值是否在這個集合中,如何在就返回TRUE;否則就返回FALSE了。

  in是“=any”的別名,在使用“=any”的地方,我們都可以使用“in”來進行替換。

  有了in,肯定就有了not in;not in並不是和<>any是同樣的意思,not in和<>all是一個意思。


  3. 使用SOME進行子查詢

  some是any的別名,用的比較少。
  

  4. 使用ALL進行子查詢

  all必須與比較操作符一起使用。all的意思是“對於子查詢返回的列中的所有值,如果比較結果為TRUE,則返回TRUE”。

  好比“10 >all(2, 4, 5, 1)”,由於10大於集合中的所有值,所以這條判斷就返回TRUE;而如果為“10 >all(20, 3, 2, 1, 4)”,這樣的話,由於10小於20,所以該判斷就會返回FALSE。

  <>all的同義詞是not in,表示不等於集合中的所有值,這個很容易和<>any搞混,平時多留點心就好了。


  5.標量子查詢

  根據子查詢返回值的數量,將子查詢可以分為標量子查詢和多值子查詢。在使用比較符進行子查詢時,就要求必須是標量子查詢;如果是多值子查詢時,使用比較符,就會丟擲異常。


  6. 多值子查詢

  與標量子查詢對應的就是多值子查詢了,多值子查詢會返回一列、一行或者一個表,它們組成一個集合。我們一般使用的any、in、all和some等詞,將外部查詢與子查詢的結果進行判斷。如果將any、in、all和some等詞與標量子查詢,就會得到空的結果。

  7. 獨立子查詢

  獨立子查詢是不依賴外部查詢而執行的子查詢。什麼叫依賴外部查詢?先看下面兩個sql語句。

  sql語句1:獲得所有hangzhou顧客的訂單號。 

1 2 3 4 5 6 selectorder_id fromtable2 wherecustomer_idin (selectcustomer_id fromtable1 wherecity='hangzhou');

  sql語句2:獲得城市為hangzhou,並且存在訂單的使用者。

1 2 3 4 5 6 select* fromtable1 wherecity='hangzhou'and exists (select* fromtable2 wheretable1.customer_id=table2.customer_id);

  上面的兩條sql語句,雖然例子舉的有點不是很恰當,但是足以說明這裡的問題了。

    對於sql語句1,我們將子查詢單獨複製出來,也是可以單獨執行的,就是子查詢與外部查詢沒有任何關係。

    對於sql語句2,我們將子查詢單獨複製出來,就無法單獨執行了,由於sql語句2的子查詢依賴外部查詢的某些欄位,這就導致子查詢就依賴外部查詢,就產生了相關性。

  對於子查詢,很多時候都會考慮到效率的問題。當我們執行一個select語句時,可以加上explain關鍵字,用來檢視查詢型別,查詢時使用的索引以及其它等等資訊。比如這麼用:

1 2 3 4 5 6 explainselectorder_id fromtable2 wherecustomer_idin (selectcustomer_id fromtable1 wherecity='hangzhou');

  使用獨立子查詢,如果子查詢部分對集合的最大遍歷次數為n,外部查詢的最大遍歷次數為m時,我們可以記為:O(m+n)。而如果使用相關子查詢,它的遍歷 次數可能會達到O(m+m*n)。可以看到,效率就會成倍的下降;所以,大夥在使用子查詢時,一定要考慮到子查詢的相關性。

  8.相關子查詢

  相關子查詢是指引用了外部查詢列的子查詢,即子查詢會對外部查詢的每行進行一次計算。但是在MySQL的內部,會進行動態優化,會隨著情況的不同會 有所不同。使用相關子查詢是最容易出現效能的地方。而關於sql語句的優化,這又是一個非常大的話題了,只能通過實際的經驗積累,才能更好的去理解如何進 行優化。

  9.EXISTS謂詞

  EXISTS是一個非常牛叉的謂詞,它允許資料庫高效地檢查指定查詢是否產生某些行。根據子查詢是否返回行,該謂詞返回TRUE或FALSE。與其 它謂詞和邏輯表示式不同的是,無論輸入子查詢是否返回行,EXISTS都不會返回UNKNOWN,對於EXISTS來說,UNKNOWN就是FALSE。 還是上面的語句,獲得城市為hangzhou,並且存在訂單的使用者。

1 2 3 4 5 6 select* fromtable1 wherecity='hangzhou'and exists (select* fromtable2 wheretable1.customer_id=table2.customer_id);

  

  關於IN和EXISTS的主要區別在於三值邏輯的判斷上。EXISTS總是返回TRUE或FALSE,而對於IN,除了TRUE、FALSE值外, 還有可能對NULL值返回UNKNOWN。但是在過濾器中,UNKNOWN的處理方式與FALSE相同,因此使用IN與使用EXISTS一樣,SQL優化 器會選擇相同的執行計劃。

  說到了IN和EXISTS幾乎是一樣的,但是,就不得不說到NOT IN和NOT EXISTS,對於輸入列表中包含NULL值時,NOT EXISTS和NOT IN之間的差異就表現的非常大了。輸入列表包含NULL值時,IN總是返回TRUE和UNKNOWN,因此NOT IN就會得到NOT TRUE和NOT UNKNOWN,即FALSE和UNKNOWN。

  10. 派生表

  上面也說到了,在子查詢返回的值中,也可能返回一個表,如果將子查詢返回的虛擬表再次作為FROM子句的輸入時,這就子查詢的虛擬表就成為了一個派生表。語法結構如下:

1 FROM (subquery expression) AS derived_table_alias

  由於派生表是完全的虛擬表,並沒有也不可能被物理地具體化。

四、子查詢優化

  很多查詢中需要使用子查詢。使用子查詢可以一次性的完成很多邏輯上需要多個步驟才能完成的SQL操作,同時也可以避免事務或者表鎖死。子查詢可以使查詢語 句很靈活,但子查詢的執行效率不高。

  子查詢時,MySQL需要為內層查詢語句的查詢結果建立一個臨時表。然後外層查詢語句再臨時表中查詢記錄。查詢完畢 後,MySQL需要撤銷這些臨時表。因此,子查詢的速度會受到一定的影響。如果查詢的資料量比較大,這種影響就會隨之增大。

  在MySQL中可以使用連線查 詢來替代子查詢。連線查詢不需要建立臨時表,其速度比子查詢要快。


    使用連線(JOIN)來代替子查詢
    如:   

1 2 3 4 5 6 7 例子1: SELECT * FROM t1 WHERE t1.a1 NOTin(SELECT a2 FROM t2 ) 優化後: SELECT * FROM t1 LEFT JOIN t2 ON t1.a1=t2.a2 WHERE t2.a2 IS NULL

1 2 3 4 5 6 例子2: SELECT * FROM article WHERE (title,content,uid) IN (SELECT title,content,uid FROM blog) 優化後: SELECT * FROM article innerjoinblog on(article.title=blog.title AND article.content=blog.content AND article.uid=blog.uid)

  不能優化的子查詢:
  1、mysql不支援子查詢合併和聚合函式子查詢優化,mariadb對聚合函式子查詢進行物化優化;
  2、mysql不支援from子句子查詢優化,mariadb對from子句子查詢進行子查詢上拉優化;
  3、mysql和mariadb對子查詢展開提供有限的支援,如對主鍵的操作才能進行上拉子查詢優化;
  4、mysql不支援exists子查詢優化,mariadb對exists關聯子查詢進行半連線優化,對exists非關聯子查詢沒有進一步進行優化;
  5、mysql和mariadb不支援not exists子查詢優化;
  6、mysql和mariadb對in子查詢,對滿足半連線語義的查詢進行半連線優化,再基於代價評估進行優化,兩者對半連線的代價評估選擇方式有差異;
  7、mysql不支援not in子查詢優化,mariadb對非關聯not in子查詢使用物化優化,對關聯not in子查詢不做優化;
  8、mysql和mariadb對>all非關聯子查詢使用max函式,<all非關聯子查詢使用min函式,對=all和非關聯子查詢使用exists優化;
  9、對>some和>any非關聯子查詢使用min函式,對<some和<any非關聯子查詢使用max函式,=any 和=some子查詢使用半連線進行優化,對>some和>any關聯子查詢以及<some和<any關聯子查詢只有exists 優化。

相關文章 :http://www.cnblogs.com/loveyouyou616/archive/2012/12/21/2827655.html