1. 程式人生 > 其它 >淺析union/union all/distinct的區別和用途、distinct如何進行排序優化

淺析union/union all/distinct的區別和用途、distinct如何進行排序優化

一、union、union all 、distinct 的區別和用途

1、從用途上講:它們都具有去重的效果

2、從效率上講:distinct 通常不建議使用,效率較低。union all 和 union 而言,union all 效率更高。

  原因是:union 相當於多表查詢出的資料,進行去重,然後再進行排序後返回,而 union all 是多表查詢合併後就直接返回

3、從單表還是多表上講:單表上有重複記錄只能使用distinct,多表查詢建議用 union all

二、distinct 排序優化(避免排序)- union all 代替 union、exists 代替 distinct

  大家都知道資料庫有些命令會對結果進行排序,當資料量較大時,排序會非常耗時。

1、會進行排序的SQL 命令 - 下面列舉會排序的代表性運算:

GROUP BY 子句

ORDER BY 子句

聚合函式(SUM,COUNT,AVG,MAX,MIN)

DISTINCT

集合運算(UNICON,INTERSECT,EXCEPT)

視窗函式(RANK,ROW_NUMBER等)

2、例項一:儘可能使用 union all 代替 union

SELECT * FROM TABLE_A UNION ALL SELECT * FROM TABLE_B;

  如果不在乎結果中存在重複資料,或預先知道結果中不會有重複資料。請使用 union all 代替 union,這樣就不會進行排序。

3、例項二:儘可能使用 exists 代替 distinct

  示例資料說明,下面有商品表 Items 和銷售記錄表 SalesHistory。

  需求:查詢有銷售記錄的商品。

  可以使用 in 方式實現,但因為 in 會產生子查詢,不如使用連線查詢效率高。

SELECT DISTINCT I.item_no FROM Items I 
INNER JOIN SalesHistory S ON I.item_no = S.item_no;

  因為是一對多查詢,會產生重複記錄,所有使用DISTINCT過濾重複記錄。但更好的做法是使用exists方式:

SELECT DISTINCT
I.item_no FROM Items I WHERE EXISTS ( SELECT * FROM SalesHistory S WHERE I.item_no = S.item_no);

  說明:因為使用 exists 查詢時不會進行排序,而且使用 exists 和使用連線效率一樣高。

三、union distinct - 當面試官問你UNION 和UNION ALL之間的區別時該怎麼答

  MySQL資料庫支援兩種集合操作:UNION DISTINCT和UNION ALL。

  UNION DISTINCT組合兩個輸入,並應用DISTINCT過濾重複項,一般可以直接省略DISTINCT關鍵字,直接使用UNION。

  在多個SELECT語句中,對應的列應該具有相同的欄位屬性,且第一個SELECT語句中被使用的欄位名稱也被用於結果的欄位名稱。

1、union distinct:其實 union 相當於 union distinct,個人覺得寫全比較好,不要偷懶。

  當A查詢中有資料a,B查詢中有資料a,對兩個查詢使用union distinct方法,那麼查詢結果只有一條資料a記錄。

2、union all:當A查詢中有資料a,B查詢中有資料a,對兩個查詢使用 union all 方法,那麼查詢結果會出現兩條資料a。

3、說明:

(1)當A查詢中有資料a,B查詢中有資料a,不管對兩個查詢使用union all/distinct方法,查詢結果的欄位展示是根據union all/distinct前的查詢結果欄位展示的。

-- 例如前面union all,查詢語句為:
(SELECT * from name2 where agend2 = '1') 
UNION ALL 
(select * from name where name = 'ck1' AND agend = '1');

-- 那麼展示的欄位是 name2 表中的欄位。

(2)在使用UNION DISTINCT的時候,由於向臨時表中添加了唯一索引,插入的速度顯然會因此而受到影響。如果確認進行UNION操作的兩個集合中沒有重複的選項,最有效的辦法應該是使用UNION ALL。

(3)union 會自動壓縮多個結果集合中的重複結果,而union all則將所有的結果全部顯示出來,不管是不是重複。

  Union:對兩個結果集進行並集操作,不包括重複行,同時進行預設規則的排序。

  Union 在進行錶鏈接後會篩選掉重複的記錄,所以在錶鏈接後會對所產生的結果集進行排序運算,刪除重複的記錄再返回結果。

  Union All:對兩個結果集進行並集操作,包括重複行,不進行排序。