Group by 和distinct對比

阿新 • • 發佈：2018-11-06

**  Group by 和distinct對比**

CREATE TABLE sbtest1 (
id int(11) NOT NULL AUTO_INCREMENT,
k int(11) NOT NULL DEFAULT '0',
c char(120) NOT NULL DEFAULT '',
pad char(60) NOT NULL DEFAULT '',
PRIMARY KEY (id),
KEY k_1 (k)
) ENGINE=InnoDB AUTO_INCREMENT=10000001 DEFAULT CHARSET=utf8;
1000w資料量

1、  對於主鍵

Group by的執行計劃
Group by 和distinct對比
Distinct的執行計劃

可以看到group by使用了主鍵，而distinct使用了輔助索引k_1
這說明了distinct可能是一種統計操作，也就是Innodb在有輔助索引時候，統計會走輔助索引，如下圖，進行count(*)也是走的k_1輔助索引。
Group by 和distinct對比

2、  對於輔助索引

Group by的執行計劃
Group by 和distinct對比
Distinct的執行計劃

通過以上對比，可以看出來他們是等價的，執行計劃一致。

3、  對於普通欄位

Group by的執行計劃，這裡做了一個order by null的處理，就是不排序
Group by 和distinct對比
Distinct的執行計劃，按理說，如果distinct要是統計的話為啥沒有走k_1

通過以上對比，可以看出來也是等價的，執行計劃一致。

4、  Group by 需要聚合，而distinct不需要聚合

5、  Group by 比 distinct效率高，distinct需要讀取所有記錄，而group by只需要讀取分組的

數量的記錄。
set profiling=1;
select distinct(k) from sbtest1
select k from sbtest1 group by k
再通過show profiles檢視
Group by 和distinct對比
Group by比distinct快了0.05秒多

Group by 和distinct對比

Group by 和distinct對比

mysql ORDER BY,GROUP BY 和DISTINCT原理

資料庫查詢去重group by和distinct的理解

mysql的order by，group by和distinct優化

Hive SQL 的 DISTINCT 和 GROUP BY 的效能對比

GROUP BY 和 ORDER BY一起使用時，要註意的問題！

group by 和 having子句

GROUP BY 和 GROUP_CONCAT的使用

SQL之group by 和 having

可以這樣去理解group by和聚合函數

關於sql當中的group by 和partition by 的區別。

sql中當order by 和distinct同時使用

mysql中group by和order by同時使用無效的替代方案

在mysql中使用group by和order by取每個分組中日期最大一行資料

第十九篇：Mysql兩次Group by和ip轉數字作比較的一次優化

group by 和 orede by

關於GROUP BY和聚合函式

Mysql之group by 和order by 一起用時的排序問題

mysql中group by和order by同時使用無效 group_concat

mysql 用 group by 和 order by同時使用

Group by 和distinct對比

相關推薦