1. 程式人生 > 實用技巧 >一文讓你徹底理解group by和聚合函式

一文讓你徹底理解group by和聚合函式

知道group by是進行分組查詢,但是一直覺得對其理解得不夠透徹,在網上扒了一篇文章,我認為寫得非常好。

為什麼不能夠select * from Table group by id,為什麼一定不能是*,而是某一個列或者某個列的聚合函式,group by 多個欄位可以怎麼去很好的理解呢?

先來看下錶1,表名為test:

執行下面語句:

SELECT name FROM test
GROUP BY name

你應該很容易知道執行的結果,沒錯,就是下表2:

為了能夠更好的理解“group by”多個列“和”聚合函式“的應用,由表1到表2的過程中,增加一個虛構的中間表:虛擬表3。

分析SELECT name FROM test GROUP BY name

SQL語句執行情況:

1.FROM test:該句執行後,應該結果和表1一樣,就是原來的表。

2.FROM test Group BY name:該句執行後,我們想象生成了虛擬表3,如下所圖所示,生成過程是這樣的:group by name,那麼找name那一列,具有相同name值的行,合併成一行,如對於name值為aa的,那麼<1 aa 2>與<2 aa 3>兩行合併成1行,所有的id值和number值寫到一個單元格里面。

3.接下來就要針對虛擬表3執行Select語句了:

(1)如果執行select *的話,那麼返回的結果應該是虛擬表3,可是id和number中有的單元格里面的內容是多個值的,而關係資料庫就是基於關係的,單元格中是不允許有多個值的,所以你看,執行select * 語句就報錯了。

(2)我們再看name列,每個單元格只有一個數據,所以我們select name的話,就沒有問題了。為什麼name列每個單元格只有一個值呢,因為我們就是用name列來group by的。

(3)那麼對於id和number裡面的單元格有多個數據的情況怎麼辦呢?答案就是用聚合函式,聚合函式就用來輸入多個數據,輸出一個數據的。如cout(id),sum(number),而每個聚合函式的輸入就是每一個多資料的單元格。

(4)例如我們執行select name,sum(number) from test group by name,那麼sum就對虛擬表3的number列的每個單元格進行sum操作,例如對name為aa的那一行的number列執行sum操作,即2+3,返回5,最後執行結果如下:

(5)group by 多個欄位該怎麼理解呢:如group by name,number,我們可以把name和number 看成一個整體欄位,以他們整體來進行分組的。如下圖:

(6)接下來就可以配合select和聚合函式進行操作了。如執行select name,sum(id) from test group by name,number,結果如下圖:

————————————————
版權宣告:本文為CSDN博主「shaofei63」的原創文章,遵循CC 4.0 BY-SA版權協議,轉載請附上原文出處連結及本宣告。
原文連結:https://blog.csdn.net/shaofei63/article/details/42800793