1. 程式人生 > >SQL Server的GROUP BY和HAVING子句

SQL Server的GROUP BY和HAVING子句

在介紹GROUP BY 和 HAVING 子句前,我們必需先講講sql語言中一種特殊的函式:聚合函式,例如SUM, COUNT, MAX, AVG等。這些函式和其它函式的根本區別就是它們一般作用在多條記錄上。 

SELECT SUM(population) FROM bbc


  這裡的SUM作用在所有返回記錄的population欄位上,結果就是該查詢只返回一個結果,即所有國家的總人口數。

  通過使用GROUP BY 子句,可以讓SUM 和 COUNT 這些函式對屬於一組的資料起作用。當你指定 GROUP BY region 時, 屬於同一個region(地區)的一組資料將只能返回一行值,也就是說,表中所有除region(地區)外的欄位,只能通過 SUM, COUNT等聚合函式運算後返回一個值。

  HAVING子句可以讓我們篩選成組後的各組資料,WHERE子句在聚合前先篩選記錄.也就是說作用在GROUP BY 子句和HAVING子句前.而 HAVING子句在聚合後對組記錄進行篩選。

  讓我們還是通過具體的例項來理解GROUP BY 和 HAVING 子句,還採用第三節介紹的bbc表。

  SQL例項:

  一、顯示每個地區的總人口數和總面積:

SELECT region, SUM(population), SUM(area)
FROM bbc
GROUP BY region


  先以region把返回記錄分成多個組,這就是GROUP BY的字面含義。分完組後,然後用聚合函式對每組中的不同欄位(一或多條記錄)作運算。

  二、 顯示每個地區的總人口數和總面積.僅顯示那些面積超過1000000的地區。

SELECT region, SUM(population), SUM(area)
FROM bbc
GROUP BY region
HAVING SUM(area)>1000000


  在這裡,我們不能用where來篩選超過1000000的地區,因為表中不存在這樣一條記錄。

  相反,HAVING子句可以讓我們篩選成組後的各組資料.

  假設表的欄位為depart_id, depart_name, employeename,查詢具有depart_id的記錄數大於2的所有記錄的depart_id,和總數,正確的語句應為:
select depart_id, count(*) from depart group by departId having count(*)>=2
      注意:先分組在算count
      下面還有2個例子:
      例1:查詢出現過2次的user。   往往初學者會錯誤地認為在where 語句裡直接使用count()演算法,很顯然這個想法是錯誤的,count()方法並不能被用在where子句中,為了解決問題,我們可以在group by子句後面使用HAVING來做條件限制。   錯誤做法:select * from user_num where count(user)>=2 group by user;
  正確做法:select * from user_num group by user HAVING count(user)>=2 ;   解釋說明:HAVING 與 WHERE 類似,可用來決定選擇哪些記錄。HAVING 子句在SELECT語句中指定,顯示哪些已用 GROUP BY 子句分組的記錄。在GROUP BY組合了記錄後, HAVING會顯示 GROUP BY 子句分組的任何符合 HAVING 子句的記錄。       例2:查詢單一使用者的num總和大於10的使用者。   有前面的經驗,把sum()方法寫在HAVING子句中。   正確做法:select * from user_num group by user HAVING sum(num)>10 ;   注意:一個HAVING子句最多隻能包含40個表示式,HAVING子句的表示式之間可以用AND和OR分割。   如果count後面是(*),就是任意一個或多個欄位有重複記錄時候,他就count。
  若指定欄位,則當指定欄位有重複的時候數。如果多條記錄(不是相同,即兩組不同的記錄重複),則返回的記錄集合是總共的。