詳解partition by和group by對比
今天大概弄懂了partition by和group by的區別聯絡。
1. group by是分組函式,partition by是分析函式(然後像sum()等是聚合函式);
2. 在執行順序上,
以下是常用sql關鍵字的優先順序
from > where > group by > having > order by
而partition by應用在以上關鍵字之後,實際上就是在執行完select之後,在所得結果集之上進行partition。
3.partition by相比較於group by,能夠在保留全部資料的基礎上,只對其中某些欄位做分組排序(類似excel中的操作),而group by則只保留參與分組的欄位和聚合函式的結果(類似excel中的pivot)。
partition by
group by
4.如果在partition結果上聚合,千萬注意聚合函式是逐條累計執行結果的!而在group by後的結果集上使用聚合函式,會作用在分組下的所有記錄上。
資料如下,
SQL1
select a.cc,a.item,sum(a.num) from table_temp a group by a.cc,a.item
Result1
11條記錄經group by後為10條,其中cc='cn' and item='8.1.1'對應的兩條記錄的num彙總成值3.
SQL2
select a.cc,a.num,min(a.num) over (partition by a.cc order by a.num asc) as amount from table_temp a group by a.cc,a.num; select a.cc,min(a.num) over (partition by a.cc order by a.num desc) as amount from table_temp a group by a.cc,a.num;
Result2
兩個sql的唯一區別在於a.num的排序上,但從結果紅框中的資料對比可以看到amount值並不相同,且第二個結果集amount並不都是最小值1。
在這裡就是要注意將聚合函式用在partition後的結果集上時,聚合函式是逐條累積計算值的!
其實partition by常同row_number() over一起使用,
select a.*,row_number() over (partition by a.cc,a.item order by a.num desc) as seq from table_temp a
到此這篇關於詳解partition by和group by對比的文章就介紹到這了,更多相關partition by和group by內容請搜尋我們以前的文章或繼續瀏覽下面的相關文章希望大家以後多多支援我們!