1. 程式人生 > 實用技巧 >OVER(PARTITION BY)函式介紹

OVER(PARTITION BY)函式介紹

問題場景  

  最近在專案中遇到了對每一個型別進行求和並且求該型別所佔的比例,當時考慮求出每種型別的和,並在java中分別對每一種型別的和與總和相除求出所佔比例。後來,想到這樣有點麻煩,並且專案中持久層使用的是iBatis框架,所有考慮從SQL方面進行入手來簡化這個問題。

  後來SQL的解決方法就為:

1 SELECT T.CHANNEL AS PATTERN,
2        COUNT(T.TRANSACTIONKEY) AS T_COUNT,
3        SUM(T.AMT) AS T_AMT,
4        ROUND(100 * SUM(T.AMT) / SUM(SUM(T.AMT)) OVER(PARTITION BY 1), 2) AS AMT_PERCENT,
5        ROUND(100 * COUNT(T.TRANSACTIONKEY) / SUM(COUNT(T.TRANSACTIONKEY)) OVER(PARTITION BY 1),2) AS COUNT_PERCENT
6   FROM XX(表名) T
7  WHERE T.PARTY_ID = '100579050'
8  GROUP BY T.CHANNEL

  看到這裡自己很佩服SQL的強大,於是刨根問底,深入研究了一番Oracel的OVER(PARTITION BY)函式。

  • 簡介

  開窗函式,Oracle從8.1.6開始提供分析函式,分析函式用於計算基於組的某種聚合值,它和聚合函式的不同之處是:對於每個組返回多行,而聚合函式對於每個組只返回一行。

  開窗函式指定了分析函式工作的資料視窗大小,這個資料視窗大小可能會隨著行的變化而變化。

  下面的測試用例資料語句如下: 

 1 create table T2_TEMP(
 2     NAME varchar2(10) primary key,
 3     CLASS varchar2(10),
 4     SROCE NUMBER 
 5 )
 6 
 7 insert into T2_TEMP (NAME, CLASS, SROCE)
 8 values ('cfe', '2', 74);
 9 
10 insert into T2_TEMP (NAME, CLASS, SROCE)
11 values ('dss', '1', 95);
12 
13 insert into T2_TEMP (NAME, CLASS, SROCE)
14 values ('ffd', '1', 95);
15 
16 insert into T2_TEMP (NAME, CLASS, SROCE)
17 values ('fda', '1', 80);
18 
19 insert into T2_TEMP (NAME, CLASS, SROCE)
20 values ('gds', '2', 92);
21 
22 insert into T2_TEMP (NAME, CLASS, SROCE)
23 values ('gf', '3', 99);
24 
25 insert into T2_TEMP (NAME, CLASS, SROCE)
26 values ('ddd', '3', 99);
27 
28 insert into T2_TEMP (NAME, CLASS, SROCE)
29 values ('adf', '3', 45);
30 
31 insert into T2_TEMP (NAME, CLASS, SROCE)
32 values ('asdf', '3', 55);
33 
34 insert into T2_TEMP (NAME, CLASS, SROCE)
35 values ('3dd', '3', 78);
View Code

  1、over函式的寫法:

  over(partitionby classorderbysroce)按照sroce排序進行累計,orderby是個預設的開窗函式,按照class分割槽。

  2、開窗的視窗範圍:

  over(orderbysroce rangebetween5precedingand5following):視窗範圍為當前行資料幅度減5加5後的範圍內的。

  over(orderbysroce rowsbetween5precedingand5following):視窗範圍為當前行前後各移動5行。

  3、與over()函式結合的函式的介紹

  (1)、查詢每個班的第一名的成績:如下 

1 SELECT * FROM (select t.name,t.class,t.sroce,rank() over(partition by t.class order by t.sroce desc) mm from T2_TEMP t) where mm = 1;

  結果為:

1 得到的結果是:
2 dss 1 95 1
3 ffd 1 95 1
4 gds 2 92 1
5 gf 3 99 1
6 ddd 3 99 1

  注意:在求第一名成績的時候,不能用row_number(),因為如果同班有兩個並列第一,row_number()只返回一個結果。

1 SELECT * FROM (select t.name,t.class,t.sroce,row_number() over(partition by t.class order by t.sroce desc) mm from T2_TEMP t) where mm = 1;

  結果為:

dss      1 95 1 
gfs      2 92 1
ddd      3 99 1 

  可以看出,本來第一名是兩個人的並列,結果只顯示了一個。

  (2)、rank()和dense_rank()可以將所有的都查找出來,rank可以將並列第一名的都查找出來;rank()和dense_rank()區別:rank()是跳躍排序,有兩個第二名時接下來就是第四名。

  求班級成績排名:

1 select t.name,t.class,t.sroce,rank() over(partition by t.class order by t.sroce desc) mm from T2_TEMP t;

  查詢結果:

dss 1 95 1
ffd 1 95 1
fda 1 80 3
gds 2 92 1
cfe 2 74 2
gf 3 99 1
ddd 3 99 1
3dd 3 78 3
asdf 3 55 4
adf 3 45 5

  dense_rank()l是連續排序,有兩個第二名時仍然跟著第三名

1 select t.name,t.class,t.sroce,dense_rank() over(partition by t.class order by t.sroce desc) mm from T2_TEMP t;

  查詢結果:

dss 1 95 1
ffd 1 95 1
fda 1 80 2 
gds 2 92 1
cfe 2 74 2
gf 3 99 1
ddd 3 99 1
3dd 3 78 2
asdf 3 55 3
adf 3 45 4

  3、sum()over()的使用

  根據班級進行分數求和

1 select t.name,t.class,t.sroce,sum(t.sroce) over(partition by t.class order by t.sroce desc) mm from T2_TEMP t;
dss 1 95 190 --由於兩個95都是第一名,所以累加時是兩個第一名的相加
ffd 1 95 190 
fda 1 80 270 --第一名加上第二名的
gds 2 92 92
cfe 2 74 166
gf 3 99 198
ddd 3 99 198
3dd 3 78 276
asdf 3 55 331
adf 3 45 376

  4、first_value()over()和last_value()over()的使用

1 select t.name,t.class,t.sroce,first_value(t.sroce) over(partition by t.class order by t.sroce desc) mm from T2_TEMP t;
2 select t.name,t.class,t.sroce,last_value(t.sroce) over(partition by t.class order by t.sroce desc) mm from T2_TEMP t;

  分別求出第一個和最後一個成績。

  5、sum() over()的使用

1 select t.name,t.class,t.sroce,sum(t.sroce) over(partition by t.class order by t.sroce desc) mm from T2_TEMP t;

  求出班級的總分。

  下面還有很多用法,就不一一列舉了,簡單介紹一下,和上面用法類似:

  count()over(partitionby...orderby...):求分組後的總數。
  max()over(partitionby...orderby...):求分組後的最大值。
  min()over(partitionby...orderby...):求分組後的最小值。
  avg()over(partitionby...orderby...):求分組後的平均值。
  lag()over(partitionby...orderby...):取出前n行資料。  

  lead()over(partitionby...orderby...):取出後n行資料。

  ratio_to_report() over(partitionby...orderby...):Ratio_to_report()括號中就是分子,over()括號中就是分母。

  percent_rank()over(partitionby...orderby...):

  6、overpartitionby與groupby的區別:

  groupby是對檢索結果的保留行進行單純分組,一般和聚合函式一起使用例如max、min、sum、avg、count等一塊用。partitionby雖然也具有分組功能,但同時也具有其他的高階功能。