1. 程式人生 > >OLAP 支援---ROLLUP和CUBE語句 group by 的增強版本語句!可進行分層分組模式外 (小計與總計)

OLAP 支援---ROLLUP和CUBE語句 group by 的增強版本語句!可進行分層分組模式外 (小計與總計)

OLAP 支援

聯機分析處理(On-Line Analytical Processing,簡稱 OLAP)具有在一條 SQL 語句中執行復雜資料分析的功能,從而通過減少對資料庫的查詢次數來改進效能,而同時又能增加結果值。通過使用對 SQL 語句和視窗函式的擴充套件,可以使用 OLAP 功能。這些 SQL 擴充套件和函式能夠以一種簡明的方式實現多維資料分析、資料探勘、時間序列分析、趨勢分析、開銷分配、目標尋求以及異常警告,而這些又常常是通過一條 SQL 語句完成的。

  • SELECT 語句的擴充套件   利用 SELECT 語句的擴充套件,您可以將輸入行分組、對組執行分析以及將結果加入到最終結果集中。這些擴充套件包括對 GROUP BY 子句(GROUPING SETS、CUBE 和 ROLLUP 子句)以及 WINDOW 子句的擴充套件。

    利用 GROUP BY 子句的擴充套件,您可以採用多種方式來劃分輸入行,從而生成一個可將不同組連線在一起的結果集。您還可以建立一個稀疏多維結果集(也稱為資料立方體)以實現資料探勘分析。最後,這些擴充套件還提供了小計行和總計行,使得分析起來更為方便。

    將 WINDOW 子句與視窗函式結合使用,能夠對成組的輸入行進行其它分析。

  • 視窗集合函式   幾乎所有集合函式均支援可配置滑動視窗概念,在處理輸入行時該視窗會隨著輸入行向下移動。在視窗移動時可對其中的資料執行附加計算,這樣便能夠以一種比使用語義上等同的自連線查詢或相關子查詢更為有效的方式進行進一步分析。

    例如,視窗集合函式以及 GROUP BY 子句的 CUBE、ROLLUP 和 GROUPING SETS 擴充套件能夠在一條 SQL 語句中有效地計算百分點、移動平均值、累計總和,否則可能會需要自連線、相關子查詢、臨時表或者所有這三項的某個組合。

    您可以使用視窗集合函式獲得諸如此類資訊:道瓊斯工業平均指數的季度移動平均線或者各部門所有僱員及其累計薪資。還可以利用它們來計算方差、標準差、相關和迴歸測量。

  • 視窗秩函式   通過視窗秩函式可組成單語句的 SQL 查詢以獲得以下資訊,如今年發運的產品中其總銷售額排名前 10 的產品,或者將訂單至少銷售給 15 個不同公司的銷售人員中排名前 5% 的銷售人員。

 另請參見
Oracle的GROUP BY語句除了最基本的語法外,還支援ROLLUP和CUBE語句。如果是ROLLUP(A, B, C)的話,首先會對(A、B、C)進行GROUP BY,然後對(A、B)進行GROUP BY,然後是(A)進行GROUP BY,最後對全表進行GROUP BY操作。如果是GROUP BY CUBE(A, B, C),則首先會對(A、B、C)進行GROUP BY,然後依次是(A、B),(A、C),(A),(B、C),(B),(C),最後對全表進行GROUP BY操作。 grouping_id()可以美化效果:


Oracle的GROUP BY語句除了最基本的語法外,還支援ROLLUP和CUBE語句。

除本文內容外,你還可參考:
SQL> create table t as select * from dba_indexes;

表已建立。

SQL> select index_type, status, count(*) from t group by index_type, status;

INDEX_TYPE STATUS COUNT(*)
--------------------------- -------- ----------
LOB VALID 51
NORMAL N/A 25
NORMAL VALID 479
CLUSTER VALID 11

下面來看看ROLLUP和CUBE語句的執行結果。

SQL> select index_type, status, count(*) from t group by rollup(index_type, status);

INDEX_TYPE STATUS COUNT(*)
--------------------------- -------- ----------
LOB VALID 51
LOB 51
NORMAL N/A 25
NORMAL VALID 479
NORMAL 504
CLUSTER VALID 11
CLUSTER 11
566

已選擇8行。

SQL> select index_type, status, count(*) from t group by cube(index_type, status);

INDEX_TYPE STATUS COUNT(*)
--------------------------- -------- ----------
566
N/A 25
VALID 541
LOB 51
LOB VALID 51
NORMAL 504
NORMAL N/A 25
NORMAL VALID 479
CLUSTER 11
CLUSTER VALID 11

已選擇10行。

查詢結果不是很一目瞭然,下面通過Oracle提供的函式GROUPING來整理一下查詢結果。

SQL> select grouping(index_type) g_ind, grouping(status) g_st, index_type, status, count(*)
2 from t group by rollup(index_type, status) order by 1, 2;

G_IND G_ST INDEX_TYPE STATUS COUNT(*)
---------- ---------- --------------------------- -------- ----------
0 0 LOB VALID 51
0 0 NORMAL N/A 25
0 0 NORMAL VALID 479
0 0 CLUSTER VALID 11
0 1 LOB 51
0 1 NORMAL 504
0 1 CLUSTER 11
1 1 566

已選擇8行。

這個查詢結果就直觀多了,和不帶ROLLUP語句的GROUP BY相比,ROLLUP增加了對INDEX_TYPE的GROUP BY統計和對所有記錄的GROUP BY統計。

也就是說,如果是ROLLUP(A, B, C)的話,首先會對(A、B、C)進行GROUP BY,然後對(A、B)進行GROUP BY,然後是(A)進行GROUP BY,最後對全表進行GROUP BY操作。

下面看看CUBE語句。

SQL> select grouping(index_type) g_ind, grouping(status) g_st, index_type, status, count(*)
2 from t group by cube(index_type, status) order by 1, 2;

G_IND G_ST INDEX_TYPE STATUS COUNT(*)
---------- ---------- --------------------------- -------- ----------
0 0 LOB VALID 51
0 0 NORMAL N/A 25
0 0 NORMAL VALID 479
0 0 CLUSTER VALID 11
0 1 LOB 51
0 1 NORMAL 504
0 1 CLUSTER 11
1 0 N/A 25
1 0 VALID 541
1 1 566

已選擇10行。

ROLLUP相比,CUBE又增加了對STATUS列的GROUP BY統計。

如果是GROUP BY CUBE(A, B, C),則首先會對(A、B、C)進行GROUP BY,然後依次是(A、B),(A、C),(A),(B、C),(B),(C),最後對全表進行GROUP BY操作。

除了使用GROUPING函式,還可以使用GROUPING_ID來標識GROUP BY結果。

SQL> select grouping_id(index_type, status) g_ind, index_type, status, count(*)
2 from t group by rollup(index_type, status) order by 1;

G_IND INDEX_TYPE STATUS COUNT(*)
---------- --------------------------- -------- ----------
0 LOB VALID 51
0 NORMAL N/A 25
0 NORMAL VALID 479
0 CLUSTER VALID 11
1 LOB 51
1 NORMAL 504
1 CLUSTER 11
3 566

已選擇8行。

SQL> select grouping_id(index_type, status) g_ind, index_type, status, count(*)
2 from t group by cube(index_type, status) order by 1;

G_IND INDEX_TYPE STATUS COUNT(*)
---------- --------------------------- -------- ----------
0 LOB VALID 51
0 NORMAL N/A 25
0 NORMAL VALID 479
0 CLUSTER VALID 11
1 LOB 51
1 NORMAL 504
1 CLUSTER 11
2 N/A 25
2 VALID 541
3 566

已選擇10行。

grouping_id()可以美化效果:

select DECODE(GROUPING_ID(C1), 1, '合計', C1) D1,
DECODE(GROUPING_ID(C1, C2), 1, '小計', C2) D2,
DECODE(GROUPING_ID(C1, C2, C1 + C2), 1, '小計', C1 + C2) D3,
count(*),
GROUPING_ID(C1, C2, C1 + C2, C1 + 1, C2 + 1),
GROUPING_ID(C1)
from T2
group by rollup(C1, C2, C1 + C2, C1 + 1, C2 + 1);

===========================================================

1.報表合計專用的Rollup函式

銷售報表

廣州12000

廣州22500

廣州4500

深圳11000

深圳22000

深圳3000

所有地區7500

以往的查詢SQL:

Selectarea,month,sum(money) from SaleOrder group by area,month

然後廣州,深圳的合計和所有地區合計都需要在程式裡自行累計

1.其實可以使用如下SQL:

Select area,month,sum(total_sale) from SaleOrder group by rollup(area,month)

就能產生和報表一模一樣的紀錄

2.如果year不想累加,可以寫成

Select year,month,area,sum(total_sale) from SaleOrder group by year, rollup(month,area)

另外Oracle 9i還支援如下語法:

Select year,month,area,sum(total_sale) from SaleOrder group by rollup((year,month),area)

3.如果使用Cube(area,month)而不是RollUp(area,month),除了獲得每個地區的合計之外,還將獲得每個月份的合計,在報表最後顯示。

4.Grouping讓合計列更好讀

RollUp在顯示廣州合計時,月份列為NULL,但更好的做法應該是顯示為"所有月份"

Grouping就是用來判斷當前Column是否是一個合計列,1yes,然後用Decode把它轉為"所有月份"

SelectDecode(Grouping(area),1,'所有地區',area) area,Decode(Grouping(month),1,'所有月份',month),sum(money)From SaleOrderGroup by RollUp(area,month);

2.對多級層次查詢的start with.....connect by

比如人員組織,產品類別,Oracle提供了很經典的方法

SELECT LEVEL, name, emp_id,manager_emp_id FROM employee START WITH manager_emp_id is null CONNECT BY PRIOR emp_id = manager_emp_id;

上面的語句demo了全部的應用,start with指明從哪裡開始遍歷樹,如果從根開始,那麼它的manager應該是Null,如果從某個職員開始,可以寫成emp_id='11'

CONNECT BY就是指明父子關係,注意PRIOR位置

另外還有一個LEVEL,顯示節點的層次

3.更多報表/分析決策功能

3.1分析功能的基本結構

分析功能() over( partion子句,order by子句,視窗子句)

概念上很難講清楚,還是用例子說話比較好.

3.2 Row_NumberRank, DENSE_Rank

用於選出Top 3 sales這樣的報表

當兩個業務員可能有相同業績時,就要使用RankDense_Rank

比如

金額RowNumRankDense_Rank

張三4000111

李四3000222

錢五2000333

孫六2000433

丁七1000554

這時,應該把並列第三的錢五和孫六都選進去,所以用Ranking功能比RowNumber保險.至於Desnse還是Ranking就看具體情況了。

SELECT salesperson_id, SUM(tot_sales) sp_sales,RANK( ) OVER (ORDER BY SUM(tot_sales) DESC) sales_rankFROM ordersGROUP BY salesperson_id

3.3 NTILE把紀錄平分成甲乙丙丁四等

比如我想取得前25%的紀錄,或者把25%的紀錄當作同一個level平等對待,把另25%當作另一個Level平等對待

SELECT cust_nbr, SUM(tot_sales) cust_sales,NTILE(4) OVER (ORDER BY SUM(tot_sales) DESC) sales_quartileFROM ordersGROUP BY cust_nbrORDER BY 3,2 DESC;

NTITLE(4)把紀錄以SUM(tot_sales)排序分成4.

3.4輔助分析列和Windows Function

報表除了基本事實資料外,總希望旁邊多些全年總銷量,到目前為止的累計銷量,前後三個月的平均銷量這樣的列來參考.

這種前後三個月的平均和到目前為止的累計銷量就叫windows function,見下例

SELECT month, SUM(tot_sales) monthly_sales,SUM(SUM(tot_sales)) OVER (ORDER BY monthROWS BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW) max_preceedingFROM ordersGROUP BY monthORDER BY month;

SELECT month, SUM(tot_sales) monthly_sales,AVG(SUM(tot_sales)) OVER (ORDER BY monthROWS BETWEEN 1 PRECEDING AND 1 FOLLOWING) rolling_avgFROM ordersGROUP BY monthORDER BY month;

Windows Function的關鍵就是Windows子句的幾個取值

1 PRECEDING之前的一條記錄

1 FOLLOWING之後的一條記錄

UNBOUNDED PRECEDING之前的所有記錄

CURRENT ROW當前紀錄

4.SubQuery總結

SubQuery天天用了,理論上總結一下.SubQuery分三種

1.Noncorrelated子查詢最普通的樣式.

2.Correlated Subqueries把父查詢的列拉到子查詢裡面去,頭一回cyt教我的時候理解了半天.

3.Inline View也被當成最普通的樣式用了.

然後Noncorrelated子查詢又有三種情況

1.返回一行一列where price < (select max(price) from goods )

2.返回多行一列where price>= ALL (select price from goods where type=2)

or where NOT price< ANY(select price from goods where type=2)

最常用的IN其實就是=ANY()

3.返回多行多列一次返回多列當然就節省了查詢時間

UPDATE monthly_ordersSET (tot_orders, max_order_amt) =(SELECT COUNT(*), MAX(sale_price)FROM cust_order)DELETE FROM line_itemWHERE (order_nbr, part_nbr) IN(SELECT order_nbr, part_nbr FROM cust_order c)

========================================
/*--------理解grouping sets
select a, b, c, sum( d ) from t
group by grouping sets ( a, b, c )

等效於

select * from (
select a, null, null, sum( d ) from t group by a
union all
select null, b, null, sum( d ) from t group by b
union all
select null, null, c, sum( d ) from t group by c
)
*/

_____________________________________________________________________________________________________________________________________- Oracle從8.1.6開始提供分析函式,分析函式用於計算基於組的某種聚合值,它和聚合函式的不同之處是對於每個組返回多行,而聚合函式對於每個組只返回一行。

下面例子中使用的表來自Oracle自帶的HR使用者下的表,如果沒有安裝該使用者,可以在SYS使用者下執行$ORACLE_HOME/demo/schema/human_resources/hr_main.sql來建立。

本文如果未指明,預設是在HR使用者下執行例子。
開窗函式的的理解:
開窗函式指定了分析函式工作的資料視窗大小,這個資料視窗大小可能會隨著行的變化而變化,舉例如下:
over(order by salary) 按照salary排序進行累計,order by是個預設的開窗函式
over(partition by deptno)按照部門分割槽
over(order by salary range between 50 preceding and 150 following)
每行對應的資料視窗是之前行幅度值不超過50,之後行幅度值不超過150
over(order by salary rows between 50 preceding and 150 following)
每行對應的資料視窗是之前50行,之後150行
over(order by salary rows between unbounded preceding and unbounded following)
每行對應的資料視窗是從第一行到最後一行,等效:
over(order by salary range between unbounded preceding and unbounded following)

主要參考資料:《expert one-on-one》 Tom Kyte 《Oracle9i SQL Reference》第6章


AVG
功能描述:用於計算一個組和資料視窗內表示式的平均值。
SAMPLE:下面的例子中列c_mavg計算員工表中每個員工的平均薪水報告,該平均值由當前員工和與之具有相同經理的前一個和後一個三者的平均數得來;

SELECT manager_id, last_name, hire_date, salary,
AVG(salary) OVER (PARTITION BY manager_id ORDER BY hire_date
ROWS BETWEEN 1 PRECEDING AND 1 FOLLOWING) AS c_mavg
FROM employees;

MANAGER_ID LAST_NAME HIRE_DATE SALARY C_MAVG
---------- ------------------------- --------- ---------- ----------
100 Kochhar 21-SEP-89 17000 17000
100 De Haan 13-JAN-93 17000 15000
100 Raphaely 07-DEC-94 11000 11966.6667
100 Kaufling 01-MAY-95 7900 10633.3333
100 Hartstein 17-FEB-96 13000 9633.33333
100 Weiss 18-JUL-96 8000 11666.6667
100 Russell 01-OCT-96 14000 11833.3333

CORR
功能描述:返回一對錶達式的相關係數,它是如下的縮寫:
COVAR_POP(expr1,expr2)/STDDEV_POP(expr1)*STDDEV_POP(expr2))
從統計上講,相關性是變數之間關聯的強度,變數之間的關聯意味著在某種程度
上一個變數的值可由其它的值進行預測。通過返回一個-1~1之間的一個數, 相關
係數給出了關聯的強度,0表示不相關。
SAMPLE:下例返回1998年月銷售收入和月單位銷售的關係的累積係數(本例在SH使用者下執行)

SELECT t.calendar_month_number,
CORR (SUM(s.amount_sold), SUM(s.quantity_sold))
OVER (ORDER BY t.calendar_month_number) as CUM_CORR
FROM sales s, times t
WHERE s.time_id = t.time_id AND calendar_year = 1998
GROUP BY t.calendar_month_number
ORDER BY t.calendar_month_number;

CALENDAR_MONTH_NUMBER CUM_CORR
--------------------- ----------
1
2 1
3 .994309382
4 .852040875
5 .846652204
6 .871250628
7 .910029803
8 .917556399
9 .920154356
10 .86720251
11 .844864765
12 .903542662


COVAR_POP
功能描述:返回一對錶達式的總體協方差。
SAMPLE:下例CUM_COVP返回定價和最小產品價格的累積總體協方差

SELECT product_id, supplier_id,
COVAR_POP(list_price, min_price)
OVER (ORDER BY product_id, supplier_id) AS CUM_COVP,
COVAR_SAMP(list_price, min_price)
OVER (ORDER BY product_id, supplier_id) AS CUM_COVS
FROM product_information p
WHERE category_id = 29
ORDER BY product_id, supplier_id;

PRODUCT_ID SUPPLIER_ID CUM_COVP CUM_COVS
---------- ----------- ---------- ----------
1774 103088 0
1775 103087 1473.25 2946.5
1794 103096 1702.77778 2554.16667
1825 103093 1926.25 2568.33333
2004 103086 1591.4 1989.25
2005 103086 1512.5 1815
2416 103088 1475.97959 1721.97619
.
.


COVAR_SAMP
功能描述:返回一對錶達式的樣本協方差
SAMPLE:下例CUM_COVS返回定價和最小產品價格的累積樣本協方差

SELECT product_id, supplier_id,
COVAR_POP(list_price, min_price)
OVER (ORDER BY product_id, supplier_id) AS CUM_COVP,
COVAR_SAMP(list_price, min_price)
OVER (ORDER BY product_id, supplier_id) AS CUM_COVS
FROM product_information p
WHERE category_id = 29
ORDER BY product_id, supplier_id;

PRODUCT_ID SUPPLIER_ID CUM_COVP CUM_COVS
---------- ----------- ---------- ----------
1774 103088 0
1775 103087 1473.25 2946.5
1794 103096 1702.77778 2554.16667
1825 103093 1926.25 2568.33333
2004 103086 1591.4 1989.25
2005 103086 1512.5 1815
2416 103088 1475.97959 1721.97619
.
.


COUNT
功能描述:對一組內發生的事情進行累積計數,如果指定*或一些非空常數,count將對所有行計數,如果指定一個表示式,count返回表示式非空賦值的計數,當有相同值出現時,這些相等的值都會被納入被計算的值;可以使用DISTINCT來記錄去掉一組中完全相同的資料後出現的行數。
SAMPLE:下面例子中計算每個員工在按薪水排序中當前行附近薪水在[n-50,n+150]之間的行數,n表示當前行的薪水
例如,Philtanker的薪水2200,排在他之前的行中薪水大於等於2200-50的有1行,排在他之後的行中薪水小於等於2200+150的行沒有,所以count計數值cnt3為2(包括自己當前行);cnt2值相當於小於等於當前行的SALARY值的所有行數

SELECT last_name, salary, COUNT(*) OVER () AS cnt1,
COUNT(*) OVER (ORDER BY salary) AS cnt2,
COUNT(*) OVER (ORDER BY salary RANGE BETWEEN 50 PRECEDING
AND 150 FOLLOWING) AS cnt3 FROM employees;

LAST_NAME SALARY CNT1 CNT2 CNT3
------------------------- ---------- ---------- ---------- ----------
Olson 2100 107 1 3
Markle 2200 107 3 2
Philtanker 2200 107 3 2
Landry 2400 107 5 8
Gee 2400 107 5 8
Colmenares 2500 107 11 10
Patel 2500 107 11 10
.
.


CUME_DIST
功能描述:計算一行在組中的相對位置,CUME_DIST總是返回大於0、小於或等於1的數,該數表示該行在N行中的位置。例如,在一個3行的組中,返回的累計分佈值為1/3、2/3、3/3
SAMPLE:下例中計算每個工種的員工按薪水排序依次累積出現的分佈百分比

SELECT job_id, last_name, salary, CUME_DIST()
OVER (PARTITION BY job_id ORDER BY salary) AS cume_dist
FROM employees WHERE job_id LIKE 'PU%';

JOB_ID LAST_NAME SALARY CUME_DIST
---------- ------------------------- ---------- ----------
PU_CLERK Colmenares 2500 .2
PU_CLERK Himuro 2600 .4
PU_CLERK Tobias 2800 .6
PU_CLERK Baida 2900 .8
PU_CLERK Khoo 3100 1
PU_MAN Raphaely 11000 1


DENSE_RANK
功能描述:根據ORDER BY子句中表達式的值,從查詢返回的每一行,計算它們與其它行的相對位置。組內的資料按ORDER BY子句排序,然後給每一行賦一個號,從而形成一個序列,該序列從1開始,往後累加。每次ORDER BY表示式的值發生變化時,該序列也隨之增加。有同樣值的行得到同樣的數字序號(認為null時相等的)。密集的序列返回的時沒有間隔的數
SAMPLE:下例中計算每個員工按部門分割槽再按薪水排序,依次出現的序列號(注意與RANK函式的區別)

SELECT d.department_id , e.last_name, e.salary, DENSE_RANK()
OVER (PARTITION BY e.department_id ORDER BY e.salary) as drank
FROM employees e, departments d
WHERE e.department_id = d.department_id
AND d.department_id IN ('60', '90');

DEPARTMENT_ID LAST_NAME SALARY DRANK
------------- ------------------------- ---------- ----------
60 Lorentz 4200 1
60 Austin 4800 2
60 Pataballa 4800 2
60 Ernst 6000 3
60 Hunold 9000 4
90 Kochhar 17000 1
90 De Haan 17000 1
90 King 24000 2


FIRST
功能描述:從DENSE_RANK返回的集合中取出排在最前面的一個值的行(可能多行,因為值可能相等),因此完整的語法需要在開始處加上一個集合函式以從中取出記錄
SAMPLE:下面例子中DENSE_RANK按部門分割槽,再按佣金commission_pct排序,FIRST取出佣金最低的對應的所有行,然後前面的MAX函式從這個集合中取出薪水最低的值;LAST取出佣金最高的對應的所有行,然後前面的MIN函式從這個集合中取出薪水最高的值
SELECT last_name, department_id, salary,
MIN(salary) KEEP (DENSE_RANK FIRST ORDER BY commission_pct)
OVER (PARTITION BY department_id) "Worst",
MAX(salary) KEEP (DENSE_RANK LAST ORDER BY commission_pct)
OVER (PARTITION BY department_id) "Best"
FROM employees
WHERE department_id in (20,80)
ORDER BY department_id, salary;

LAST_NAME DEPARTMENT_ID SALARY Worst Best
------------------------- ------------- ---------- ---------- ----------
Fay 20 6000 6000 13000
Hartstein 20 13000 6000 13000
Kumar 80 6100 6100 14000
Banda 80 6200 6100 14000
Johnson 80 6200 6100 14000
Ande 80 6400 6100 14000
Lee 80 6800 6100 14000
Tuvault 80 7000 6100 14000
Sewall 80 7000 6100 14000
Marvins 80 7200 6100 14000
Bates 80 7300 6100 14000
.
.
.


FIRST_VALUE
功能描述:返回組中資料視窗的第一個值。
SAMPLE:下面例子計算按部門分割槽按薪水排序的資料視窗的第一個值對應的名字,如果薪水的第一個值有多個,則從多個對應的名字中取預設排序的第一個名字

SELECT department_id, last_name, salary, FIRST_VALUE(last_name)
OVER (PARTITION BY department_id ORDER BY salary ASC ) AS lowest_sal
FROM employees
WHERE department_id in(20,30);

DEPARTMENT_ID LAST_NAME SALARY LOWEST_SAL
------------- ------------------------- ---------- --------------
20 Fay 6000 Fay
20 Hartstein 13000 Fay
30 Colmenares 2500 Colmenares
30 Himuro 2600 Colmenares
30 Tobias 2800 Colmenares
30 Baida 2900 Colmenares
30 Khoo 3100 Colmenares
30 Raphaely 11000 Colmenares


LAG
功能描述:可以訪問結果集中的其它行而不用進行自連線。它允許去處理遊標,就好像遊標是一個數組一樣。在給定組中可參考當前行之前的行,這樣就可以從組中與當前行一起選擇以前的行。Offset是一個正整數,其預設值為1,若索引超出視窗的範圍,就返回預設值(預設返回的是組中第一行),其相反的函式是LEAD
SAMPLE:下面的例子中列prev_sal返回按hire_date排序的前1行的salary值

SELECT last_name, hire_date, salary,
LAG(salary, 1, 0) OVER (ORDER BY hire_date) AS prev_sal
FROM employees
WHERE job_id = 'PU_CLERK';

LAST_NAME HIRE_DATE SALARY PREV_SAL
------------------------- ---------- ---------- ----------
Khoo 18-5月 -95 3100 0
Tobias 24-7月 -97 2800 3100
Baida 24-12月-97 2900 2800
Himuro 15-11月-98 2600 2900
Colmenares 10-8月 -99 2500 2600


LAST
功能描述:從DENSE_RANK返回的集合中取出排在最後面的一個值的行(可能多行,因為值可能相等),因此完整的語法需要在開始處加上一個集合函式以從中取出記錄
SAMPLE:下面例子中DENSE_RANK按部門分割槽,再按佣金commission_pct排序,FIRST取出佣金最低的對應的所有行,然後前面的MAX函式從這個集合中取出薪水最低的值;LAST取出佣金最高的對應的所有行,然後前面的MIN函式從這個集合中取出薪水最高的值
SELECT last_name, department_id, salary,
MIN(salary) KEEP (DENSE_RANK FIRST ORDER BY commission_pct)
OVER (PARTITION BY department_id) "Worst",
MAX(salary) KEEP (DENSE_RANK LAST ORDER BY commission_pct)
OVER (PARTITION BY department_id) "Best"
FROM employees
WHERE department_id in (20,80)
ORDER BY department_id, salary;

LAST_NAME DEPARTMENT_ID SALARY Worst Best
------------------------- ------------- ---------- ---------- ----------
Fay 20 6000 6000 13000
Hartstein 20 13000 6000 13000
Kumar 80 6100 6100 14000
Banda 80 6200 6100 14000
Johnson 80 6200 6100 14000
Ande 80 6400 6100 14000
Lee 80 6800 6100 14000
Tuvault 80 7000 6100 14000
Sewall 80 7000 6100 14000
Marvins 80 7200 6100 14000
Bates 80 7300 6100 14000
.
LAST_VALUE
功能描述:返回組中資料視窗的最後一個值。
SAMPLE:下面例子計算按部門分割槽按薪水排序的資料視窗的最後一個值對應的名字,如果薪水的最後一個值有多個,則從多個對應的名字中取預設排序的最後一個名字
SELECT department_id, last_name, salary, LAST_VALUE(last_name)
OVER(PARTITION BY department_id ORDER BY salary) AS highest_sal
FROM employees
WHERE department_id in(20,30);

DEPARTMENT_ID LAST_NAME SALARY HIGHEST_SAL
------------- ------------------------- ---------- ------------
20 Fay 6000 Fay
20 Hartstein 13000 Hartstein
30 Colmenares 2500 Colmenares
30 Himuro 2600 Himuro
30 Tobias 2800 Tobias
30 Baida 2900 Baida
30 Khoo 3100 Khoo
30 Raphaely 11000 Raphaely


LEAD
功能描述:LEAD與LAG相反,LEAD可以訪問組中當前行之後的行。Offset是一個正整數,其預設值為1,若索引超出視窗的範圍,就返回預設值(預設返回的是組中第一行)
SAMPLE:下面的例子中每行的"NextHired"返回按hire_date排序的下一行的hire_date值

SELECT last_name, hire_date,
LEAD(hire_date, 1) OVER (ORDER BY hire_date) AS "NextHired"
FROM employees WHERE department_id = 30;

LAST_NAME HIRE_DATE NextHired
------------------------- --------- ---------
Raphaely 07-DEC-94 18-MAY-95
Khoo 18-MAY-95 24-JUL-97
Tobias 24-JUL-97 24-DEC-97
Baida 24-DEC-97 15-NOV-98
Himuro 15-NOV-98 10-AUG-99
Colmenares 10-AUG-99


MAX
功能描述:在一個組中的資料視窗中查詢表示式的最大值。
SAMPLE:下面例子中dept_max返回當前行所在部門的最大薪水值

SELECT department_id, last_name, salary,
MAX(salary) OVER (PARTITION BY department_id) AS dept_max
FROM employees WHERE department_id in (10,20,30);

DEPARTMENT_ID LAST_NAME SALARY DEPT_MAX
------------- ------------------------- ---------- ----------
10 Whalen 4400 4400
20 Hartstein 13000 13000
20 Fay 6000 13000
30 Raphaely 11000 11000
30 Khoo 3100 11000
30 Baida 2900 11000
30 Tobias 2800 11000
30 Himuro 2600 11000
30 Colmenares 2500 11000


MIN
功能描述:在一個組中的資料視窗中查詢表示式的最小值。
SAMPLE:下面例子中dept_min返回當前行所在部門的最小薪水值

SELECT department_id, last_name, salary,
MIN(salary) OVER (PARTITION BY department_id) AS dept_min
FROM employees WHERE department_id in (10,20,30);

DEPARTMENT_ID LAST_NAME SALARY DEPT_MIN
------------- ------------------------- ---------- ----------
10 Whalen 4400 4400
20 Hartstein 13000 6000
20 Fay 6000 6000
30 Raphaely 11000 2500
30 Khoo 3100 2500
30 Baida 2900 2500
30 Tobias 2800 2500
30 Himuro 2600 2500
30 Colmenares 2500 2500


NTILE
功能描述:將一個組分為"表示式"的散列表示,例如,如果表示式=4,則給組中的每一行分配一個數(從1到4),如果組中有20行,則給前5行分配1,給下5行分配2等等。如果組的基數不能由表示式值平均分開,則對這些行進行分配時,組中就沒有任何percentile的行數比其它percentile的行數超過一行,最低的percentile是那些擁有額外行的percentile。例如,若表示式=4,行數=21,則percentile=1的有5行,percentile=2的有5行等等。
SAMPLE:下例中把6行資料分為4份

SELECT last_name, salary,
NTILE(4) OVER (ORDER BY salary DESC) AS quartile FROM employees
WHERE department_id = 100;

LAST_NAME SALARY QUARTILE
------------------------- ---------- ----------
Greenberg 12000 1
Faviet 9000 1
Chen 8200 2
Urman 7800 2
Sciarra 7700 3
Popp 6900 4


PERCENT_RANK
功能描述:和CUME_DIST(累積分配)函式類似,對於一個組中給定的行來說,在計算那行的序號時,先減1,然後除以n-1(n為組中所有的行數)。該函式總是返回0~1(包括1)之間的數。
SAMPLE:下例中如果Khoo的salary為2900,則pr值為0.6,因為RANK函式對於等值的返回序列值是一樣的

SELECT department_id, last_name, salary,
PERCENT_RANK()
OVER (PARTITION BY department_id ORDER BY salary) AS pr
FROM employees
WHERE department_id < 50
ORDER BY department_id,salary;

DEPARTMENT_ID LAST_NAME SALARY PR
------------- ------------------------- ---------- ----------
10 Whalen 4400 0
20 Fay 6000 0
20 Hartstein 13000 1
30 Colmenares 2500 0
30 Himuro 2600 0.2
30 Tobias 2800 0.4
30 Baida 2900 0.6
30 Khoo 3100 0.8
30 Raphaely 11000 1
40 Mavris 6500 0


PERCENTILE_CONT
功能描述:返回一個與輸入的分佈百分比值相對應的資料值,分佈百分比的計算方法見函式PERCENT_RANK,如果沒有正好對應的資料值,就通過下面演算法來得到值:
RN = 1+ (P*(N-1)) 其中P是輸入的分佈百分比值,N是組內的行數
CRN = CEIL(RN) FRN = FLOOR(RN)
if (CRN = FRN = RN) then
(value of expression from row at RN)
else
(CRN - RN) * (value of expression for row at FRN) +
(RN - FRN) * (value of expression for row at CRN)
注意:本函式與PERCENTILE_DISC的區別在找不到對應的分佈值時返回的替代值的計算方法不同

SAMPLE:在下例中,對於部門60的Percentile_Cont值計算如下:
P=0.7 N=5 RN =1+ (P*(N-1)=1+(0.7*(5-1))=3.8 CRN = CEIL(3.8)=4
FRN = FLOOR(3.8)=3
(4 - 3.8)* 4800 + (3.8 - 3) * 6000 = 5760

SELECT last_name, salary, department_id,
PERCENTILE_CONT(0.7) WITHIN GROUP (ORDER BY salary)
OVER (PARTITION BY department_id) "Percentile_Cont",
PERCENT_RANK()
OVER (PARTITION BY department_id ORDER BY salary) "Percent_Rank"
FROM employees WHERE department_id IN (30, 60);

LAST_NAME SALARY DEPARTMENT_ID Percentile_Cont Percent_Rank
------------------------- ---------- ------------- --------------- ------------
Colmenares 2500 30 3000 0
Himuro 2600 30 3000 0.2
Tobias 2800 30 3000 0.4
Baida 2900 30 3000 0.6
Khoo 3100 30 3000 0.8
Raphaely 11000 30 3000 1
Lorentz 4200 60 5760 0
Austin 4800 60 5760 0.25
Pataballa 4800 60 5760 0.25
Ernst 6000 60 5760 0.75
Hunold 9000 60 5760 1


PERCENTILE_DISC
功能描述:返回一個與輸入的分佈百分比值相對應的資料值,分佈百分比的計算方法見函式CUME_DIST,如果沒有正好對應的資料值,就取大於該分佈值的下一個值。
注意:本函式與PERCENTILE_CONT的區別在找不到對應的分佈值時返回的替代值的計算方法不同

SAMPLE:下例中0.7的分佈值在部門30中沒有對應的Cume_Dist值,所以就取下一個分佈值0.83333333所對應的SALARY來替代

SELECT last_name, salary, department_id,
PERCENTILE_DISC(0.7) WITHIN GROUP (ORDER BY salary )
OVER (PARTITION BY department_id) "Percentile_Disc",
CUME_DIST() OVER (PARTITION BY department_id ORDER BY salary)