Mysql 8 新特性 window functions 的作用
MySQL 8.0的新特性包括:
- 對Unicode 9.0的開箱即用的完整支援
- 支援視窗函式和遞迴SQL語法,這在以往是不可能或者很難才能編寫這樣的查詢語句
- 對原生JSON資料和文件儲存功能的增強支援
- MySQL 8.0的釋出,跳過了多個版本號(從5.5開始),由於6.0修改和7.0是用來保留做MySQL的叢集版本,因此採用了8.0的版本號。
1. 問題
Mysql 8.0.2 中新增加了一個主要功能 - 視窗函式 window function
這個功能具體是解決什麼問題?下面先看一個SQL查詢的場景,看一下平時我們是怎麼做的,然後再看一下如何使用視窗函式來更方便的解決
(1)準備測試表和資料
建一個簡單的電影資訊表,欄位有:
ID release_year(發行年份) category_id(所屬分類ID) rating(評分) CREATE TABLE films ( id int(11),release_year int(11),category_id int(11),rating decimal(3,2) )
插入測試資料
insert into films2 values (1,2015,1,8.00),(2,2,8.50),(3,3,9.00),(4,2016,8.20),(5,8.40),(6,2017,7.00);
整體形式如下
(2)查詢需求
查詢每一年中的平均評分,要求每條記錄後面都顯示當年的平均評分
例如 2015 年,有3條記錄,8.00,8.50,9.00 的平均分是 8.5,2016年有2條記錄,平均分是 8.3,2017年有1條記錄,平均分為 7.00
最終結果的形式如下:
我們可以使用子查詢來計算各年的平均分,然後使用 join 把結果連接回去
SELECT f.id,f.release_year,f.rating,years.year_avg FROM films f LEFT JOIN ( SELECT f.release_year,AVG(rating) AS year_avg FROM films f GROUP BY f.release_year ) years ON f.release_year = years.release_year
是不是有點複雜,下面看下視窗函式的處理方式
2. window functions 的解決方案
什麼是 window functions
window functions 是對一組資料進行計算,與使用 group by 時不同,不會進行單行的結果輸出,而是與每條記錄相關聯
語法示例:
SELECT function_name OVER ( window_definition ) FROM (...)
window_definition 是定義要計算的記錄集合,就像是一個小視窗,在整體資料集合上顯示出一部分
function_name 指定了對於視窗中的資料集合執行什麼計算
回頭看下上面的那個查詢,需要計算每部電影所在年份的所有電影平均評分,下面使用視窗函式來處理
SELECT f.id,f.category_id,AVG(rating) OVER (PARTITION BY release_year) AS year_avg FROM films f
window_definition 部分使用了 PARTITION BY 從句,它告訴資料庫把結果資料集合分割成更小的部分,把 release_year 相同的放在一起,函式 AVG(rating) 會對每個視窗資料進行計算,然後把結果放到每一行中
查詢示例1
計算每部電影在所屬年份中的評分排行位置
查詢語句
SELECT f.id,RANK() OVER (PARTITION BY release_year ORDER BY rating DESC) AS year_rank FROM films f
window_definition 部分使用 PARTITION BY 來根據 release_year 劃分視窗,使用 ORDER BY 在視窗內排序
RANK() 函式可以返回一行資料在本視窗中的位置
查詢結果
查詢示例2
檢視每部電影在總排行榜中的位置
查詢語句
SELECT f.id,RANK() OVER (ORDER BY rating DESC) AS general_rank FROM films f order by id
主語句中的 order by 保證了整個資料集的排序
window_definition 中沒有使用 PARTITION BY,那麼就是把整個結果集合當做一個視窗,ORDER BY 對視窗中的資料根據 rating 做降序排序,把得分最高的放前面
RANK() 函式取得每條記錄在視窗中的位置
查詢結果
3. 小結
視窗函式是 Mysql 8.0.2 中的高階特性,可以方便的執行聚合計算,而不用對結果集進行實際的聚合,大大增加了靈活性、可讀性,更便於維護