1. 程式人生 > 資料庫 >Mysql 8 新特性 window functions 的作用

Mysql 8 新特性 window functions 的作用

MySQL 8.0的新特性包括:

  • 對Unicode 9.0的開箱即用的完整支援
  • 支援視窗函式和遞迴SQL語法,這在以往是不可能或者很難才能編寫這樣的查詢語句
  • 對原生JSON資料和文件儲存功能的增強支援
  • MySQL 8.0的釋出,跳過了多個版本號(從5.5開始),由於6.0修改和7.0是用來保留做MySQL的叢集版本,因此採用了8.0的版本號。

1. 問題

Mysql 8.0.2 中新增加了一個主要功能 - 視窗函式 window function

這個功能具體是解決什麼問題?下面先看一個SQL查詢的場景,看一下平時我們是怎麼做的,然後再看一下如何使用視窗函式來更方便的解決

(1)準備測試表和資料

建一個簡單的電影資訊表,欄位有:

ID
release_year(發行年份)
category_id(所屬分類ID)
rating(評分)
CREATE TABLE films (
 id int(11),release_year int(11),category_id int(11),rating decimal(3,2)
)

插入測試資料

insert into films2 values
(1,2015,1,8.00),(2,2,8.50),(3,3,9.00),(4,2016,8.20),(5,8.40),(6,2017,7.00);

整體形式如下

(2)查詢需求

查詢每一年中的平均評分,要求每條記錄後面都顯示當年的平均評分

例如 2015 年,有3條記錄,8.00,8.50,9.00 的平均分是 8.5,2016年有2條記錄,平均分是 8.3,2017年有1條記錄,平均分為 7.00

最終結果的形式如下:

我們可以使用子查詢來計算各年的平均分,然後使用 join 把結果連接回去

SELECT
 f.id,f.release_year,f.rating,years.year_avg
FROM films f
LEFT JOIN (
 SELECT f.release_year,AVG(rating) AS year_avg
 FROM films f
 GROUP BY f.release_year
) years 
ON f.release_year = years.release_year

是不是有點複雜,下面看下視窗函式的處理方式

2. window functions 的解決方案

什麼是 window functions

window functions 是對一組資料進行計算,與使用 group by 時不同,不會進行單行的結果輸出,而是與每條記錄相關聯

語法示例:

SELECT
function_name OVER ( window_definition )
FROM (...)

window_definition 是定義要計算的記錄集合,就像是一個小視窗,在整體資料集合上顯示出一部分

function_name 指定了對於視窗中的資料集合執行什麼計算

回頭看下上面的那個查詢,需要計算每部電影所在年份的所有電影平均評分,下面使用視窗函式來處理

SELECT
 f.id,f.category_id,AVG(rating) OVER 
 (PARTITION BY release_year) AS year_avg
FROM films f

window_definition 部分使用了 PARTITION BY 從句,它告訴資料庫把結果資料集合分割成更小的部分,把 release_year 相同的放在一起,函式 AVG(rating) 會對每個視窗資料進行計算,然後把結果放到每一行中

查詢示例1

計算每部電影在所屬年份中的評分排行位置

查詢語句

SELECT
 f.id,RANK() OVER (PARTITION BY release_year 
  ORDER BY rating DESC) AS year_rank
FROM films f

window_definition 部分使用 PARTITION BY 來根據 release_year 劃分視窗,使用 ORDER BY 在視窗內排序

RANK() 函式可以返回一行資料在本視窗中的位置

查詢結果

查詢示例2

檢視每部電影在總排行榜中的位置

查詢語句

SELECT
 f.id,RANK() OVER (ORDER BY rating DESC) 
  AS general_rank
FROM films f order by id

主語句中的 order by 保證了整個資料集的排序

window_definition 中沒有使用 PARTITION BY,那麼就是把整個結果集合當做一個視窗,ORDER BY 對視窗中的資料根據 rating 做降序排序,把得分最高的放前面

RANK() 函式取得每條記錄在視窗中的位置

查詢結果

3. 小結

視窗函式是 Mysql 8.0.2 中的高階特性,可以方便的執行聚合計算,而不用對結果集進行實際的聚合,大大增加了靈活性、可讀性,更便於維護