row_number() over(partition by) 和 first_value over(partition by) 實用例子和二者區別。Mysql和Hive分別實現取組內最大條資料

阿新 • • 發佈：2021-02-04

需求: 1：id有5組, 現在要求出各組內薪資最高得那個人

2：如果該組有多個薪水一樣得人,那麼取出年齡最大那個

資料來源: mysql、hive

id	name	age	salary
1	a1	10	80
1	a2	11	65
1	a3	5	90
2	b1	12	130
2	b2	13	45
2	b3	14	80
3	c1	14	300
3	c2	15	900
3	c3	16	900
4	d1	16	500
4	d2	16	600
4	d3	17	300
5	e1	20	200
5	e2	20	200
5	e3	19	100

一、資料生成

1：建立表

CREATE TABLE `test` ( `id` varchar(255) CHARACTER SET utf8 COLLATE utf8_general_ci NOT NULL, `name` varchar(255) CHARACTER SET utf8 COLLATE utf8_general_ci NULL DEFAULT NULL, `age` int(255) NULL DEFAULT NULL, `salary` int(10) NULL DEFAULT NULL ) ENGINE = InnoDB CHARACTER SET = utf8 COLLATE = utf8_general_ci ROW_FORMAT = Dynamic;

2: 插入資料

insert into test(id,name,age,salary) values(1,'a1',10,80);

insert into test(id,name,age,salary) values(1,'a2',11,65);

insert into test(id,name,age,salary) values(1,'a3',05,90);

insert into test(id,name,age,salary) values(2,'b1',12,130);

insert into test(id,name,age,salary) values(2,'b2',13,45);

insert into test(id,name,age,salary) values(2,'b3',14,80);

insert into test(id,name,age,salary) values(3,'c1',14,300);

insert into test(id,name,age,salary) values(3,'c2',15,900);

insert into test(id,name,age,salary) values(3,'c3',16,900);

insert into test(id,name,age,salary) values(4,'d1',16,500);

insert into test(id,name,age,salary) values(4,'d2',16,600);

insert into test(id,name,age,salary) values(4,'d3',17,300);

insert into test(id,name,age,salary) values(5,'e1',20,200);

insert into test(id,name,age,salary) values(5,'e2',20,200);

insert into test(id,name,age,salary) values(5,'e3',19,100);

二: 需求實現(Mysql)

Mysql實現求出組內最大

SELECT * FROM test WHERE (id,salary) IN (
	SELECT id,MAX(salary) FROM test GROUP BY id
)

id	name	age	salary
1	a3	5	90
2	b1	12	130
3	c2	15	900
3	c3	16	900
4	d2	16	600
5	e1	20	200
5	e2	20	200

可以看到結果現在是正確得,但是3組和5組當中, 3組求出來了組內薪資最大但是有兩條資料薪資一樣,他們的age不一樣, 5組求出來了組內薪資最大但是有兩條資料薪資一樣,他們age也一樣。

所以現在實現第二個需求,如果薪資一樣求出age最大那一條資料, 如果薪資一樣年齡也一樣的話取出組內任意一條。那麼現在3組應該取出name為c3的, 5組取出組內任意一條

SELECT
	* 
FROM
	test 
WHERE
	( ID, AGE, salary ) IN (
	SELECT
		T.ID,
		MAX( AGE ),
		salary 
	FROM
		test T 
	WHERE
		( T.ID, T.SALARY ) IN ( SELECT ID, MAX( SALARY ) FROM test T1 GROUP BY T1.ID ) 
	GROUP BY
		T.ID 
	) 
GROUP BY
	id

id	name	age	salary
1	a3	5	90
2	b1	12	130
3	c3	16	900
4	d2	16	600
5	e1	20	200

現在這樣的結果,就符合了需求

三: 需求實現(Hive)

在使用開窗函式之前可以先了解一下什麼是開窗函式

https://blog.csdn.net/kuodannie1668/article/details/79757186?utm_medium=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-1.control&depth_1-utm_source=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-1.control

在瞭解完開窗函式之後可以結合需求, 這次我們需要的是,row_number() over(partition by) 或者first_value over(partition by) 這兩個函式, 具體實現方法如下

SELECT id,name,age,salary,row_number() over (PARTITION BY id ORDER BY salary desc) rn from salarytest

id	name	age	salary	rn
1	a3	5	90	1
1	a1	10	80	2
1	a2	11	65	3
2	b1	12	130	1
2	b3	14	80	2
2	b2	13	45	3
3	c3	16	900	1
3	c2	15	900	2
3	c1	14	300	3
4	d2	16	600	1
4	d1	16	500	2
4	d3	17	300	3
5	e1	20	200	1
5	e2	20	200	2
5	e3	19	100	3

row_number() over(partition by) 和 first_value over(partition by) 實用例子和二者區別。Mysql和Hive分別實現取組內最大條資料

技術標籤：Mysqlhivehivemysql 需求: 1：id有5組, 現在要求出各組內薪資最高得那個人

面試記錄05：編寫函式找出陣列內最大和最小元素

題目：通過C語言，基於以下語句編寫一函式，可以找出陣列中最大值和最小值

基於mysql實現group by取各分組最新一條資料

前言： group by函式後取到的是分組中的第一條資料，但是我們有時候需要取出各分組的最新一條，該怎麼實現呢？

如何使用遍歷陣列和方法的思想（形參和實參概念的理解），求一個生成一個數值隨機的陣列，求出最大值和最小值

技術標籤：陣列的遍歷java 如何使用遍歷陣列和方法的思想（形參和實參概念的理解），求一個生成一個數值隨機的陣列，求出最大值和最小值

面試 ---- i++在兩個執行緒中分別執行100次，最大值和最小值分別是多少？

i++只需要執行一條指令，並不能保證多個執行緒i++，操作同一個i變數，可以得到正確的結果。因為還有暫存器的因素，多個CPU對應多個暫存器。每次要先把i從記憶體中複製到暫存器，然後++，然後再把i複製到記憶體中，這

ROWNUMBER() OVER( PARTITION BY COL1 ORDER BY COL2)/ ROWNUMBER() OVER( PARTITION BY COL1 ORDER BY CO

ROWNUMBER() OVER( PARTITION BY COL1 ORDER BY COL2)用法今天在使用多欄位去重時，由於某些欄位有多種可能性，只需根據部分欄位進行去重，在網上看到了rownumber() over(partition by col1 ord

linq和ef關於group by取最大值的兩種寫法

//LINQ: var temp = from p in db.jj_Credentials group p by p.ProfessionID into g select new { g.Key, MaxPrice = g.Max(p => p.CredentialsRankID)

Mysql排序和分頁(order by&limit)及存在的坑

排序查詢（order by）電商中：我們想檢視今天所有成交的訂單，按照交易額從高到低排序，此時我們可以使用資料庫中的排序功能來完成。

PHP美團外賣開放平臺開發記錄，IM線上通訊token獲取和訊息解密！By勤勤學長

技術標籤：美團外賣開放平臺jqueryPHPwebsocketphp美團 token獲取：一開始我還以為，監聽哪個店鋪的訊息，就用哪個店鋪的appAuthToken獲取長連結的token，但實際上，不管是使用哪個店鋪的appAuthToken返回的內容

記錄 A表與B表中最新的一條資料關聯（例子工單表與工單回訪表）和 PageHelper外掛丟失order by語句

工單表order 表結構及部分測試資料如下： id order_name xxx 1 order_1 .... 2 order_2 .... 3 order_3

leetcode215. 陣列中的第K個最大元素（優先佇列堆 partition減治快排優化）

連結：https://leetcode-cn.com/problems/kth-largest-element-in-an-array/ 題目：給定整數陣列 nums 和整數 k，請返回陣列中第 k 個最大的元素。

[LeetCode] 1262. Greatest Sum Divisible by Three 可被三整除的最大和

Given an arraynumsof integers, we need to find the maximum possible sum of elements of the array such that it is divisible by three.

JDK原始碼裡的HashMap/LinkedHashMap和自己手寫的HashMap到底有什麼區別?

HashMap特點 HashMap衝突時先拉出一個連結串列，當連結串列節點超過TREEIFY_THRESHOLD,自動進行TREEIFY將連結串列轉換成紅黑樹,將Node轉換成TreeNode

巧用遞迴解決矩陣最大序列和問題

之前同事問了一道需要點腦洞的演演算法題，我覺得蠻有意思的，思路可能會給大家帶來一些啟發，特意在此記錄一下

Docker同時安裝MySQL和MariaDB的方法步驟

MySQL和MariaDB的關係 MariaDB資料庫管理系統是MySQL的一個分支，主要由開源社群在維護，採用GPL授權許可。

centos7 安裝mysql和mysqlclient遇到的坑總結

1. 新增MySQL Yum源 MySQL官網>DOWNLOADS>MySQL Yum Repository找到合適版本的yum源 $wget https://dev.mysql.com/get/mysql80-community-release-el7-2.noarch.rpm

Mysql檢視最大連線數和修改最大連線數的講解

MySQL檢視最大連線數和修改最大連線數 1、檢視最大連線數 show variables like \'%max_connections%\';

insert和select結合實現"插入某欄位在資料庫中的最大值＋1"的方法

本文是mysql 資料庫問題一將表一的資料匯入表二：將表一的資料匯入表二：將表二中的資料插入到表一，表一的列對應表二 select 出來的列

MySQL和Redis實現二級快取的方法詳解

redis簡介 Redis 是完全開源免費的，遵守BSD協議，是一個高效能的key-value資料庫

淺談MySQL和MariaDB區別(mariadb和mysql的效能比較)

MariaDB資料庫管理系統是MySQL的一個分支，主要由開源社群在維護，採用GPL授權許可。開發這個分支的原因之一是：甲骨文公司收購了MySQL後，有將MySQL閉源的潛在風險，因此社群採用分支的方式來避開這個風險。

id	name	age	salary
1	a1	10	80
1	a2	11	65
1	a3	5	90
2	b1	12	130
2	b2	13	45
2	b3	14	80
3	c1	14	300
3	c2	15	900
3	c3	16	900
4	d1	16	500
4	d2	16	600
4	d3	17	300
5	e1	20	200
5	e2	20	200
5	e3	19	100

id	name	age	salary
1	a1	10	80
1	a2	11	65
1	a3	5	90
2	b1	12	130
2	b2	13	45
2	b3	14	80
3	c1	14	300
3	c2	15	900
3	c3	16	900
4	d1	16	500
4	d2	16	600
4	d3	17	300
5	e1	20	200
5	e2	20	200
5	e3	19	100

row_number() over(partition by) 和 first_value over(partition by) 實用例子和二者區別。Mysql和Hive分別實現取組內最大條資料

一、資料生成

二: 需求實現(Mysql)

三: 需求實現(Hive)

相關推薦

id	name	age	salary
1	a1	10	80
1	a2	11	65
1	a3	5	90
2	b1	12	130
2	b2	13	45
2	b3	14	80
3	c1	14	300
3	c2	15	900
3	c3	16	900
4	d1	16	500
4	d2	16	600
4	d3	17	300
5	e1	20	200
5	e2	20	200
5	e3	19	100