1. 程式人生 > >MySQL 實現行轉列SQL

MySQL 實現行轉列SQL

概述

好久沒寫SQL語句,今天看到問答中的一個問題,拿來研究一下。

情景簡介

學校裡面記錄成績,每個人的選課不一樣,而且以後會新增課程,所以不需要把所有課程當作列。資料表裡面數據如下圖,使用姓名+課程作為聯合主鍵(有些需求可能不需要聯合主鍵)。本文以MySQL為基礎,其他資料庫會有些許語法不同。

資料庫表資料:


處理後的結果(行轉列):


方法一:

這裡可以使用Max,也可以使用Sum;

注意第二張圖,當有學生的某科成績缺失的時候,輸出結果為Null; 

SELECT
	SNAME,
	MAX(
		CASE CNAME
		WHEN 'JAVA' THEN
			SCORE
		END
	) JAVA,
	MAX(
		CASE CNAME
		WHEN 'mysql' THEN
			SCORE
		END
	) mysql
FROM
	stdscore
GROUP BY
	SNAME;

可以在第一個Case中加入Else語句解決這個問題:
SELECT
	SNAME,
	MAX(
		CASE CNAME
		WHEN 'JAVA' THEN
			SCORE
		ELSE
			0
		END
	) JAVA,
	MAX(
		CASE CNAME
		WHEN 'mysql' THEN
			SCORE
		ELSE
			0
		END
	) mysql
FROM
	stdscore
GROUP BY
	SNAME;
方法二:
SELECT DISTINCT  a.sname,
(SELECT score FROM stdscore b WHERE a.sname=b.sname AND b.CNAME='JAVA' ) AS 'JAVA',
(SELECT score FROM stdscore b WHERE a.sname=b.sname AND b.CNAME='mysql' ) AS 'mysql'
FROM stdscore a

方法三:
DROP PROCEDURE
IF EXISTS sp_score;
DELIMITER &&

CREATE PROCEDURE sp_score ()
BEGIN
	#課程名稱
	DECLARE
		cname_n VARCHAR (20) ; #所有課程數量
		DECLARE
			count INT ; #計數器
			DECLARE
				i INT DEFAULT 0 ; #拼接SQL字串
			SET @s = 'SELECT sname' ;
			SET count = (
				SELECT
					COUNT(DISTINCT cname)
				FROM
					stdscore
			) ;
			WHILE i < count DO


			SET cname_n = (
				SELECT
					cname
				FROM
					stdscore
				GROUP BY CNAME 
				LIMIT i,
				1
			) ;
			SET @s = CONCAT(
				@s,
				', SUM(CASE cname WHEN ',
				'\'',
				cname_n,
				'\'',
				' THEN score ELSE 0 END)',
				' AS ',
				'\'',
				cname_n,
				'\''
			) ;
			SET i = i + 1 ;
			END
			WHILE ;
			SET @s = CONCAT(
				@s,
				' FROM stdscore GROUP BY sname'
			) ; #用於除錯
			#SELECT @s;
			PREPARE stmt
			FROM
				@s ; EXECUTE stmt ;
			END&&

CALL sp_score () ;

處理後的結果(行轉列)分級輸出:



方法一:

這裡可以使用Max,也可以使用Sum;

注意第二張圖,當有學生的某科成績缺失的時候,輸出結果為Null; 

SELECT
	SNAME,
	MAX(
		CASE CNAME
		WHEN 'JAVA' THEN
			(
				CASE
				WHEN SCORE - (select avg(SCORE) from stdscore where CNAME='JAVA') > 20 THEN
					'優秀'
				WHEN SCORE - (select avg(SCORE) from stdscore where CNAME='JAVA') > 10 THEN
					'良好'
				WHEN SCORE - (select avg(SCORE) from stdscore where CNAME='JAVA') >= 0 THEN
					'普通'
				ELSE
					'較差'
				END
			)
		END
	) JAVA,
	MAX(
		CASE CNAME
		WHEN 'mysql' THEN
			(
				CASE
				WHEN SCORE - (select avg(SCORE) from stdscore where CNAME='JAVA') > 20 THEN
					'優秀'
				WHEN SCORE - (select avg(SCORE) from stdscore where CNAME='JAVA') > 10 THEN
					'良好'
				WHEN SCORE - (select avg(SCORE) from stdscore where CNAME='JAVA') >= 0 THEN
					'普通'
				ELSE
					'較差'
				END
			)
		END
	) mysql
FROM
	stdscore
GROUP BY
	SNAME;


方法二:
SELECT DISTINCT  a.sname,
(SELECT (
				CASE
				WHEN SCORE - (select avg(SCORE) from stdscore where CNAME='JAVA') > 20 THEN
					'優秀'
				WHEN SCORE - (select avg(SCORE) from stdscore where CNAME='JAVA') > 10 THEN
					'良好'
				WHEN SCORE - (select avg(SCORE) from stdscore where CNAME='JAVA') >= 0 THEN
					'普通'
				ELSE
					'較差'
				END
			) FROM stdscore b WHERE a.sname=b.sname AND b.CNAME='JAVA' ) AS 'JAVA',
(SELECT (
				CASE
				WHEN SCORE - (select avg(SCORE) from stdscore where CNAME='JAVA') > 20 THEN
					'優秀'
				WHEN SCORE - (select avg(SCORE) from stdscore where CNAME='JAVA') > 10 THEN
					'良好'
				WHEN SCORE - (select avg(SCORE) from stdscore where CNAME='JAVA') >= 0 THEN
					'普通'
				ELSE
					'較差'
				END
			) FROM stdscore b WHERE a.sname=b.sname AND b.CNAME='mysql' ) AS 'mysql'
FROM stdscore a

方法三:
DROP PROCEDURE
IF EXISTS sp_score;
DELIMITER &&

CREATE PROCEDURE sp_score ()
BEGIN
	#課程名稱
	DECLARE
		cname_n VARCHAR (20) ; #所有課程數量
		DECLARE
			count INT ; #計數器
			DECLARE
				i INT DEFAULT 0 ; #拼接SQL字串
			SET @s = 'SELECT sname' ;
			SET count = (
				SELECT
					COUNT(DISTINCT cname)
				FROM
					stdscore
			) ;
			WHILE i < count DO


			SET cname_n = (
				SELECT
					cname
				FROM
					stdscore
        GROUP BY CNAME 
				LIMIT i, 1
			) ;
			SET @s = CONCAT(
				@s,
				', MAX(CASE cname WHEN ',
				'\'',
				cname_n,
				'\'',
				' THEN (
				CASE
				WHEN SCORE - (select avg(SCORE) from stdscore where CNAME=\'',cname_n,'\') > 20 THEN
					\'優秀\'
				WHEN SCORE - (select avg(SCORE) from stdscore where CNAME=\'',cname_n,'\') > 10 THEN
					\'良好\'
				WHEN SCORE - (select avg(SCORE) from stdscore where CNAME=\'',cname_n,'\') >= 0 THEN
					\'普通\'
				ELSE
					\'較差\'
				END
			) END)',
				' AS ',
				'\'',
				cname_n,
				'\''
			) ;
			SET i = i + 1 ;
			END
			WHILE ;
			SET @s = CONCAT(
				@s,
				' FROM stdscore GROUP BY sname'
			) ; 
			#用於除錯
			#SELECT @s;
			PREPARE stmt
			FROM
				@s ; EXECUTE stmt ;
			END&&


CALL sp_score ();

幾種方法比較分析

第一種使用了分組,對每個課程分別處理。
第二種方法使用了表連線。
第三種使用了儲存過程,實際上可以是第一種或第二種方法的動態化,先計算出所有課程的數量,然後對每個分組進行課程查詢。這種方法的一個最大的好處是當新增了一門課程時,SQL語句不需要重寫。

小結

關於行轉列和列轉行

這個概念似乎容易弄混,有人把行轉列理解為列轉行,有人把列轉行理解為行轉列;

這裡做個定義:

行轉列:把表中特定列(如本文中的:CNAME)的資料去重後做為列名(如查詢結果行中的“Java,mysql”,處理後是做為列名輸出);

列轉行:可以說是行轉列的反轉,把表中特定列(如本文處理結果中的列名“JAVA,mysql”)做為每一行資料對應列“CNAME”的值;

關於效率

不知道有什麼好的生成模擬資料的方法或工具,麻煩小夥伴推薦一下,抽空我做一下對比;

還有其它更好的方法嗎?

本文使用的幾種方法應該都有優化的空間,特別是使用儲存過程的話會更加靈活,功能更強大;

本文的分級只是給出一種思路,分級的方法如果學生的成績相差較小的話將失去意義;

如果小夥伴有更好的方法,還請不吝賜教,感激不盡!

有些需求可能不需要聯合主鍵

有些需求可能不需要聯合主鍵,因為一門課程可能允許學生考多次,取最好的一次成績,或者取多次的平均成績。

原文地址:http://blog.csdn.net/testcs_dn/article/details/49847299