CMU15445 Lecture 2 Advanced SQL

阿新 • • 發佈：2022-02-19

本節介紹SQL的高階用法

關係型語言

當用戶使用宣告式語言，他只需要說明他所需要的結果。DBMS會優化產生結果的過程。

Relational algebra是基於集合(無序，不可重複)，而SQL是基於揹包(無序，可重複)

SQL歷史

SQL來源於IBM的System R專案。其主要由三種命令組成：

DML(Data Manipulation Language),SELECT, INSERT, UPDATE 和 DELETE等語句
DDL(Data Definition Language),對於表，索引，檢視，或其它物件的Schema的定義，就是建表，建索引的語句之類的
DCL(Data Control Language),許可權控制，訪問控制

當然還有一些操作，諸如view的定義，完整性或引用約束，事務的開啟與關閉等

SQL的一些高階語法

展示語法所用的資料庫例項：

CREATE TABLE student (
sid INT PRIMARY KEY,
name VARCHAR(16),
login VARCHAR(32) UNIQUE,
age SMALLINT,
gpa FLOAT
);
CREATE TABLE course (
cid VARCHAR(32) PRIMARY KEY,
name VARCHAR(32) NOT NULL
);
CREATE TABLE enrolled (
sid INT REFERENCES student (sid),
cid VARCHAR(32) REFERENCES course (cid),
grade CHAR(1)
);

Aggreates

MAX(col)，返回一列中值的最大值
MIN(col)，返回一列中值的最小值
AVG(col)，返回一列中值的平均值
SUM(col)，返回一列中值的和
COUNT(col),用於返回一列中值的#

如果想在student表中查詢有著以'@cs'結尾的login的學生的數量可以這樣寫(有三種方式)

SELECT COUNT(*) FROM student WHERE login LIKE '%@cs';
SELECT COUNT(login) FROM student WHERE login LIKE '%@cs';
SELECT COUNT(1) FROM student WHERE login LIKE '%@cs';

也可以在一條SELECT語句中使用多個aggregates函式

SELECT AVG(gpa), COUNT(sid)
FROM student WHERE login LIKE '%@cs';

一些aggreagate函式支援DISTINCT關鍵字

SELECT COUNT(DISTINCT login)
FROM student WHERE login LIKE '%@cs';

輸出相對於一個aggregate的其他列，會出錯,該語句中e.cid是未定義的

SELECT AVG(s.gpa), e.cid
FROM enrolled AS e, student AS s
WHERE e.sid = s.sid;

這個時候需要用到group by命令，

SELECT AVG(s.gpa), e.cid
FROM enrolled AS e, student AS s
WHERE e.sid = s.sid
GROUP BY e.cid;

如此一來就可以正確的顯示了，將tuples按照group by劃分為子集，再對子集做aggregate

另外，可以使用HAVING子句對aggregation之後的結果做過濾，HAVIN就像是GROUP BY的WHERE子句

SELECT AVG(s.gpa) AS avg_gpa, e.cid
FROM enrolled AS e, student AS s
WHERE e.sid = s.sid
GROUP BY e.cid
HAVING avg_gpa > 3.9;

字串操作

雖然MYSQL對於字母大小寫不敏感，並且使用雙引號與單引號皆可，但其他SQL不是這樣的

模式匹配：

"%"匹配任何的子串（包括空串）
"_"匹配任意一個字元
字串連線：
"||"用來連線兩個字串

輸出重定向

除了將查詢結果顯示到終端，可以將結果放一個新的表中，可以用如下語句：

新建表：

SELECT DISTINCT cid INTO CourseIds FROM enrolled;

對於已經存在的表，可以將SELECT插入到資料庫中已經存在的表中，SELECT的查詢結果必須與表的列的數量與屬性的型別一致，但是列名可以不一樣：

INSERT INTO CourseIds (SELECT DISTINCT cid FROM enrolled);

輸出控制

可以用ORDER BY對SQL的結果進行排序，可以用謂詞ASC與DESC與屬性去對結果做想要的排序

SELECT sid FROM enrolled WHERE cid = '15-721' ORDER BY grade DESC;
SELECT sid FROM enrolled WHERE cid = '15-721' ORDER BY grade DESC, sid ASC;
SELECT sid FROM enrolled WHERE cid = '15-721' ORDER BY UPPER(grade) DESC, sid + 1 ASC;

可以用LIMIT子句限定查詢結果的tuple的數量

SELECT sid, name FROM student WHERE login LIKE '%@cs'
LIMIT 10;

也可以提供一個位移來到達獲取一個範圍的結果

SELECT sid, name FROM student WHERE login LIKE '%@cs' LIMIT 10 OFFSET 20;

如果不使用ORDER BY,那麼使用LIMIT每次返回的結果可能不同

內嵌查詢

inner queries和out queries組成一個nested queries，inner queries可以引用outer queries中的內容，但反過來不行
一個例子是，獲取註冊了15-445的學生的名字

SELECT name FROM student WHERE sid IN ( SELECT sid FROM enrolled WHERE cid = '15-445' );

內嵌查詢支援的謂詞：

ALL: 所有 inner queries 返回的記錄都必須滿足條件
ANY：任意 inner queries 返回的記錄滿足條件即可
IN：與 = ANY() 等價
EXISTS：inner queries 返回的表不為空
ANY的用法，獲取註冊了15-445的學生的名字

SELECT name FROM student
 WHERE sid = ANY (
   SELECT sid FROM enrolled
    WHERE cid = '15-445'
 )

ALL，IN的用法，找到至少參與一門課程的所有學生中，id 最大的

SELECT sid, name FROM student
 WHERE sid >= ALL (
   SELECT sid FROM enrolled
 );

SELECT sid, name FROM student
 WHERE sid IN (
   SELECT MAX(sid) FROM enrolled
 );

SELECT sid, name FROM student
 WHERE sid IN (
   SELECT sid FROM enrolled
    ORDER BY sid DESC LIMIT 1
 );

NOT 的用法

SELECT * FROM course
 WHERE NOT EXISTS (
   SELECT * FROM enrolled
    WHERE course.cid = enrolled.cid
 );

nested queries 比較難被優化（具體原因暫不知道）

DATA/TIME OPERAIONS

用來操作與修改DATA/TIME屬性，每個SQL的用法差別極大

視窗函式

類似於聚合函式，但是會保留原tuple的所有元素

Common Table Expressions(CTE)

CTE就像對於一次查詢的生成一個臨時的表，使用WITH子句來繫結一個子查詢的結果給WITH子句所給定的名字

關於遞迴CTE，可以檢視這篇文章

參考

note2

CMU15445 Lecture 2 Advanced SQL

本節介紹SQL的高階用法關係型語言當用戶使用宣告式語言，他只需要說明他所需要的結果。DBMS會優化產生結果的過程。

資料庫工程師下午試題2 ： SQL語句

#五大約束　　1、主鍵約束（Primay Key Coustraint）唯一性，非空性--------- primary key　　2、唯一約束（Unique Counstraint）唯一性，可以空，但只能有一個----------------------- unique　　3、檢查約束（Ch

Sqli-labs 第2關 SQL注入 Writeup

Sqli-labs 第2關 SQL注入 Writeup 關卡簡介關卡提示：GET-Error based - Intiger based 注入位置：GET

【cs231n】lecture 2 課程筆記

第二課 key： KNN，線性分類器 KNN相關 1.Nearest Neighbor 最近鄰居分類器：分訓練集和測試集

CMU15445 Lecture 12 & 13 Query Execution

Query Plan ？multiple way指的是可以按照單一tuple的粒度往上emit，或者是按照batch的tuple的粒度往上emit，或者是整個要求的資料集合的粒度往上emit

CMU15445 Lecture 17 Two-Phase Locking Concurrency Control

2PL是併發控制理論的一種實現方式 Transaction Locks 通過Lock來保證所有的execution schdule是serializable

CMU15445 Lecture 19: Multi-Version Concurrency Control

MVCC不是單純的用來實現併發控制，一般是用來與2PL，OCC，T/O結合使用 Multi-Version Concurrency Control

CMU15445 Lecture 23 Distributed OLTP Databases

OLTP vs. OLAP OLTP txn的讀寫時間短給系統留下的影響小重複性的操作 OLAP txn主要是read，且時間長

CMU15445 Lecture 23 Distributed OLTP Database Systems

Decision Support Systems(OLAP database的別名) OLTP獲取資料，ELT將OLTP的資料Extract，Transform，Load合併成一個統一的模式，傳給OLAP

【重溫msql】2、一條 sql 在 MySQL 中是如何執行的？

我們的程式通過連線池向 MySQL 傳送了一條sql語句，MySQL 就按照要求給我們返回了正確的結果，有時我們不免好奇，這個過程中究竟發生了什麼？它是如何工作的？有什麼方法可以加速我們的查詢？需要解答這些疑問，首先

SQL注入的2個小Trick及示例總結

前言最近發現了兩個關於sql注入的小trick,分享一下.下面話不多說了，來一起看看詳細的介紹吧

我是如何用2個Unix命令給MariaDB SQL提速的

譯者 | 薛命燈我試圖在 MariaDB（MySQL）上執行一個簡單的連線查詢，但效能簡直糟糕透了。下面將介紹我是如何通過兩個簡單的 Unix 命令，將查詢時間從 380 小時降到 12 小時以下的。

30 SQL 事務2

1. 前言在上一小節中，我們介紹了事務的概念和基本使用，探討了事務的四大特性，本小節我們將更加深入的學習事務。

28 SQL 子查詢2

1. 前言在上一小節中，我們一起學習了 SQL 子查詢的語法，並介紹了 SQL 子查詢是如何在 Insert、Select、Update 和 Delete 中使用的。

04 SQL Create 2

1. 前言在上一節中，我們一起學習了 SQL Create 和資料型別，本小節將站在SQL約束的角度上進一步的探討 Create 。

Advanced Installer15.2 安裝包的製作案例--------打包Winform安裝程式以及建立桌面快捷方式和選單程式以及設定解除安裝和開機啟動以及安裝必備元件

1、新建解決方案，命名QingLong 2、新增Windows窗體應用(.NET Framework)，命名TestWinForm.該窗體僅用於測試使打包使用，實際專案中可根據自己的需要新建對應的專案

ORACLE 11.2 效能調優之01(11GR2 Advanced Compress之OLTP Table Compress)

1.準備測試的表空間 #用於非壓縮表 create tablespace no_compress datafile \'/u02/oradata/DB112/no_compress1.dbf\' size 8M AUTOEXTEND ON NEXT 8M MAXSIZE UNLIMITED,

檢視ef core 3.1/3.0/2.1.2生成的sql語句

對於EFCore 3.1 using System.Linq; using System.Reflection; using System.Collections.Generic; using Microsoft.EntityFrameworkCore.Query.SqlExpressions;

2. EF Core 如何顯示執行的SQL語句

除錯的時候需要檢視執行的SQL 語句，我一般是使用SQL Profiler,當然還有另外一種方式，就是配置EF 日誌，這兩種方式都比較簡單實用，SQL Profiler可以過濾掉很多自己不想看的日誌，可以只看某一個IP的日誌，而EF C

Spark SQL(5-2) CacheManage之InMemoryRelation

Spark SQL(5-2) CacheManage之InMemoryRelation 本來計劃中是沒有這節的，但是中午在看spark sql 記憶體管理模組的時候，腦子裡面突然問到，spark sql 快取到記憶體的資料是怎麼組織的；上網查了下部落格；然後自己也

CMU15445 Lecture 2 Advanced SQL

關係型語言

SQL歷史

SQL的一些高階語法

Aggreates

字串操作

輸出重定向

輸出控制

內嵌查詢

DATA/TIME OPERAIONS

視窗函式

Common Table Expressions(CTE)

參考

相關推薦