資料庫優化SQL優化之SELECT優化 ——group by 優化

阿新 • • 發佈：2019-01-03

在資料庫查詢中，group by語句經常使用，而這個語句的使用是最耗效能的，按常理，

我們生活中要這樣做也很麻煩，有兩種情形：

1、有索引的情況

2、無索引的情況

對於第一種情況，如果在生活中要做這樣的事情，很惱火，我們正常的想法是，先把所有的

按高矮順序來排序，最後是一組的就直接挑出來了，但怎樣實現這個排序呢？

根據上一篇檔案排序filesort的規則，我們可以這樣，先讓區域性有序，然後在慢慢擴散

來排列整個資料，方法是：選擇適當的大小的排序塊快取大小，每次取出塊大小資料，利用

快速排序功能對該塊排序，然後存入臨時檔案，然後利用歸併排序的思想，將各個塊之間進行

排序，最終達到排序完成。

對於上面的描述，雖然排序使用了非常快的排序演算法快排和歸併排序，但這個涉及的臨時

檔案的讀取操作，浪費大量的I/O,效能上是危害很大的，因此，掌握好在使用group by的語句的

使用，儘量使用到索引，免除了排序的操作，group by的速度就上來了，並且也不會消耗太多

記憶體大小，下面敘述一下group by使用索引的原理

一、 group by 使用索引原理

1、group by 使用排序來讀取資料，所以只能用btree索引，不能使用在hash索引的演算法中

因為hash索引是一種類似鍵值對的快速訪問方式，這個對於指定某個值查詢很好，但

沒有排序的方法，其使用的hash函式 + 碰撞衝突解決方案

2、當使用索引排序來查詢資料時，不會在explain中extra列看到有using filesort

3、在group by操作完成後，還會對group出來的結果進行排序，因此如果對排序的結果

沒有排序的需求，可以考慮在其後面加上order by null

二、group by 訪問索引的方法

group by 訪問資料有兩種方法：

1、邊掃描邊執行group操作,叫做鬆散索引掃描(Loose index scan)

2、先執行一個範圍(range)掃描，然後在執行group 操作,叫做

緊索引掃描(Tight index scan)

2.1、鬆散索引掃描(Loose index scan)

最高效的處理group by的方法是，直接訪問相應的索引，所以不用排序就能根據

索引來讀取需要的資料，而對於如聚簇索引(cluster index),我們可以讀取前面的一部分

的欄位索引來獲取資料，而不用滿足所有的列，這就叫做鬆散索引掃描，我的定義可為：

字首索引掃描

使用鬆散索引掃描的條件：

1、查詢只能針對一個單表進行操作，這個可是個致命的缺點啊，但如果where

條件比較多，選出來的資料少的話，還是不用擔憂的

2、group by使用索引為：對聚簇索引使用字首索引

3、使用類似group by 的操作的函式有distinct函式，使用此函式時，要麼在一個

索引上使用，要麼在group by時，其group by的字句是索引掃描，否則會引

起全表掃描。

4、在使用group by語句中，如果使用聚合函式max(), min()等，如果列不在group

by的列中，或不在group by 列的聚簇索引的一部分，這將會用到排序操作

5、只能對整個列的值排序時使用到索引，而只有前面一部分索引不能用到排序，

如：列 c1 char(20), index(c1(10))、這個只用了一半索引，將無法使用來對

整個資料排序

假設我們在表t1(c1, c2, c3, c4)有聚簇索引index(c1, c2, c3)，能使用Loose index scan例子：

1、SELECT c1, c2 FROM t1 GROUP BY c1, c2;
2、SELECT DISTINCT c1, c2 FROM t1;
3、SELECT c1, MIN(c2) FROM t1 GROUP BY c1;
4、SELECT c1, c2 FROM t1 WHERE c1 < const GROUP BY c1, c2;
5、SELECT MAX(c3), MIN(c3), c1, c2 FROM t1 WHERE c2 > const GROUP BY c1, c2;
6、SELECT c2 FROM t1 WHERE c1 < const GROUP BY c1, c2;
7、SELECT c1, c2 FROM t1 WHERE c3 = const GROUP BY c1, c2;

原因解釋：

這些都使用了字首索引

2.2、使用緊索引掃描和鬆索引掃描類似，只是會先根據where條件來獲取所有的行，然後

根據group by的欄位來分組，這種的使用方法，一般是，where條件返回的行較少時

使用，比如，你的where字句中使用了主鍵或唯一鍵=const等，這樣的代價是，通過

where過濾出來的行很少，再分組操作時也很快的

SQL Server溫故系列(5)：SQL 查詢之分組查詢 GROUP BY

1、GROUP BY 與聚合函式 2、GROUP BY 與 HAVING 3、GROUP BY 擴充套件分組 3.1、GROUP BY ROLLUP 3.2、GROUP BY CUBE 3.3、GROUP BY GROUPING SETS 4、GROUP BY 擴充套件函式 4.1、GROUPING

資料庫優化SQL優化之SELECT優化 ——group by 優化

在資料庫查詢中，group by語句經常使用，而這個語句的使用是最耗效能的，按常理，我們生活中要這樣做也很麻煩，有兩種情形： 1、有索引的情況 2、無索引的情況對於第一種情況，如果在生活中要做這樣的事情，很惱火，我們正常的想法是，先把所有

數據庫SQL優化大總結之百萬級數據庫優化方案

存儲過程語句數字運行 eat 小型明顯 where 不能 1.對查詢進行優化，要盡量避免全表掃描，首先應考慮在 where 及 order by 涉及的列上建立索引。 2.應盡量避免在 where 子句中對字段進行 null 值判斷，否則將導致引擎放棄使用索引而

數據庫SQL優化大總結之百萬級數據庫優化方案

打開一個否則 table html 處理必須 substr ext 作者：雲霏霏網上關於SQL優化的教程很多，但是比較雜亂。近日有空整理了一下，寫出來跟大家分享一下，其中有錯誤和不足的地方，還請大家糾正補充。這篇文章我花費了大量的時間查找資料、修改、

oracle之優化一中用group by優化distinct

今天mentor給了一個sql語句優化的任務。（環境是sql developer）有一個語句執行很慢，查詢出來的結果有17544條記錄，但需970秒，速度很慢。語句是這樣的：SELECT DISTINCT 'AMEND_NEW', rep

Group by 優化

一個標準的 Group by 語句包含排序、分組、聚合函式，比如 select a,count(*) from t group by a ; 這個語句預設使用 a 進行排序。如果 a 列沒有索引，那麼就會建立臨時表來統計 a和 count(*)，然後再通過

【sql小坑】在group by裏用select字段的別名？

報錯 spl tro use tin sql 主表 enc 方法背景 -- 求每個用戶的擁有的產品數，其中userid需要簡單split出來 SELECT split (id, ‘-‘) [ 0 ] AS userid, c

VB6基本資料庫應用（三）：連線資料庫與SQL語句的Select語句初步

資料庫我們已經建好了，重提一下上一章的結果，我們最後建立了一張Student的表，其中有StudentID(數字的雙精度型別)和StudentName(文字型別。補充一下，2013中有【長文字】和【短文字】，人名不會很長，根據上一章選擇儘量小的資料型別的規則，這裡就選【短文字】就可以了)。儘

SQL筆記之SELECT語句

SELECT語句的完整語法： SELECT【ALL/DISTINCT】目標列表達式 [AS 別名]，··· --ALL不去掉重複 DISTINCT去掉重複 FROM 表名或檢視名或者（SELECT語句）AS 表名（屬性） [WHERE] 條件表示式 [GROUP BY] 列

Sql語句之select 語句檢索第二講

)檢索所有的列 SELECT * FROM 表名; 注意:檢索不需要的列通常會降低通常會降低檢索和應用程式的效能。–不建議。好處可以不指名列。 5.檢索不同的值，對列值相同的不顯示。Distinct關鍵字,distinct 必須直接放在列名的前面。 SETLCT DISTINCT 列名 FROM 表名; 注意

一個sql的四種寫法:sum...case.when、sum if、select(select..)、group by

select (select SUM(LOANEE_AMOUNT) FROM t_zg_loanee_apply a WHERE DELETE_STATUS = 0 ) as 'JE', (select SUM(LOANEE_AMOUNT) FROM t_zg_loanee_apply a WH

資料庫（SQL）之trigger（觸發器）的使用以及檢視（view）的基本實現

對於觸發器，首先需要明確的是一下幾點： trigger_name 必須給觸發器命令，最多64個字元，建議用表的名字_觸發器型別的縮寫方法命名。如ttlsa_posts_bi(表ttlsa_pos

神奇的 SQL 之層級 → 為什麼 GROUP BY 之後不能直接引用原表中的列

前言　　開心一刻感覺不妙呀，弟弟舔它！不該舔的，舔到懷疑人生了...... GROUP BY 後 SELECT 列的限制　　標準 SQL 規定，在對錶進行聚合查詢的時候，只能在 SELECT 子句中寫下面 3 種內容：通過 GROUP BY 子句指定的聚合鍵、聚合函式（SUM 、AVG 等

sql語句之多個ORDER BY

一.ORDER BY語句 Ⅰ.DESC逆序 ORDER BY 語句用於根據指定的列對結果集進行排序。 ORDER BY 語句預設按照升序對記錄進行排序。如果您希望按照降序對記錄進行排序，可以使用 DESC 關鍵字。以逆字母順序顯示公司名稱： SELEC

sql的分組統計與group by 日期的處理

近幾天補oracle的sql知識，這塊記錄下sql的分組統計 1.簡單的分組統計建立STUDENT表： CREATE TABLE STUDENT( "NAME" VARCHAR2(10 BYTE), "MAJOR" VARCHAR2(10 BYTE),

LINQ體驗(6)——LINQ to SQL語句之Join和Order By

Join操作適用場景：在我們表關係中有一對一關係，一對多關係，多對多關係等。對各個表之間的關係，就用這些實現對多個表的操作。說明：在Join操作中，分別為Join(Join查詢), SelectMany(Select一對多選擇)和GroupJoin(分組Join查詢)。該

SQL系列四——分組（group by和having）

首先，建立資料表如下： 1、資料分組（GROUP BY)： SQL中資料可以按列名分組，搭配聚合函式十分實用。例，統計每個班的人數: SELECT student_class,COUNT(ALL student_name) AS 總人數 FROM t_stud

資料庫優化SQL優化之SELECT優化 ——JOIN和LEFT JOIN 和 RIGHT JOIN

在資料庫的應用中，我們經常需要對多表進行連表操作來獲得關係型的資料，因此，應該更加的掌握好 SQL語句的join原理，因為，可以稍一不慎，可能一個不好的join導致資料庫的全表掃描，查詢出大量的無用的資訊，並且對資料庫效能影響極大。資

3.SQL優化之SELECT語句

介紹資料庫應用程式的核心邏輯是通過SQL語句執行的，無論是直接通過直譯器發出還是通過API在幕後提交。所以優化SQL語句是優化資料庫的重中之重。 1 優化SELECT語句 SELECT調優不光適用於以SELECT開始的SQL語句，也適用於DELETE語句中的CREATE TAB

資料庫SQL優化大總結之百萬級資料庫面試優化方案

網上關於SQL優化的教程很多，但是比較雜亂。近日有空整理了一下，寫出來跟大家分享一下，其中有錯誤和不足的地方，還請大家糾正補充。這篇文章我花費了大量的時間查詢資料、修改、排版，希望大家閱讀之後，感覺好的話推薦給更多的人，讓更多的人看到、糾正以及補充。一、百萬級資料庫優化

資料庫優化SQL優化之SELECT優化 ——group by 優化

相關推薦