sql優化（三）--索引設計的原則

阿新 • • 發佈：2018-11-03

---

title: 不懂SQL優化？那你就OUT了(三) 

-- 索引(二)

-- 索引的設計原則

date: 2018-11-03

categories: 資料庫優化

---

上一遍部落格我們主要介紹了什麼是索引，為什麼要使用索引，索引的好處和如何建立索引，這一篇我們將討論一下應該如何合理的建立索引。

增加索引有如此多的優點，為什麼不對錶中的每一個列建立一個索引呢？這種想法固然有其合理性，然而也有其片面性。

雖然，索引有許多優點，但是，為表中的每一個列都增加索引，是非常不明智的。

這是因為，增加索引也有許多不利的方面。

索引有哪些“副作用”?

1. 建立索引和維護索引要耗費時間，這種時間隨著資料量的增加而增加。 

2. 索引需要佔物理空間，除了資料表佔資料空間之外，每一個索引還要佔一定的物理空間，

3. 當對錶中的資料進行增加、刪除和修改的時候，索引也要動態的維護，這樣就降低了資料的維護速度。

應該在這些列上建立索引

1.在經常需要搜尋的列上,可以加快搜索的速度； 

2.在作為主鍵的列上.

3.在經常用在連線的列上,這些列主要是一些外來鍵,可以加快連線的速度； 

4.在經常需要根據範圍進行搜尋的列上建立索引,因為索引已經排序,其指定的範圍是連續的； 

5.在經常需要order by,group by,distinct 列上建立索引,這樣查詢可以利用索引的排序,加快排序查詢時間； 6.在經常使用在WHERE子句中的列上面建立索引,加快條件的判斷速度。

不應該建立索引的列具有下列特點

1.對於那些在查詢中很少使用的列不應該建立索引。

原因：

既然這些列很少使用到,因此有索引或無索引,並不能提高查詢速度。相反，由於增加了索引,反而降低了系統的維護速度和增大了空間需求。 

2. 對於那些只有很少資料值的列也不應該增加索引

原因：

由於這些列的取值很少, 例如:學生表的性別列，在查詢的結果中，結果集的資料行佔了表中資料行的很大比例,即需要在表中搜索的資料行的比例很大。增加索引，並不能明顯加快檢索速度。 

3.對於那些定義為text, blob資料型別的列不應該增加索引。

原因：

這些列的資料量要麼相當大,要麼取值很少。 

4.當修改效能遠遠大於檢索效能時，不應該建立索引。

原因：

修改效能和檢索效能是互相矛盾的。當增加索引時,會提高檢索效能,但是會降低修改效能。當減少索引時,會提高修改效能,降低檢索效能。因此當修改效能遠遠大於檢索效能時不應該建立索引。

5.單表資料太少，不適合建索引

案列（程式碼）

示例程式碼：（無索引的表）

CREATE TABLE t_customer_one(

  customerId INT PRIMARY KEY AUTO_INCREMENT, -- 編號 customerName VARCHAR(20), -- 姓名 customerAge INT, -- 年齡 customerGender CHAR(3), -- 性別 customerPhone VARCHAR(29), -- 聯絡方式 customerEmail VARCHAR(30), -- 電子郵件 province VARCHAR(20), -- 所在省份 city VARCHAR(30), -- 所在城市 address VARCHAR(200) -- 詳細地址 );

新增的資料：

共 16777216 條資料

INSERT INTO t_customer_one(customerName,customerAge,customerGender,customerPhone,customerEmail,province,city,address) VALUES('張三',18,'女','15767678798','[email protected]','四川','成都','武侯區科華北路88號'); INSERT INTO t_customer_one(customerName,customerAge,customerGender,customerPhone,customerEmail,province,city,address) VALUES('李四',24,'男','18767689798','[email protected]','廣東','廣州','白雲區天明路188號'); INSERT INTO t_customer_one(customerName,customerAge,customerGender,customerPhone,customerEmail,province,city,address) VALUES('王五',23,'女','17167675698','[email protected]' , '四川','成都','武侯區科華北路85號'); INSERT INTO t_customer_one(customerName,customerAge,customerGender,customerPhone,customerEmail,province,city,address) VALUES('趙六',26,'男','13767659697','[email protected]', '廣東','廣州','白雲區天明路180號'); INSERT INTO t_customer_one(customerName,customerAge,customerGender,customerPhone,customerEmail,province,city,address) SELECT customerName,customerAge,customerGender,customerPhone,customerEmail,province,city,address FROM t_customer_one;

新增資料需要時間：大約 8 分鐘左右

示例程式碼:(帶索引的表)

 CREATE TABLE t_customer_two(

  customerId INT PRIMARY KEY AUTO_INCREMENT,  -- 編號
  customerName VARCHAR(20), -- 姓名
  customerAge INT, -- 年齡
  customerGender CHAR(3), -- 性別 customerPhone VARCHAR(29), -- 聯絡方式 customerEmail VARCHAR(30), -- 電子郵件 province VARCHAR(20), -- 所在省份 city VARCHAR(30), -- 所在城市 address VARCHAR(200) -- 詳細地址 )

為表2新增索引

-- 單列索引

ALTER TABLE t_customer_two ADD INDEX idx_name(customerName); ALTER TABLE t_customer_two ADD INDEX idx_age (customerAge); ALTER TABLE t_customer_two ADD INDEX idx_phone(customerPhone); -- 多列索引（聯合索引） CREATE INDEX idx_province_city_address ON t_customer_two(province,city,address);

新增資料（從表1複製資料）：

INSERT INTO t_customer_two(customerName,customerAge,customerGender,customerPhone,customerEmail,province,city,address) 
             SELECT customerName,customerAge,customerGender,customerPhone,customerEmail,province,city,address FROM t_customer_one;

新增資料需要時間：大約 18分鐘

測試

單列索引

案例

*** 查詢年齡在18歲--23歲的客戶的總人數**

無索引：

查詢所用時間：19.75 秒

檢視之執行計劃： type=all 進行全表掃描

有索引：

查詢所用時間：5.42 秒

檢視之執行計劃： type=range,並使用了索引idx_age.

說明：應該在在經常需要根據範圍進行搜尋的列上建立索引

多列索引

如果有一個頁面中有一個搜尋部分會根據輸入的省份,城市,詳細地址來搜尋客戶的詳細記錄

那麼這個時候到底給那一個列加索引比較好？

此時就可以使用多列索引

如果使用多列索引，where條件中欄位的順序非常重要，需要滿足最左字首列

最左字首： 查詢條件中的所有欄位需要從最左邊列起按順序出現在多列索引中,
         查詢條件的欄位數要 小於,等於多列索引的欄位數,
         中間欄位不能存在範圍查詢的欄位 (如<,like等),這樣的sql語句可以使用該多列索引。

什麼意思？

例如：

select * from  t_customer_two Where province=‘xxx’ and city=‘xxxxx’ and address=‘XXX’ -- （多列索引有效）

select * from  t_customer_two Where province=‘xxx’ and city=‘XXX’ -- （多列索引有效）

select * from  t_customer_two Where province=‘xxx’ -- （多列索引有效）

select * from  t_customer_two Where  city=‘xxxxx’ and address=‘XXX’ -- （多列索引無效，無最左邊的province列）

select * from  t_customer_two Where and address=‘XXX’ -- （多列索引無效）

使用了索引:

未使用索引:

mysql多列索引適合的場景

1. 匹配全值,對索引中的所有列都指定具體的值（例如： province=‘xxx’ and city=‘xxx’ and address=‘xxx’） 

2. 匹配最左字首（例如： province=‘xxx’, 使用索引中的第一列） 

3. 匹配部分最左字首（例如： province=‘xxx’ and city=‘xxx’） 4. 匹配第一列範圍查詢(可用like a%,但不能使用 like %b 或則 like %b%)

在以下幾種情況下,mysql在查詢中即使有索引也不會去使用

1. 在多列索引，查詢條件中用的不是最左邊的列，那麼此時是不會使用索引。

2. like查詢時 % 出現在第一位也不會使用索引。

3. 條件中有 or 也不會使用索引。

4. 如果 mysql 估計使用全表掃描比使用索引快，它也不會使用索引。

sql優化（三）--索引設計的原則

--- title: 不懂SQL優化？那你就OUT了(三) -- 索引(二) -- 索引的設計原則 date: 2018-11-03 categories: 資料庫優化 --- 上一遍部落格我們主要介紹了什麼是索引，為什麼要使用索引，索引的好處和如何建立索

sql優化（二）---- 索引(一)

組合 name 索引 pre 語法時間 RoCE 搜索功能 jpg --- title: 不懂SQL優化？那你就OUT了(二) -- 索引(一) date: 2018-10-27 categories: 數據庫優化 --- 要想讓一個較慢的select ...

SQL優化（五）索引長度

在SQL執行計劃中，key_len 表示索引長度，經常用於判斷複合索引是否被完全使用。先說結論：在utf8編碼方式下，一個字元佔3個位元組。如果索引欄位可以為null，MySQL會使用1個位元組標識。如果索引欄位的型別長度可變，MySQL會使用2個位元組標

【MySQL】基於MySQL的SQL優化（三）——對子查詢進行優化

通常情況下，需要把子查詢優化成JOIN查詢。這是一個實現查詢演員名為“sandra”的表演影片片名的SQL，通過EXPLAIN關鍵字進行解析，這個查詢中包含三個子查詢，並且出現

【MySql】Sql優化（三）——效能優化

一、前言當資料庫資料達到一定數量的時候，結合資料庫連線池Druid的視覺化監控介面，對系統中執行的sql語句進行檢測，對使用頻繁、執行時間長的sql語句進行優化。二、優化方案原則 [原則一:選擇需要優化的SQL] 1,選擇需要優化

MySQL優化系列（三）--索引的使用、原理和設計優化

之前的文章一直在規避索引的建立去優化資料庫，不是不想講，而是這個太重要，必須抽出來講。今天我們就來研究下資料庫索引的設計與優化（MySQL為例）。文章結構：（1）索引的概述和使用；（2）索引的基本原理；（3）索引分類；（4）索引設計優化

sql優化（oracle）- 第三部分 sql優化總結

mit 設計 tinc 重復 tin spa 替代嵌套多個第三部分 sql優化總結 1. 優化一般原則 2. 具體註意事項 1. SQL優化一般性原則　　1）目標：減少服務器資源消耗（主要是磁盤IO）　　2）設計：　　　　1. 盡量依

MySQL優化（三）表的設計

1、什麼樣的表才符合3正規化（3 NF）？表的正規化，是首先符合1正規化，才能滿足2正規化，進一步才能滿足3正規化；（現在最高級別是6正規化）第一正規化：1NF 是對屬性的原子性約束，要求表的屬性（列）具有原子性，不可再分解；（只要是關係型資料庫[mysql/oracle/db2/sql server

mysql慢查詢原因分析與解決（三）——索引及查詢優化

索引的型別 Ø 普通索引：這是最基本的索引型別，沒唯一性之類的限制。 Ø 唯一性索引：和普通索引基本相同，但所有的索引列值保持唯一性。 Ø 主鍵：主鍵是一種唯一索引，但必須指定為”PRIMARY KEY”。 Ø 全文索引：MYSQL從3.23.23開始支援全

mysql優化（三）–explain分析sql語句執行效率

mushu 釋出於 11個月前 (06-04) 分類：Mysql 閱讀(651) 評論(0) Explain命令在解決資料庫效能上是第一推薦使用命令，大部分的效能問題可以通過此命令來簡單的解決，Explain可以用來檢視SQL語句的執行效果，可以幫助選擇更好的索引和優化查詢語句，寫出

SQL使用（三）-----SQL優化總結

網上關於SQL優化的教程很多，但是比較雜亂。近日有空整理了一下，寫出來跟大家分享一下，其中有錯誤和不足的地方，還請大家糾正補充。 1.只要能滿足你的需求，應儘可能使用更小的資料型別：例如使用MEDIUMINT代替INT 2.儘量把所有的列設定為NOT

MySQL優化（三）：索引原理及索引優化

建立高效能索引索引是提高MySQL查詢效能的一個重要途徑，但過多的索引可能會導致過高的磁碟使用率以及過高的記憶體佔用，從而影響應用程式的整體效能。應當儘量避免事後才想起新增索引，因為事後可能需要監控大量的SQL才能定位到問題所在，而且新增索引的時間肯定是遠大於初始新增索引所需

MySQL 資料庫效能優化之（三）索引優化

大家都知道索引對於資料訪問的效能有非常關鍵的作用，都知道索引可以提高資料訪問效率。為什麼索引能提高資料訪問效能？他會不會有“副作用”？是不是索引建立越多，效能就越好？到底該如何設計索引，才能最大限度的發揮其效能？這篇文章主要是帶著上面這幾個問題來做一個簡要的分析，

Mysql 數據庫優化（三）——分區和分表【個人經驗】

incr 返回 for 16px 使用 tree 主鍵 ref 相同　　引：MyISAM存儲引擎的表在數據庫中，每一個表都被存放為三個以表名命名的物理文件。　　　　1、首先肯定會有任何存儲引擎都不可缺少的存放表結構定義信息的.frm文件，　　　　2、另外還有.MYD和

sql優化（oracle）- 第二部分常用sql用法和註意事項

個數 its 用法記錄減少合並 .com 語句一個第二部分常用sql用法和註意事項 1. exists 和 in 2. union 和 union all

流程中心使用詳情（三）流程設計

屬性時也所有流程設計沒有工作 font 會議紀要二次開發第4章流程使用說明以【出差申請】流程為例，講述如何通過流程中心定義一個完整的流程。 4.1 新建分類流程中心->流程設置->分類設置，新建【行政管理】分類，如下圖所示：點擊【保存】後，界

[JCIP筆記] （三）如何設計一個線程安全的對象

variable 原因事情 display LV 技術循環 reader 暴露在當我們談論線程安全時，我們在談論什麽中，我們討論了怎樣通過Java的synchronize機制去避免幾個線程同時訪問一個變量時發生問題。憂國憂民的Brian Goetz大神在多年的開發過程

Python學習：Mysql（三）索引

mit 生成 p s count between mysqld simple AS fault 1、索引索引是表的目錄，在查找內容之前可以先在目錄中查找索引位置，以此快速定位查詢數據。對於索引，會保存在額外的文件中。 2、索引種類普通索引：僅加速

mysql效能調優（三）——列選取原則

1、列型別選擇 1）整型 > data、time > char、varchar > blob 整型、date、time運算快 &nb

大資料之hbase（四） --- rowkey設計原則模擬通話日誌，BloomFilter，phonix環境部署，hive-hbase整合

一、rowkey設計 -- 模擬通話日誌 -------------------------------------------------- 1.建表 $hbase> create 'ns1:calllogs' , 'f1' 2.編寫

sql優化（三）--索引設計的原則

索引有哪些“副作用”?

應該在這些列上建立索引

不應該建立索引的列具有下列特點

案列（程式碼）

測試

單列索引

案例

多列索引

mysql多列索引適合的場景

在以下幾種情況下,mysql在查詢中即使有索引也不會去使用

相關推薦