1. 程式人生 > >Mysql之高效能的索引策略

Mysql之高效能的索引策略

 聚簇索引(Clustered Indexes)

聚簇索引保證關鍵字的值相近的元組儲存的物理位置也相同(所以字串型別不宜建立聚簇索引,特別是隨機字串,會使得系統進行大量的移動操作),且一個表只能有一個聚簇索引。因為由儲存引擎實現索引,所以,並不是所有的引擎都支援聚簇索引。目前,只有solidDB和InnoDB支援。
聚簇索引的結構大致如下:

 

 注:葉子頁面包含完整的元組,而內節點頁面僅包含索引的列(索引的列為整型)。一些DBMS允許使用者指定聚簇索引,但是MySQL的儲存引擎到目前為止都不支援。InnoDB對主鍵建立聚簇索引。如果你不指定主鍵,InnoDB會用一個具有唯一且非空值的索引來代替。如果不存在這樣的索引,InnoDB會定義一個隱藏的主鍵,然後對其建立聚簇索引。一般來說,DBMS都會以聚簇索引的形式來儲存實際的資料,它是其它二級索引的基礎。

InnoDB和MyISAM的資料佈局的比較

為了更加理解聚簇索引和非聚簇索引,或者primary索引和second索引(MyISAM不支援聚簇索引),來比較一下InnoDB和MyISAM的資料佈局,對於如下表:

CREATE TABLE layout_test (
   col1 int NOT NULL,
   col2 int NOT NULL,
   PRIMARY KEY(col1),
   KEY(col2)
);


 假設主鍵的值位於1---10,000之間,且按隨機順序插入,然後用OPTIMIZE TABLE進行優化。col2隨機賦予1---100之間的值,所以會存在許多重複的值。
 MyISAM的資料佈局

其佈局十分簡單,MyISAM按照插入的順序在磁碟上儲存資料,如下:


 注:左邊為行號(row number),從0開始。因為元組的大小固定,所以MyISAM可以很容易的從表的開始位置找到某一位元組的位置。
據些建立的primary key的索引結構大致如下:

 注:MyISAM不支援聚簇索引,索引中每一個葉子節點僅僅包含行號(row number),且葉子節點按照col1的順序儲存。
來看看col2的索引結構:

 實際上,在MyISAM中,primary key和其它索引沒有什麼區別。Primary key僅僅只是一個叫做PRIMARY的唯一,非空的索引而已。

 InnoDB的資料佈局
InnoDB按聚簇索引的形式儲存資料,所以它的資料佈局有著很大的不同。它儲存表的結構大致如下:

 注:聚簇索引中的每個葉子節點包含primary key的值,事務ID和回滾指標(rollback pointer)——用於事務和MVCC,和餘下的列(如col2)。

相對於MyISAM,二級索引與聚簇索引有很大的不同。InnoDB的二級索引的葉子包含primary key的值,而不是行指標(row pointers),這減小了移動資料或者資料頁面分裂時維護二級索引的開銷,因為InnoDB不需要更新索引的行指標。其結構大致如下:

 聚簇索引和非聚簇索引表的對比:

 


按primary key的順序插入行(InnoDB)


如果你用InnoDB,而且不需要特殊的聚簇索引,一個好的做法就是使用代理主鍵(surrogate key)——獨立於你的應用中的資料。最簡單的做法就是使用一個AUTO_INCREMENT的列,這會保證記錄按照順序插入,而且能提高使用primary key進行連線的查詢的效能。應該儘量避免隨機的聚簇主鍵,例如,字串主鍵就是一個不好的選擇,它使得插入操作變得隨機。


覆蓋索引(Covering Indexes)

如果索引包含滿足查詢的所有資料,就稱為覆蓋索引。覆蓋索引是一種非常強大的工具,能大大提高查詢效能。只需要讀取索引而不用讀取資料有以下一些優點:
(1)索引項通常比記錄要小,所以MySQL訪問更少的資料;
(2)索引都按值的大小順序儲存,相對於隨機訪問記錄,需要更少的I/O;
(3)大多資料引擎能更好的快取索引。比如MyISAM只快取索引。
(4)覆蓋索引對於InnoDB表尤其有用,因為InnoDB使用聚集索引組織資料,如果二級索引中包含查詢所需的資料,就不再需要在聚集索引中查找了。
覆蓋索引不能是任何索引,只有B-TREE索引儲存相應的值。而且不同的儲存引擎實現覆蓋索引的方式都不同,並不是所有儲存引擎都支援覆蓋索引(Memory和Falcon就不支援)。
對於索引覆蓋查詢(index-covered query),使用EXPLAIN時,可以在Extra一列中看到“Using index”。例如,在sakila的inventory表中,有一個組合索引(store_id,film_id),對於只需要訪問這兩列的查詢,MySQL就可以使用索引,如下:

mysql> EXPLAIN SELECT store_id, film_id FROM sakila.inventory\G

*************************** 1. row ***************************

           id: 1

 select_type: SIMPLE

        table: inventory

         type: index

possible_keys: NULL

          key: idx_store_id_film_id

      key_len: 3

          ref: NULL

         rows: 5007

        Extra: Using index

1 row in set (0.17 sec)

在大多數引擎中,只有當查詢語句所訪問的列是索引的一部分時,索引才會覆蓋。但是,InnoDB不限於此,InnoDB的二級索引在葉子節點中儲存了primary key的值。因此,sakila.actor表使用InnoDB,而且對於是last_name上有索引,所以,索引能覆蓋那些訪問actor_id的查詢,如:

 

mysql> EXPLAIN SELECT actor_id, last_name

    -> FROM sakila.actor WHERE last_name = 'HOPPER'\G

*************************** 1. row ***************************

           id: 1

 select_type: SIMPLE

        table: actor

         type: ref

possible_keys: idx_actor_last_name

          key: idx_actor_last_name

      key_len: 137

          ref: const

         rows: 2

        Extra: Using where; Using index

 

利用索引進行排序

MySQL中,有兩種方式生成有序結果集:一是使用filesort,二是按索引順序掃描。利用索引進行排序操作是非常快的,而且可以利用同一索引同時進行查詢和排序操作。當索引的順序與ORDER BY中的列順序相同且所有的列是同一方向(全部升序或者全部降序)時,可以使用索引來排序。如果查詢是連線多個表,僅當ORDER BY中的所有列都是第一個表的列時才會使用索引。其它情況都會使用filesort。

create table actor(

actor_id int unsigned NOT NULL AUTO_INCREMENT,

name      varchar(16) NOT NULL DEFAULT '',

password        varchar(16) NOT NULL DEFAULT '',

PRIMARY KEY(actor_id),

 KEY     (name)

) ENGINE=InnoDB

insert into actor(name,password) values('cat01','1234567');

insert into actor(name,password) values('cat02','1234567');

insert into actor(name,password) values('ddddd','1234567');

insert into actor(name,password) values('aaaaa','1234567');


mysql> explain select actor_id from actor order by actor_id \G

*************************** 1. row ***************************

           id: 1

 select_type: SIMPLE

        table: actor

         type: index

possible_keys: NULL

          key: PRIMARY

      key_len: 4

          ref: NULL

         rows: 4

        Extra: Using index

1 row in set (0.00 sec)

 

mysql> explain select actor_id from actor order by password \G

*************************** 1. row ***************************

           id: 1

 select_type: SIMPLE

        table: actor

         type: ALL

possible_keys: NULL

          key: NULL

      key_len: NULL

          ref: NULL

         rows: 4

        Extra: Using filesort

1 row in set (0.00 sec)

 

mysql> explain select actor_id from actor order by name \G

*************************** 1. row ***************************

           id: 1

 select_type: SIMPLE

        table: actor

         type: index

possible_keys: NULL

          key: name

      key_len: 18

          ref: NULL

         rows: 4

        Extra: Using index

1 row in set (0.00 sec)

 當MySQL不能使用索引進行排序時,就會利用自己的排序演算法(快速排序演算法)在記憶體(sort buffer)中對資料進行排序,如果記憶體裝載不下,它會將磁碟上的資料進行分塊,再對各個資料塊進行排序,然後將各個塊合併成有序的結果集(實際上就是外排序)。對於filesort,MySQL有兩種排序演算法。
(1)兩遍掃描演算法(Two passes)
實現方式是先將須要排序的欄位和可以直接定位到相關行資料的指標資訊取出,然後在設定的記憶體(通過引數sort_buffer_size設定)中進行排序,完成排序之後再次通過行指標資訊取出所需的Columns。
注:該演算法是4.1之前採用的演算法,它需要兩次訪問資料,尤其是第二次讀取操作會導致大量的隨機I/O操作。另一方面,記憶體開銷較小。
(3)    一次掃描演算法(single pass)
該演算法一次性將所需的Columns全部取出,在記憶體中排序後直接將結果輸出。
注:從 MySQL 4.1 版本開始使用該演算法。它減少了I/O的次數,效率較高,但是記憶體開銷也較大。如果我們將並不需要的Columns也取出來,就會極大地浪費排序過程所需要的記憶體。在 MySQL 4.1 之後的版本中,可以通過設定 max_length_for_sort_data 引數來控制 MySQL 選擇第一種排序演算法還是第二種。當取出的所有大欄位總大小大於 max_length_for_sort_data 的設定時,MySQL 就會選擇使用第一種排序演算法,反之,則會選擇第二種。為了儘可能地提高排序效能,我們自然更希望使用第二種排序演算法,所以在 Query 中僅僅取出需要的 Columns 是非常有必要的。

當對連線操作進行排序時,如果ORDER BY僅僅引用第一個表的列,MySQL對該表進行filesort操作,然後進行連線處理,此時,EXPLAIN輸出“Using filesort”;否則,MySQL必須將查詢的結果集生成一個臨時表,在連線完成之後進行filesort操作,此時,EXPLAIN輸出“Using temporary;Using filesort”。

 

索引與加鎖

索引對於InnoDB非常重要,因為它可以讓查詢鎖更少的元組。這點十分重要,因為MySQL 5.0中,InnoDB直到事務提交時才會解鎖。有兩個方面的原因:首先,即使InnoDB行級鎖的開銷非常高效,記憶體開銷也較小,但不管怎麼樣,還是存在開銷。其次,對不需要的元組的加鎖,會增加鎖的開銷,降低併發性。
InnoDB僅對需要訪問的元組加鎖,而索引能夠減少InnoDB訪問的元組數。但是,只有在儲存引擎層過濾掉那些不需要的資料才能達到這種目的。一旦索引不允許InnoDB那樣做(即達不到過濾的目的),MySQL伺服器只能對InnoDB返回的資料進行WHERE操作,此時,已經無法避免對那些元組加鎖了:InnoDB已經鎖住那些元組,伺服器無法解鎖了。
來看個例子:

create table actor(

actor_id int unsigned NOT NULL AUTO_INCREMENT,

name      varchar(16) NOT NULL DEFAULT '',

password        varchar(16) NOT NULL DEFAULT '',

PRIMARY KEY(actor_id),

 KEY     (name)

) ENGINE=InnoDB

insert into actor(name,password) values('cat01','1234567');

insert into actor(name,password) values('cat02','1234567');

insert into actor(name,password) values('ddddd','1234567');

insert into actor(name,password) values('aaaaa','1234567');

SET AUTOCOMMIT=0;

BEGIN;

SELECT actor_id FROM actor WHERE actor_id < 4

AND actor_id <> 1 FOR UPDATE;

 該查詢僅僅返回2---3的資料,實際已經對1---3的資料加上排它鎖了。InnoDB鎖住元組1是因為MySQL的查詢計劃僅使用索引進行範圍查詢(而沒有進行過濾操作,WHERE中第二個條件已經無法使用索引了):

mysql> EXPLAIN SELECT actor_id FROM test.actor

    -> WHERE actor_id < 4 AND actor_id <> 1 FOR UPDATE \G

*************************** 1. row ***************************

           id: 1

 select_type: SIMPLE

        table: actor

         type: index

possible_keys: PRIMARY

          key: PRIMARY

      key_len: 4

          ref: NULL

         rows: 4

        Extra: Using where; Using index

1 row in set (0.00 sec)

 

mysql>

 表明儲存引擎從索引的起始處開始,獲取所有的行,直到actor_id<4為假,伺服器無法告訴InnoDB去掉元組1。
為了證明row 1已經被鎖住,我們另外建一個連線,執行如下操作:

SET AUTOCOMMIT=0;

BEGIN;

SELECT actor_id FROM actor WHERE actor_id = 1 FOR UPDATE;

 

 該查詢會被掛起,直到第一個連線的事務提交釋放鎖時,才會執行(這種行為對於基於語句的複製(statement-based replication)是必要的)。
如上所示,當使用索引時,InnoDB會鎖住它不需要的元組。更糟糕的是,如果查詢不能使用索引,MySQL會進行全表掃描,並鎖住每一個元組,不管是否真正需要。

相關推薦

【七】高效能MySql筆記——高效能索引策略

    正確的索引策略對效能優化相當重要。似乎沒有什麼事情是完美的,好的索引可以提高效能,壞的索引也可以拉低效能。所以在選擇合適的索引策略應該具有通觀全域性的思維。我們應該充分了解每種索引策略,以使我們可以靈活運用、靈活選擇。    獨立的列    在MySql查詢語句中條件

Mysql高效能索引策略

 聚簇索引(Clustered Indexes) 聚簇索引保證關鍵字的值相近的元組儲存的物理位置也相同(所以字串型別不宜建立聚簇索引,特別是隨機字串,會使得系統進行大量的移動操作),且一個表只能有一個聚簇索引。因為由儲存引擎實現索引,所以,並不是所有的引擎都支援聚簇索引。目

Mysql建立高效能索引

面試真題: 簡單描述Mysql中,索引,主鍵,唯一索引,聯合索引的區別,對資料庫的效能有什麼影響? Mysql索引的基礎和型別 索引的基礎:   1.索引類似於書籍的目錄,要想找到一本書的某個特定主題,需要先查詢書的目錄,定位對應的頁碼 儲存引擎使用類似的方式進

【六】高效能MySql筆記——高效能索引型別基礎

    資料庫優化除了好的設計,還需要好的索引,而作者在工作中與團隊成員、同事、以及在面試新人的時候發現,很多朋友並沒有對索引有一個正確的認識。當問到如何優化資料庫時?得到的答案,也是大家所能想到的唯一答案就是建立索引。但當我問到如何正確建立索引時,卻都不能正確回答。我曾經在

Mysql組合索引

對於任何DBMS,索引都是進行優化的最主要的因素。對於少量的資料,沒有合適的索引影響不是很大,但是,當隨著資料量的增加,效能會急劇下降。  如果對多列進行索引(組合索引),列的順序非常重要,MySQL僅能對索引最左邊的字首進行有效的查詢。例如:  假設存在組合索引(c1,

MySQLInnoDB索引面試學習筆記

family 技術分享 ron myisam 不同 索引數據 想要 math 減少 寫在前面   想要做好後臺開發,終究是繞不過索引這一關的。先問自己一個問題,InnoDB為什麽選擇B+樹作為默認索引結構。本文主要參考MySQL索引背後的數據結構及算法原理和剖析Mysql

mysql效能優化建立高效能索引

索引對效能的優化十分重要,是對查詢優化最有效的手段。 一、索引的型別 索引是在儲存引擎層而不是服務層實現的。不同儲存引擎的索引工作方式不一樣。 1、B-Tree索引 它使用的是B-Tree資料結構來儲存資料。b-tree索引能夠加快訪問資料的速度,因為儲存引擎不在需要進行全表掃描

高效能MySQL建立高效能索引

首先我們要認識到索引的各種型別;並在認識的基礎上進行對比; B-Tree索引;     儲存引擎的不同,會用到不同的技術; MyISAM使用字首壓縮技術使得索引更小; InnoDB則按照資料格式進行儲存; MyISAM索引通過資料的物理位置引用被索引的行; InnoDB根據主鍵引用被索引的行; 對於B-

MySQL全面瓦解24:構建高效能索引策略篇)

學習如果構建高效能的索引之前,我們先來了解下之前的知識,以下兩篇是基礎原理,瞭解之後,對面後續索引構建的原則和優化方法會有更清晰的理解: MySQL全面瓦解22:索引的介紹和原理分析 MySQL全面瓦解23:MySQL索引實現和使用 我們編寫索引的目的是什麼?就是使我們的sql語句執行得更加高效,更快的獲取或

MySQL索引

var 也不能 oss 標題 數據結構 部分 normal 訪問 spa 索引(在MySQL中也叫鍵(key))是存儲引擎用於快速找到記錄的一種數據結構。 索引類型有:Normal,Unique,FullText。 索引方法有:BTREE、HASH。 我有一個user_

Mysql性能優化覆蓋索引

查找 cnblogs 都是 記錄 性能優化 nod 如果 libary 使用 因為我們大多數情況下使用的都是Innodb,所以這篇博客主要依據Innodb來講 b+樹(圖片來自網絡)

MySQL索引詳解

分布 i/o .cn 能夠 b+ images 電路 普通 磁道 這篇博客將要闡述為什麽使用b+樹作為索引,而不是b樹或者其他樹 1.什麽是b樹

day40 python MySQL【四】 索引】【視圖】【觸發器】【存儲過程】【函數】

cin 數量 存儲 自動 條件語句 ima doc 有序 lan 1.索引   索引相當於圖書的目錄,可以幫助用戶快速的找到需要的內容.   數據庫利用各種各樣的快速定位技術,能夠大大提高查詢效率。特別是當數據量非常大,查詢涉及多個表時,使用索引往往能使查詢速度加快成千上

MySQL 索引原理與慢查詢優化

英文 borde 發生 聚集 引擎 返回 位置 時間 pro 一 索引介紹 二 索引類型 三 索引分類 四 聚合索引和輔助索引 五 測試索引 六 正確使用索引 七 組合索引 八 註意事項 九 查詢計劃 十 慢日誌查詢 十一 大數據量分頁優化 1. 索引介紹

Mysql索引優化

字符 span 等於 select not clas 存儲引擎 自動 無法使用 1.如果索引了多列,要遵守最左前綴法則,指的是查詢從索引的最左前列開始並且不跳過索引中的列。 2.不在索引上做任何操作(計算、函數、(自動or手動)類型轉換),會導致索引丟失而轉向全表掃描

MySQL變量、查詢緩存和索引

total xpl select sch XP 反斜杠 指向 轉義字符 關閉 MySQL中的系統數據庫mysql數據庫:是mysql的核心數據庫,類似於sql server中的master庫,主要負責存儲數據庫的用戶、權限設置、關鍵字等mysql自己需要使用的控制和管理信息

Mysql索引介紹

isam \n 如何使用 p s 設計原則 n) 所有 順序 數據文件 定義:索引用於快速找出某個列中有一特定值的行。不使用索引,MySql必須從第一條記錄開始讀完整個表,直到找出相關的行。表越大,查詢數據所花費的時間越多。如果表中查詢的列有一個索引,Mysql能快速到達一

高性能MySQL創建高性能的索引

ext 缺點 單獨 意思 無需 數據 lob 哈希 上進 首先我們要認識到索引的各種類型;並在認識的基礎上進行對比; B-Tree索引; 存儲引擎的不同,會用到不同的技術; MyISAM使用前綴壓縮技術使得索引更小; InnoDB則按照數據格式進行存儲; My

MySQL索引復合索引有效性

dex rim reat 索引 結果 default int prim charset 首先這裏建立一張數據表,並建立符合索引( index_A,index_B,index_C) CREATE TABLE `test_index_sequence` ( `Id` int(

MySQL索引(三)

聚簇索引 聚簇索引並不是一種單獨的索引型別,而是一種資料儲存方式。具體的細節依賴於其實現方式,但InnoDB的聚簇索引實際上在同一個結構中儲存了B-Tree索引和資料行。當表有聚簇索引時,它的資料行實際上存放在索引的葉子頁(leaf page)中。術語“聚簇”表示資料行和相鄰的鍵值緊湊地儲存在一起。因為無法