1. 程式人生 > >MySQL 索引及其用法

MySQL 索引及其用法

一.索引的作用

       一般的應用系統,讀寫比例在10:1左右,而且插入操作和一般的更新操作很少出現效能問題,遇到最多的,也是最容易出問題的,還是一些複雜的查詢操作,所以查詢語句的優化顯然是重中之重。

       在資料量和訪問量不大的情況下,mysql訪問是非常快的,是否加索引對訪問影響不大。但是當資料量和訪問量劇增的時候,就會發現mysql變慢,甚至down掉,這就必須要考慮優化sql了,給資料庫建立正確合理的索引,是mysql優化的一個重要手段。  

       索引的目的在於提高查詢效率,可以類比字典,如果要查“mysql”這個單詞,我們肯定需要定位到m字母,然後從下往下找到y字母,再找到剩下的sql。如果沒有索引,那麼你可能需要把所有單詞看一遍才能找到你想要的。除了詞典,生活中隨處可見索引的例子,如火車站的車次表、圖書的目錄等。它們的原理都是一樣的,通過不斷的縮小想要獲得資料的範圍來篩選出最終想要的結果,同時把隨機的事件變成順序的事件,也就是我們總是通過同一種查詢方式來鎖定資料。

       在建立索引時,需要考慮哪些列會用於 SQL 查詢,然後為這些列建立一個或多個索引。事實上,索引也是一種表,儲存著主鍵或索引欄位,以及一個能將每個記錄指向實際表的指標。資料庫使用者是看不到索引的,它們只是用來加速查詢的。資料庫搜尋引擎使用索引來快速定位記錄。

      INSERT 與 UPDATE 語句在擁有索引的表中執行會花費更多的時間,而SELECT 語句卻會執行得更快。這是因為,在進行插入或更新時,資料庫也需要插入或更新索引值。

二.索引的建立、刪除

     索引的型別:

  • UNIQUE(唯一索引):不可以出現相同的值,可以有NULL值
  • INDEX(普通索引):允許出現相同的索引內容
  • PROMARY KEY(主鍵索引):不允許出現相同的值
  • fulltext index(全文索引):可以針對值中的某個單詞,但效率確實不敢恭維
  • 組合索引:實質上是將多個欄位建到一個索引裡,列值的組合必須唯一

(1)使用ALTER TABLE語句建立索性

        應用於表建立完畢之後再新增。

ALTER TABLE 表名 ADD 索引型別 (unique,primary key,fulltext,index)[索引名](欄位名)
//普通索引
alter table table_name add index index_name (column_list) ;
//唯一索引
alter table table_name add unique (column_list) ;
//主鍵索引
alter table table_name add primary key (column_list) ;

  ALTER TABLE可用於建立普通索引、UNIQUE索引和PRIMARY KEY索引3種索引格式,table_name是要增加索引的表名,column_list指出對哪些列進行索引,多列時各列之間用逗號分隔。索引名index_name可選,預設時,MySQL將根據第一個索引列賦一個名稱。另外,ALTER TABLE允許在單個語句中更改多個表,因此可以同時建立多個索引。

(2)使用CREATE INDEX語句對錶增加索引

       CREATE INDEX可用於對錶增加普通索引或UNIQUE索引,可用於建表時建立索引。

CREATE INDEX index_name ON table_name(username(length)); 

  如果是CHAR,VARCHAR型別,length可以小於欄位實際長度;如果是BLOB和TEXT型別,必須指定 length。

//create只能新增這兩種索引;
CREATE INDEX index_name ON table_name (column_list)
CREATE UNIQUE INDEX index_name ON table_name (column_list)

  table_name、index_name和column_list具有與ALTER TABLE語句中相同的含義,索引名不可選。另外,不能用CREATE INDEX語句建立PRIMARY KEY索引

(3)刪除索引

     刪除索引可以使用ALTER TABLE或DROP INDEX語句來實現。DROP INDEX可以在ALTER TABLE內部作為一條語句處理,其格式如下:

drop index index_name on table_name ;

alter table table_name drop index index_name ;

alter table table_name drop primary key ;

  其中,在前面的兩條語句中,都刪除了table_name中的索引index_name。而在最後一條語句中,只在刪除PRIMARY KEY索引中使用,因為一個表只可能有一個PRIMARY KEY索引,因此不需要指定索引名。如果沒有建立PRIMARY KEY索引,但表具有一個或多個UNIQUE索引,則MySQL將刪除第一個UNIQUE索引。

      如果從表中刪除某列,則索引會受影響。對於多列組合的索引,如果刪除其中的某列,則該列也會從索引中刪除。如果刪除組成索引的所有列,則整個索引將被刪除。

(4) 組合索引與字首索引

        在這裡要指出,組合索引和字首索引是對建立索引技巧的一種稱呼,並不是索引的型別。為了更好的表述清楚,建立一個demo表如下。

複製程式碼 複製程式碼
create table USER_DEMO
(
   ID                   int not null auto_increment comment '主鍵',
   LOGIN_NAME           varchar(100) not null comment '登入名',
   PASSWORD             varchar(100) not null comment '密碼',
   CITY                 varchar(30) not null comment '城市',
   AGE                  int not null comment '年齡',
   SEX                  int not null comment '性別(0:女 1:男)',
   primary key (ID)
);
複製程式碼 複製程式碼

  為了進一步榨取mysql的效率,就可以考慮建立組合索引,即將LOGIN_NAME,CITY,AGE建到一個索引裡:

ALTER TABLE USER_DEMO ADD INDEX name_city_age (LOGIN_NAME(16),CITY,AGE); 

   建表時,LOGIN_NAME長度為100,這裡用16,是因為一般情況下名字的長度不會超過16,這樣會加快索引查詢速度,還會減少索引檔案的大小,提高INSERT,UPDATE的更新速度。

       如果分別給LOGIN_NAME,CITY,AGE建立單列索引,讓該表有3個單列索引,查詢時和組合索引的效率是大不一樣的,甚至遠遠低於我們的組合索引。雖然此時有三個索引,但mysql只能用到其中的那個它認為似乎是最有效率的單列索引,另外兩個是用不到的,也就是說還是一個全表掃描的過程。

       建立這樣的組合索引,就相當於分別建立如下三種組合索引:

LOGIN_NAME,CITY,AGE
LOGIN_NAME,CITY
LOGIN_NAME

  為什麼沒有CITY,AGE等這樣的組合索引呢?這是因為mysql組合索引“最左字首”的結果。簡單的理解就是隻從最左邊的開始組合,並不是只要包含這三列的查詢都會用到該組合索引。也就是說name_city_age(LOGIN_NAME(16),CITY,AGE)從左到右進行索引,如果沒有左前索引,mysql不會執行索引查詢

      如果索引列長度過長,這種列索引時將會產生很大的索引檔案,不便於操作,可以使用字首索引方式進行索引,字首索引應該控制在一個合適的點,控制在0.31黃金值即可(大於這個值就可以建立)。

SELECT COUNT(DISTINCT(LEFT(`title`,10)))/COUNT(*) FROM Arctic; -- 這個值大於0.31就可以建立字首索引,Distinct去重複

ALTER TABLE `user` ADD INDEX `uname`(title(10)); -- 增加字首索引SQL,將人名的索引建立在10,這樣可以減少索引檔案大小,加快索引查詢速度

三.索引的使用及注意事項    

       EXPLAIN可以幫助開發人員分析SQL問題,explain顯示了mysql如何使用索引來處理select語句以及連線表,可以幫助選擇更好的索引和寫出更優化的查詢語句。

   使用方法,在select語句前加上Explain就可以了:

Explain select * from user where id=1;

  儘量避免這些不走索引的sql:

複製程式碼 複製程式碼
SELECT `sname` FROM `stu` WHERE `age`+10=30;-- 不會使用索引,因為所有索引列參與了計算

SELECT `sname` FROM `stu` WHERE LEFT(`date`,4) <1990; -- 不會使用索引,因為使用了函式運算,原理與上面相同

SELECT * FROM `houdunwang` WHERE `uname` LIKE'後盾%' -- 走索引

SELECT * FROM `houdunwang` WHERE `uname` LIKE "%後盾%" -- 不走索引

-- 正則表示式不使用索引,這應該很好理解,所以為什麼在SQL中很難看到regexp關鍵字的原因

-- 字串與數字比較不使用索引;
CREATE TABLE `a` (`a` char(10));
EXPLAIN SELECT * FROM `a` WHERE `a`="1" -- 走索引
EXPLAIN SELECT * FROM `a` WHERE `a`=1 -- 不走索引

select * from dept where dname='xxx' or loc='xx' or deptno=45 --如果條件中有or,即使其中有條件帶索引也不會使用。換言之,就是要求使用的所有欄位,都必須建立索引, 我們建議大家儘量避免使用or 關鍵字

-- 如果mysql估計使用全表掃描要比使用索引快,則不使用索引
複製程式碼 複製程式碼

  索引雖然好處很多,但過多的使用索引可能帶來相反的問題,索引也是有缺點的:

  • 雖然索引大大提高了查詢速度,同時卻會降低更新表的速度,如對錶進行INSERT,UPDATE和DELETE。因為更新表時,mysql不僅要儲存資料,還要儲存一下索引檔案
  • 建立索引會佔用磁碟空間的索引檔案。一般情況這個問題不太嚴重,但如果你在要給大表上建了多種組合索引,索引檔案會膨脹很寬

      索引只是提高效率的一個方式,如果mysql有大資料量的表,就要花時間研究建立最優的索引,或優化查詢語句。

     使用索引時,有一些技巧:

    1.索引不會包含有NULL的列

       只要列中包含有NULL值,都將不會被包含在索引中,複合索引中只要有一列含有NULL值,那麼這一列對於此符合索引就是無效的。

    2.使用短索引

       對串列進行索引,如果可以就應該指定一個字首長度。例如,如果有一個char(255)的列,如果在前10個或20個字元內,多數值是唯一的,那麼就不要對整個列進行索引。短索引不僅可以提高查詢速度而且可以節省磁碟空間和I/O操作。

    3.索引列排序

       mysql查詢只使用一個索引,因此如果where子句中已經使用了索引的話,那麼order by中的列是不會使用索引的。因此資料庫預設排序可以符合要求的情況下不要使用排序操作,儘量不要包含多個列的排序,如果需要最好給這些列建複合索引。

    4.like語句操作

      一般情況下不鼓勵使用like操作,如果非使用不可,注意正確的使用方式。like ‘%aaa%’不會使用索引,而like ‘aaa%’可以使用索引。

    5.不要在列上進行運算

    6.不使用NOT IN 、<>、!=操作,但<,<=,=,>,>=,BETWEEN,IN是可以用到索引的

    7.索引要建立在經常進行select操作的欄位上。

       這是因為,如果這些列很少用到,那麼有無索引並不能明顯改變查詢速度。相反,由於增加了索引,反而降低了系統的維護速度和增大了空間需求。

    8.索引要建立在值比較唯一的欄位上。

    9.對於那些定義為text、image和bit資料型別的列不應該增加索引。因為這些列的資料量要麼相當大,要麼取值很少。

    10.在where和join中出現的列需要建立索引。

    11.where的查詢條件裡有不等號(where column != …),mysql將無法使用索引。

    12.如果where字句的查詢條件裡使用了函式(如:where DAY(column)=…),mysql將無法使用索引。

    13.在join操作中(需要從多個數據表提取資料時),mysql只有在主鍵和外來鍵的資料型別相同時才能使用索引,否則及時建立了索引也不會使用。

一.索引的作用

       一般的應用系統,讀寫比例在10:1左右,而且插入操作和一般的更新操作很少出現效能問題,遇到最多的,也是最容易出問題的,還是一些複雜的查詢操作,所以查詢語句的優化顯然是重中之重。

       在資料量和訪問量不大的情況下,mysql訪問是非常快的,是否加索引對訪問影響不大。但是當資料量和訪問量劇增的時候,就會發現mysql變慢,甚至down掉,這就必須要考慮優化sql了,給資料庫建立正確合理的索引,是mysql優化的一個重要手段。  

       索引的目的在於提高查詢效率,可以類比字典,如果要查“mysql”這個單詞,我們肯定需要定位到m字母,然後從下往下找到y字母,再找到剩下的sql。如果沒有索引,那麼你可能需要把所有單詞看一遍才能找到你想要的。除了詞典,生活中隨處可見索引的例子,如火車站的車次表、圖書的目錄等。它們的原理都是一樣的,通過不斷的縮小想要獲得資料的範圍來篩選出最終想要的結果,同時把隨機的事件變成順序的事件,也就是我們總是通過同一種查詢方式來鎖定資料。

       在建立索引時,需要考慮哪些列會用於 SQL 查詢,然後為這些列建立一個或多個索引。事實上,索引也是一種表,儲存著主鍵或索引欄位,以及一個能將每個記錄指向實際表的指標。資料庫使用者是看不到索引的,它們只是用來加速查詢的。資料庫搜尋引擎使用索引來快速定位記錄。

      INSERT 與 UPDATE 語句在擁有索引的表中執行會花費更多的時間,而SELECT 語句卻會執行得更快。這是因為,在進行插入或更新時,資料庫也需要插入或更新索引值。

二.索引的建立、刪除

     索引的型別:

  • UNIQUE(唯一索引):不可以出現相同的值,可以有NULL值
  • INDEX(普通索引):允許出現相同的索引內容
  • PROMARY KEY(主鍵索引):不允許出現相同的值
  • fulltext index(全文索引):可以針對值中的某個單詞,但效率確實不敢恭維
  • 組合索引:實質上是將多個欄位建到一個索引裡,列值的組合必須唯一

(1)使用ALTER TABLE語句建立索性

        應用於表建立完畢之後再新增。

ALTER TABLE 表名 ADD 索引型別 (unique,primary key,fulltext,index)[索引名](欄位名)
//普通索引
alter table table_name add index index_name (column_list) ;
//唯一索引
alter table table_name add unique (column_list) ;
//主鍵索引
alter table table_name add primary key (column_list) ;

  ALTER TABLE可用於建立普通索引、UNIQUE索引和PRIMARY KEY索引3種索引格式,table_name是要增加索引的表名,column_list指出對哪些列進行索引,多列時各列之間用逗號分隔。索引名index_name可選,預設時,MySQL將根據第一個索引列賦一個名稱。另外,ALTER TABLE允許在單個語句中更改多個表,因此可以同時建立多個索引。

(2)使用CREATE INDEX語句對錶增加索引

       CREATE INDEX可用於對錶增加普通索引或UNIQUE索引,可用於建表時建立索引。

CREATE INDEX index_name ON table_name(username(length)); 

  如果是CHAR,VARCHAR型別,length可以小於欄位實際長度;如果是BLOB和TEXT型別,必須指定 length。

//create只能新增這兩種索引;
CREATE INDEX index_name ON table_name (column_list)
CREATE UNIQUE INDEX index_name ON table_name (column_list)

  table_name、index_name和column_list具有與ALTER TABLE語句中相同的含義,索引名不可選。另外,不能用CREATE INDEX語句建立PRIMARY KEY索引

(3)刪除索引

     刪除索引可以使用ALTER TABLE或DROP INDEX語句來實現。DROP INDEX可以在ALTER TABLE內部作為一條語句處理,其格式如下:

drop index index_name on table_name ;

alter table table_name drop index index_name ;

alter table table_name drop primary key ;

  其中,在前面的兩條語句中,都刪除了table_name中的索引index_name。而在最後一條語句中,只在刪除PRIMARY KEY索引中使用,因為一個表只可能有一個PRIMARY KEY索引,因此不需要指定索引名。如果沒有建立PRIMARY KEY索引,但表具有一個或多個UNIQUE索引,則MySQL將刪除第一個UNIQUE索引。

      如果從表中刪除某列,則索引會受影響。對於多列組合的索引,如果刪除其中的某列,則該列也會從索引中刪除。如果刪除組成索引的所有列,則整個索引將被刪除。

(4) 組合索引與字首索引

        在這裡要指出,組合索引和字首索引是對建立索引技巧的一種稱呼,並不是索引的型別。為了更好的表述清楚,建立一個demo表如下。

複製程式碼 複製程式碼
create table USER_DEMO
(
   ID                   int not null auto_increment comment '主鍵',
   LOGIN_NAME           varchar(100) not null comment '登入名',
   PASSWORD             varchar(100) not null comment '密碼',
   CITY                 varchar(30) not null comment '城市',
   AGE                  int not null comment '年齡',
   SEX                  int not null comment '性別(0:女 1:男)',
   primary key (ID)
);
複製程式碼 複製程式碼

  為了進一步榨取mysql的效率,就可以考慮建立組合索引,即將LOGIN_NAME,CITY,AGE建到一個索引裡:

ALTER TABLE USER_DEMO ADD INDEX name_city_age (LOGIN_NAME(16),CITY,AGE); 

   建表時,LOGIN_NAME長度為100,這裡用16,是因為一般情況下名字的長度不會超過16,這樣會加快索引查詢速度,還會減少索引檔案的大小,提高INSERT,UPDATE的更新速度。

       如果分別給LOGIN_NAME,CITY,AGE建立單列索引,讓該表有3個單列索引,查詢時和組合索引的效率是大不一樣的,甚至遠遠低於我們的組合索引。雖然此時有三個索引,但mysql只能用到其中的那個它認為似乎是最有效率的單列索引,另外兩個是用不到的,也就是說還是一個全表掃描的過程。

       建立這樣的組合索引,就相當於分別建立如下三種組合索引:

LOGIN_NAME,CITY,AGE
LOGIN_NAME,CITY
LOGIN_NAME

  為什麼沒有CITY,AGE等這樣的組合索引呢?這是因為mysql組合索引“最左字首”的結果。簡單的理解就是隻從最左邊的開始組合,並不是只要包含這三列的查詢都會用到該組合索引。也就是說name_city_age(LOGIN_NAME(16),CITY,AGE)從左到右進行索引,如果沒有左前索引,mysql不會執行索引查詢

      如果索引列長度過長,這種列索引時將會產生很大的索引檔案,不便於操作,可以使用字首索引方式進行索引,字首索引應該控制在一個合適的點,控制在0.31黃金值即可(大於這個值就可以建立)。

SELECT COUNT(DISTINCT(LEFT(`title`,10)))/COUNT(*) FROM Arctic; -- 這個值大於0.31就可以建立字首索引,Distinct去重複

ALTER TABLE `user` ADD INDEX `uname`(title(10)); -- 增加字首索引SQL,將人名的索引建立在10,這樣可以減少索引檔案大小,加快索引查詢速度

三.索引的使用及注意事項    

       EXPLAIN可以幫助開發人員分析SQL問題,explain顯示了mysql如何使用索引來處理select語句以及連線表,可以幫助選擇更好的索引和寫出更優化的查詢語句。

   使用方法,在select語句前加上Explain就可以了:

Explain select * from user where id=1;

  儘量避免這些不走索引的sql:

複製程式碼 複製程式碼
SELECT `sname` FROM `stu` WHERE `age`+10=30;-- 不會使用索引,因為所有索引列參與了計算

SELECT `sname` FROM `stu` WHERE LEFT(`date`,4) <1990; -- 不會使用索引,因為使用了函式運算,原理與上面相同

SELECT * FROM `houdunwang` WHERE `uname` LIKE'後盾%' -- 走索引

SELECT * FROM `houdunwang` WHERE `uname` LIKE "%後盾%" -- 不走索引

-- 正則表示式不使用索引,這應該很好理解,所以為什麼在SQL中很難看到regexp關鍵字的原因

-- 字串與數字比較不使用索引;
CREATE TABLE `a` (`a` char(10));
EXPLAIN SELECT * FROM `a` WHERE `a`="1" -- 走索引
EXPLAIN SELECT * FROM `a` WHERE `a`=1 -- 不走索引

select * from dept where dname='xxx' or loc='xx' or deptno=45 --如果條件中有or,即使其中有條件帶索引也不會使用。換言之,就是要求使用的所有欄位,都必須建立索引, 我們建議大家儘量避免使用or 關鍵字

-- 如果mysql估計使用全表掃描要比使用索引快,則不使用索引
複製程式碼 複製程式碼

  索引雖然好處很多,但過多的使用索引可能帶來相反的問題,索引也是有缺點的:

  • 雖然索引大大提高了查詢速度,同時卻會降低更新表的速度,如對錶進行INSERT,UPDATE和DELETE。因為更新表時,mysql不僅要儲存資料,還要儲存一下索引檔案
  • 建立索引會佔用磁碟空間的索引檔案。一般情況這個問題不太嚴重,但如果你在要給大表上建了多種組合索引,索引檔案會膨脹很寬

      索引只是提高效率的一個方式,如果mysql有大資料量的表,就要花時間研究建立最優的索引,或優化查詢語句。

     使用索引時,有一些技巧:

    1.索引不會包含有NULL的列

       只要列中包含有NULL值,都將不會被包含在索引中,複合索引中只要有一列含有NULL值,那麼這一列對於此符合索引就是無效的。

    2.使用短索引

       對串列進行索引,如果可以就應該指定一個字首長度。例如,如果有一個char(255)的列,如果在前10個或20個字元內,多數值是唯一的,那麼就不要對整個列進行索引。短索引不僅可以提高查詢速度而且可以節省磁碟空間和I/O操作。

    3.索引列排序

       mysql查詢只使用一個索引,因此如果where子句中已經使用了索引的話,那麼order by中的列是不會使用索引的。因此資料庫預設排序可以符合要求的情況下不要使用排序操作,儘量不要包含多個列的排序,如果需要最好給這些列建複合索引。

    4.like語句操作

      一般情況下不鼓勵使用like操作,如果非使用不可,注意正確的使用方式。like ‘%aaa%’不會使用索引,而like ‘aaa%’可以使用索引。

    5.不要在列上進行運算

    6.不使用NOT IN 、<>、!=操作,但<,<=,=,>,>=,BETWEEN,IN是可以用到索引的

    7.索引要建立在經常進行select操作的欄位上。

       這是因為,如果這些列很少用到,那麼有無索引並不能明顯改變查詢速度。相反,由於增加了索引,反而降低了系統的維護速度和增大了空間需求。

    8.索引要建立在值比較唯一的欄位上。

    9.對於那些定義為text、image和bit資料型別的列不應該增加索引。因為這些列的資料量要麼相當大,要麼取值很少。

    10.在where和join中出現的列需要建立索引。

    11.where的查詢條件裡有不等號(where column != …),mysql將無法使用索引。

    12.如果where字句的查詢條件裡使用了函式(如:where DAY(column)=…),mysql將無法使用索引。

    13.在join操作中(需要從多個數據表提取資料時),mysql只有在主鍵和外來鍵的資料型別相同時才能使用索引,否則及時建立了索引也不會使用。