1. 程式人生 > 其它 >[轉]MySQL 字首索引--------mysql索引指定指定一個字首長度

[轉]MySQL 字首索引--------mysql索引指定指定一個字首長度

原文:https://www.cnblogs.com/niuben/p/13188277.html

--------------------------------

索引字首

使用 字串列的索引規範中的語法,您可以建立僅使用列首字元的索引 。以這種方式僅索引列值的字首可以使索引檔案小得多。為a 或 column 編制索引時 , 必須為索引指定字首長度。例如:col_name(N)NBLOBTEXT

複製程式碼
CREATE TABLE test (blob_col BLOB, INDEX(blob_col(10)));

字首最長可以為1000個位元組(InnoDB表中為767個位元組 ,除非已 innodb_large_prefix設定)。

注意字首限制以位元組為單位,而在字首長度CREATE TABLE, ALTER TABLE和 CREATE INDEX語句被解釋為非二進位制串型別的字元數(CHAR, VARCHAR, TEXT對於二進位制串型別),並且位元組數(BINARY, VARBINARY, BLOB)。為使用多位元組字符集的非二進位制字串列指定字首長度時,請考慮到這一點。
如果搜尋詞超過索引字首長度,則使用索引排除不匹配的行,然後檢查其餘行是否可能匹配。


當要索引的列字元很多時 索引則會很大且變慢
( 可以只索引列開始的部分字串 節約索引空間 從而提高索引效率 )

原則: 降低重複的索引值

例如現在有一個地區表

areagdpcode
chinaShanghai 100 aaa
chinaDalian 200 bbb
usaNewYork 300 ccc
chinaFuxin 400 ddd
chinaBeijing 500 eee

發現 area 欄位很多都是以 china 開頭的
那麼如果以前1-5位字元做字首索引就會出現大量索引值重複的情況
索引值重複性越低 查詢效率也就越高


字首索引測試

複製程式碼
// 建立一個測試表
CREATE TABLE `x_test` (
  `id` int(11) unsigned NOT NULL AUTO_INCREMENT,
  `x_name` varchar(255) NOT NULL,
  `x_time` int(10) NOT NULL,
  PRIMARY KEY (`id`)
) ENGINE=InnoDB AUTO_INCREMENT=4145025 DEFAULT CHARSET=utf8mb4

// 新增200萬條測試資料
INSERT INTO x_test(x_name,x_time) SELECT CONCAT(rand()*3300102,x_name),x_time FROM x_test WHERE id < 30000;

1.在無任何索引的情況下隨便查詢一條

複製程式碼
SELECT * FROM x_test WHERE x_name = '1892008.205824857823401.800099203178258.8904820949682635656.62526521254';

查詢時間:2.253s

2.新增字首索引 ( 以第一位字元建立字首索引 )

複製程式碼
alter table x_test add index(x_name(1))

再次查詢相同sql語句

複製程式碼
SELECT * FROM x_test WHERE x_name = '1892008.205824857823401.800099203178258.8904820949682635656.62526521254';

查詢時間:3.291s
當使用第一位字元建立字首索引後 貌似查詢的時間更長了
因為只第一位字元而言索引值的重讀性太大了
200萬條資料全以數字開頭那麼平均20萬條的資料都是相同的索引值

3.重新建立字首索引 這次以前4位字元來建立

複製程式碼
alter table x_test add index(x_name(4));

再次查詢相同sql語句

複製程式碼
SELECT * FROM x_test WHERE x_name = '1892008.205824857823401.800099203178258.8904820949682635656.62526521254';

查詢時間:0.703s
這次以前4位建立索引 大大減少了索引值的重複性 查詢速度從3秒提升到0.7秒

4.200萬條資料都以數字開頭 而0-9排列組合7位則可達到千萬種組合
也就是以前7位來做索引則不會出現重複索引值的情況了

複製程式碼
alter table x_test add index(x_name(7));

再次查詢相同sql語句

複製程式碼
SELECT * FROM x_test WHERE x_name = '1892008.205824857823401.800099203178258.8904820949682635656.62526521254';

查詢時間:0.014s ( 首次執行無快取狀態下 )