吐血總結——90%程序員面試都用得上的索引優化手冊

阿新 • • 發佈：2019-04-28

基本使用 rim create 之間 column 數據表增加關聯成語

多關於索引，分為以下幾點來講解：

一、索引的概述(什麽是索引,索引的優缺點)
二、索引的基本使用（創建索引）
三、索引的基本原理（面試重點）
四、索引的數據結構（B樹，hash）
五、創建索引的原則（重中之重，面試必問！敬請收藏！）
六、百萬級別或以上的數據如何刪除

一、索引的概述

Ⅰ、什麽是索引？

索引是一種特殊的文件(InnoDB數據表上的索引是表空間的一個組成部分)，它們包含著對數據表裏所有記錄的引用指針。更通俗的說，索引就相當於目錄。當你在用新華字典時，幫你把目錄撕掉了，你查詢某個字開頭的成語只能從第一頁翻到第一千頁。累！把目錄還給你，則能快速定位！

Ⅱ、索引的優缺點：

可以大大加快數據的檢索速度，這也是創建索引的最主要的原因。，且通過使用索引，可以在查詢的過程中，使用優化隱藏器，提高系統的性能。但是，索引也是有缺點的：索引需要額外的維護成本；因為索引文件是單獨存在的文件,對數據的增加,修改,刪除,都會產生額外的對索引文件的操作,這些操作需要消耗額外的IO,會降低增/改/刪的執行效率。

二、索引的基本使用

創建索引：（三種方式）

第一種方式：

技術分享圖片

第二種方式：使用ALTER TABLE命令去增加索引：

ALTER TABLE用來創建普通索引、UNIQUE索引或PRIMARY KEY索引。

技術分享圖片

其中table_name是要增加索引的表名，column_list指出對哪些列進行索引，多列時各列之間用逗號分隔。

索引名index_name可自己命名，缺省時，MySQL將根據第一個索引列賦一個名稱。另外，ALTER TABLE允許在單個語句中更改多個表，因此可以在同時創建多個索引。

第三種方式：使用CREATE INDEX命令創建

CREATE INDEX可對表增加普通索引或UNIQUE索引。（但是，不能創建PRIMARY KEY索引）

技術分享圖片

三、索引的基本原理

索引用來快速地尋找那些具有特定值的記錄。如果沒有索引，一般來說執行查詢時遍歷整張表。

索引的原理很簡單，就是把無序的數據變成有序的查詢

把創建了索引的列的內容進行排序
對排序結果生成倒排表
在倒排表內容上拼上數據地址鏈
在查詢的時候，先拿到倒排表內容，再取出數據地址鏈，從而拿到具體數據

四、索引的數據結構

b樹
hash

##Ⅰ.B樹索引

mysql通過存儲引擎取數據，基本上90%的人用的就是InnoDB了，按照實現方式分，InnoDB的索引類型目前只有兩種：BTREE（B樹）索引和HASH索引。B樹索引是Mysql數據庫中使用最頻繁的索引類型，基本所有存儲引擎都支持BTree索引。通常我們說的索引不出意外指的就是（B樹）索引（實際是用B+樹實現的，因為在查看表索引時，mysql一律打印BTREE，所以簡稱為B樹索引）

技術分享圖片

查詢方式：

主鍵索引區:PI(關聯保存的時數據的地址)按主鍵查詢,

普通索引區:si(關聯的id的地址,然後再到達上面的地址)。所以按主鍵查詢,速度最快

B+tree性質：

n棵子tree的節點包含n個關鍵字，不用來保存數據而是保存數據的索引。
所有的葉子結點中包含了全部關鍵字的信息，及指向含這些關鍵字記錄的指針，且葉子結點本身依關鍵字的大小自小而大順序鏈接。
所有的非終端結點可以看成是索引部分，結點中僅含其子樹中的最大（或最小）關鍵字。
B+ 樹中，數據對象的插入和刪除僅在葉節點上進行。
B+樹有2個頭指針，一個是樹的根節點，一個是最小關鍵碼的葉節點。

Ⅱ.哈希索引

簡要說下，類似於數據結構中簡單實現的HASH表（散列表）一樣，當我們在mysql中用哈希索引時，主要就是通過Hash算法（常見的Hash算法有直接定址法、平方取中法、折疊法、除數取余法、隨機數法），將數據庫字段數據轉換成定長的Hash值，與這條數據的行指針一並存入Hash表的對應位置；如果發生Hash碰撞（兩個不同關鍵字的Hash值相同），則在對應Hash鍵下以鏈表形式存儲。當然這只是簡略模擬圖。

技術分享圖片

五、創建索引的原則

索引雖好，但也不是無限制的使用，最好符合一下幾個原則：

最左前綴匹配原則，組合索引非常重要的原則，mysql會一直向右匹配直到遇到範圍查詢(>、<、between、like)就停止匹配，比如a = 1 and b = 2 and c > 3 and d = 4 如果建立(a,b,c,d)順序的索引，d是用不到索引的，如果建立(a,b,d,c)的索引則都可以用到，a,b,d的順序可以任意調整。
較頻繁作為查詢條件的字段才去創建索引
更新頻繁字段不適合創建索引
若是不能有效區分數據的列不適合做索引列(如性別，男女未知，最多也就三種，區分度實在太低)
盡量的擴展索引，不要新建索引。比如表中已經有a的索引，現在要加(a,b)的索引，那麽只需要修改原來的索引即可。
定義有外鍵的數據列一定要建立索引。
對於那些查詢中很少涉及的列，重復值比較多的列不要建立索引。
對於定義為text、image和bit的數據類型的列不要建立索引。

六、百萬級別或以上的數據如何刪除

關於索引：由於索引需要額外的維護成本，因為索引文件是單獨存在的文件,所以當我們對數據的增加,修改,刪除,都會產生額外的對索引文件的操作,這些操作需要消耗額外的IO,會降低增/改/刪的執行效率。所以，在我們刪除數據庫百萬級別數據的時候，查詢MySQL官方手冊得知刪除數據的速度和創建的索引數量是成正比的。

所以我們想要刪除百萬數據的時候可以先刪除索引（此時大概耗時三分多鐘）
然後刪除其中無用數據（此過程需要不到兩分鐘）
刪除完成後重新創建索引(此時數據較少了)創建索引也非常快，約十分鐘左右。
與之前的直接刪除絕對是要快速很多，更別說萬一刪除中斷,一切刪除會回滾。那更是坑了。

吐血總結——90%程序員面試都用得上的索引優化手冊

基本使用 rim create 之間 column 數據表增加關聯成語目錄多關於索引，分為以下幾點來講解：一、索引的概述(什麽是索引,索引的優缺點) 二、索引的基本使用（創建索引）三、索引的基本原理（面試重點）四、索引的數據結構（B樹，hash）五、創建

吐血總結——90%程序員面試都用得上的索引優化手冊

一、索引的概述

Ⅰ、什麽是索引？

Ⅱ、索引的優缺點：

二、索引的基本使用

三、索引的基本原理

四、索引的數據結構

Ⅱ.哈希索引

五、創建索引的原則

六、百萬級別或以上的數據如何刪除

吐血總結——90%程序員面試都用得上的索引優化手冊

「mysql優化專題」90%程序員面試都用得上的索引優化手冊(5)

「mysql優化專題」程式設計師面試都用得上的索引優化手冊(5)【面試重點】

2019年，幹貨神總結，程序員面試技巧

為什麽程序員面試都是造火箭，那些不為人知的秘密！

iOS端Mock GPS定位 —— 測試、開發、玩遊戲、發朋友圈等等，你都用得上

2019 年 3 月 iOS程序員面試心得總結，請大家多多指教！

程序員面試金典算法題

java程序員面試常見32問

程序員面試京東前端，現場JavaScript代碼寫出魔方特效

mysql優化專題」90%程序員都會忽略的增刪改優化（2）

前端常用技術總結--java程序員

java程序員面試金典--i++

Python程序員面試，這些問題你必須提前準備！

《程序員面試指南》第一章棧和隊列構造數組的MaxTree

2018年4月份，阿裏最新的java程序員面試題目

技術好卻進不了大公司？iOS程序員面試的幾個小技巧你可要收好了

神級程序員教你用Python實現簡單的導彈自動追蹤！此乃裝逼神技！

同樣級別iOS程序員，為啥比我菜的程序員薪資都比我高？

程序員面試非技術性問題匯總

吐血總結——90%程序員面試都用得上的索引優化手冊

一、索引的概述

Ⅰ、什麽是索引？

Ⅱ、索引的優缺點：

二、索引的基本使用

三、索引的基本原理

四、索引的數據結構

Ⅱ.哈希索引

五、創建索引的原則

六、百萬級別或以上的數據如何刪除

相關推薦