1. 程式人生 > >Mysql高手系列 - 第21篇:什麼是索引?

Mysql高手系列 - 第21篇:什麼是索引?

Mysql系列的目標是:通過這個系列從入門到全面掌握一個高階開發所需要的全部技能。

這是Mysql系列第21篇。

本文開始連續3篇詳解mysql索引:

  1. 第1篇來說說什麼是索引?
  2. 第2篇詳解Mysql中索引的原理
  3. 第3篇結合索引詳解關鍵字explain

本文為索引第一篇:我們來了解一下什麼是索引?

路人在搞計算機之前,是負責小區建設規劃的,上級領導安排路人負責一個萬人小區建設規劃,並提了一個要求:可以快速通過戶主姓名找到戶主的房子;讓路人出個好的解決方案。

方案1

剛開始路人沒什麼經驗,實在想不到什麼好辦法。

路人告訴領導:你可以去敲每戶的門,然後開門之後再去詢問房主姓名,是否和需要找的人姓名一致。

領導一聽鬱悶了:我敲你的頭,1萬戶,我一個個找,找到什麼時候了?你明天不用來上班了。

這裡面涉及到的時間有:走到每戶的門口耗時、敲門等待開門耗時、詢問戶主獲取戶主姓名耗時、將戶主姓名和需要查詢的姓名對比是否一致耗時。

加入要找的人剛好在最後一戶,領導豈不是要瘋掉了,需要重複1萬次上面的操作。

上面是最原始,最耗時的做法,可能要找的人根本不在這個小區,白費力的找了1萬次,豈不是要瘋掉。

方案2

路人靈機一動,想到了一個方案:

  1. 給所有的戶主制定一個編號,從1-10000,戶主將戶號貼在自家的門口
  2. 路人自己製作了一個戶主和戶號對應的表格,我們叫做:戶主目錄表,共1萬條記錄,如下:
戶主姓名 房屋編號
劉德華 00001
張學友 00002
路人 00888
路人甲java 10000

此時領導要查詢路人甲Java時,過程如下:

  1. 按照姓名在戶主目錄表查詢路人甲Java,找到對應的編號:10000
  2. 然後從第一戶房子開始找,檢視其門口戶號是否是10000,直到找到為止

路人告訴領導,這個方案比方案1有以下好處:

  1. 如果要找的人不在這個小區,通過戶主目錄表就確定,不需要第二步了
  2. 步驟2中不需要再去敲每戶的門以及詢問戶主的姓名了,只需對比一下門口的戶號就可以了,比方案1省了不少時間。

領導笑著說,不錯不錯,有進步,不過我找路人甲Java還是需要挨家挨戶看門牌號1萬次啊!。。。。。你再去想想吧,看看是否還有更好的辦法來加快查詢速度。

路人下去了苦思冥想,想出了方案3。

方案3

方案2中第2步最壞的情況還是需要找1萬次。

路人去上海走了一圈,看了那邊小區搞的不錯,很多小區都是搞成一棟一棟的,每棟樓裡面有100戶,路人也決定這麼搞。

路人告訴領導:

  1. 將1萬戶劃分為100棟樓,每棟樓有25層,每層有4戶人家,總共1萬戶

  2. 給每棟樓一個編號,範圍是[001,100],將棟號貼在每棟樓最顯眼的位置
  3. 給每棟樓中的每層一個編號,編號範圍是[01,25],將層號貼在每層樓最顯眼的位置
  4. 戶號變為:棟號-樓層-層中編號,如路人甲Java戶號是:100-20-04,貼在每戶門口

戶主目錄表還是有1萬條記錄,如下:

戶主姓名 房屋編號
劉德華 001-08-04
張學友 022-18-01
路人 088-25-04
路人甲java 100-25-04

此時領導要查詢路人甲Java時,過程如下:

  1. 按照姓名在戶主目錄表查詢路人甲Java,找到對應的編號是100-25-04,將編號分解,得到:棟號(100)、樓層(25)、樓號(04)
  2. 從第一棟開始找,看其棟號是否是100,直到找到編號為100為止,這個過程需要找100次,然後到了第100棟樓下
  3. 從100棟的第一層開始向上走,走到每層看其編號是否為25,直到走到第25層,這個過程需要匹配25次
  4. 在第25層依次看看戶號是否為100-25-04,匹配了4次,找到了路人甲Java

此方案分析:

  1. 查詢戶主目錄表1萬次,不過這個是在表格中,不用動身走路去找,只需要動動眼睛對比一下數字,速度還是比較快的
  2. 將方案2中的第2步優化為上面的2/3/4步驟,上面最壞需要匹配129次(棟100+層25+樓號4次),相對於方案2的1萬次好多了

領導拍拍路人的肩膀:小夥子,去過上海的人確實不一樣啊,這次方案不錯,不過第一步還是需要很多次,能否有更好的方案呢?

路人下去了又想了好幾天,突然想到了我們常用的字典,可以按照字典的方式對方案3中第一步做優化,然後提出了方案4。

方案4

對戶主表進行改造,按照姓的首字母(a-z)製作26個表格,叫做:姓氏戶主表,每個表格中儲存對應姓氏首字母及所有戶主和戶號。如下:

姓首字母:A
姓名 戶號
阿三 010-16-01
阿郎 017-11-04
啊啊 008-08-02


姓首字母:L
姓名 戶號
劉德華 011-16-01
路人 057-11-04
路人甲 048-08-02

現在查詢戶號步驟如下:

  1. 通過姓名獲取姓對應的首字母
  2. 在26個表格中找到對應姓的表格,如路人甲Java,對應L表
  3. 在L表中迴圈遍歷,找到路人甲Java的戶號
  4. 根據戶號按照方案3中的(2/3/4)步驟找對應的戶主

理想情況:

1萬戶主的姓氏分配比較均衡,那麼每個姓氏下面分配385戶(10000/26) ,那麼找到某個戶主,最多需要:26次+385次 = 410次,相對於1萬次少了很多。

最壞的情況:

1萬個戶主的姓氏都是一樣的,導致這1萬個戶主資訊都位於同一個姓氏戶主表,此時查詢又變為了1萬多次。不過出現姓氏一樣的情況比較低。

如果擔心姓氏不足以均衡劃分戶主資訊,那麼也可以通過戶主姓名的筆畫數來劃分,或者其他方法,主要是將使用者資訊劃分為不同的區,可以快速過濾一些不相關的戶主。

上面幾個方案為了快速檢索到戶主,用到了一些資料結構,通過這些資料結構對戶主的資訊進行組織,從而可以快速過濾掉一些不相關的戶主,減少查詢次數,快速定位到戶主的房子。

索引是什麼?

通過上面的示例,我們可以概況一下索引的定義:索引是依靠某些資料結構和演算法來組織資料,最終引導使用者快速檢索出所需要的資料。

索引有2個特點:

  1. 通過資料結構和演算法來對原始的資料進行一些有效的組織
  2. 通過這些有效的組織,可以引導使用者對原始資料進行快速檢索

mysql為了快速檢索資料,也用到了一些好的資料結構和演算法,來組織表中的資料,加快檢索效率。

下篇文章將對mysql索引原理做詳細介紹,敬請期待,喜歡的關注一下謝謝!

Mysql系列目錄

  1. 第1篇:mysql基礎知識
  2. 第2篇:詳解mysql資料型別(重點)
  3. 第3篇:管理員必備技能(必須掌握)
  4. 第4篇:DDL常見操作
  5. 第5篇:DML操作彙總(insert,update,delete)
  6. 第6篇:select查詢基礎篇
  7. 第7篇:玩轉select條件查詢,避免採坑
  8. 第8篇:詳解排序和分頁(order by & limit)
  9. 第9篇:分組查詢詳解(group by & having)
  10. 第10篇:常用的幾十個函式詳解
  11. 第11篇:深入瞭解連線查詢及原理
  12. 第12篇:子查詢
  13. 第13篇:細說NULL導致的神坑,讓人防不勝防
  14. 第14篇:詳解事務
  15. 第15篇:詳解檢視
  16. 第16篇:變數詳解
  17. 第17篇:儲存過程&自定義函式詳解
  18. 第18篇:流程控制語句
  19. 第19篇:遊標詳解
  20. 第20篇:異常捕獲及處理詳解

mysql系列大概有20多篇,喜歡的請關注一下,歡迎大家加我微信itsoku或者留言交流mysql相關技術!