MySQL索引，實現方式？

阿新 • • 發佈：2021-08-20

1、問題：資料庫為什麼要設計索引？

圖書館存了1000W本圖書，要從中找到《架構師之路》，一本本查，要查到什麼時候去？

為了快速查詢一本書，圖書管理員設計了一套規則：

(1)、一樓放歷史類，二樓放文學類，三樓放IT類…
(2)、IT類，又分軟體類，硬體類…
(3)、軟體類，又按照書名音序排序…

與之類比，資料庫儲存了1000W條資料，要從中找到name=”shenjian”的記錄，一條條查，要查到什麼時候去？

於是，要有索引，用於提升資料庫的查詢速度。

2、問題：雜湊(hash)比樹(tree)更快，索引結構為什麼要設計成Tree型？

加速查詢速度的資料結構，常見的有兩類：

(1)、雜湊，例如：HashMap，查詢/插入/修改/刪除的平均時間複雜度都是O(1)

；

(2)、樹，例如：平衡二叉搜尋樹，查詢/插入/修改/刪除的平均時間複雜度都是O(lg(n))；

可以看到，不管是讀請求，還是寫請求，雜湊型別的索引，都要比樹型的索引更快一些，那為什麼，索引結構要設計成樹型呢？

索引設計成樹形，和SQL的需求相關。

（1）、單行查詢

對於這樣一個單行查詢的SQL需求：

select * from t where name=”shenjian”

單行查詢確實是雜湊索引更快，因為每次都只查詢1條記錄。

TIP：所以，如果業務需求都是單行訪問，例如passport，確實可以使用雜湊索引。

（2）、排序查詢

但是對於排序查詢的SQL需求：

分組：group by
排序：order by
比較：<、>
…

雜湊索引，時間複雜度會退化為O(n)，而樹型的“有序”特性，依然能夠保持O(log(n))的高效率。

任何脫離需求的設計都是耍流氓。

TIP：InnoDB並不支援雜湊索引。

3、問題：資料庫索引為什麼使用B+樹？

如果用下面幾種tree結構實現 index：

第1種：二叉搜尋樹

二叉搜尋樹，如上圖，是最為大家所熟知的一種資料結構，就不展開介紹了，它為什麼不適合用作資料庫索引？

(1)、當資料量大的時候，樹的高度會比較高，資料量大的時候，查詢會比較慢。

(2)、每個節點只儲存一個記錄，可能導致一次查詢有很多次磁碟IO。

第二種：B樹

B樹，如上圖，它的特點是：

(1)、不再是二叉搜尋，而是m叉搜尋；

(2)、葉子節點，非葉子節點，都儲存資料；

(3)、中序遍歷，可以獲得所有節點；

畫外音，實在不想介紹這個特性：非根節點包含的關鍵字個數j滿足，(┌m/2┐)-1 <= j <= m-1，節點分裂時要滿足這個條件。

什麼是區域性性原理？

B樹被作為實現索引的資料結構被創造出來，是因為它能夠完美的利用“區域性性原理”。

區域性性原理的邏輯是這樣的：

(1)、記憶體讀寫塊，磁碟讀寫慢，而且慢很多；

(2)、磁碟預讀：磁碟讀寫並不是按需讀取，而是按頁預讀，一次會讀一頁的資料，每次載入更多的資料，如果未來要讀取的資料就在這一頁中，可以避免未來的磁碟IO，提高效率；通常，一頁資料是4K。

(3)區域性性原理：軟體設計要儘量遵循“資料讀取集中”與“使用到一個數據，大概率會使用其附近的資料”，這樣磁碟預讀能充分提高磁碟IO；

B樹為何適合做索引？

(1)、由於是m分叉的，高度能夠大大降低；

(2)、每個節點可以儲存j個記錄，如果將節點大小設定為頁大小，例如4K，能夠充分的利用預讀的特性，極大減少磁碟IO；

第三種：B+樹

B+樹，如上圖，仍是m叉搜尋樹，在B樹的基礎上，做了一些改進：

(1)、非葉子節點不再儲存資料，資料只儲存在同一層的葉子節點上；

畫外音：B+樹中根到每一個節點的路徑長度一樣，而B樹不是這樣。

(2)、葉子之間，增加了連結串列，獲取所有節點，不再需要中序遍歷；

這些改進讓B+樹比B樹有更優的特性：

(1)、範圍查詢，定位min與max之後，中間葉子節點，就是結果集，不用中序回溯；範圍查詢在SQL中用得很多，這是B+樹比B樹最大的優勢。

(2)、葉子節點儲存實際記錄行，記錄行相對比較緊密的儲存，適合大資料量磁碟儲存；非葉子節點儲存記錄的PK，用於查詢加速，適合記憶體儲存；

(3)、非葉子節點，不儲存實際記錄，而只儲存記錄的KEY的話，那麼在相同記憶體的情況下，B+樹能夠儲存更多索引；

為什麼m叉的B+樹比BST的高度大大大大降低？

大概計算一下：

(1)、區域性性原理，將1個節點的大小設為1頁，1頁4K，假設一個KEY有8位元組，一個節點可以儲存500個KEY，即j=500

(2)、m叉樹，大概m/2<= j <=m，即可以差不多是1000叉樹

(3)、那麼：

一層樹：1個節點，1*500個KEY，大小4K
二層樹：1000個節點，1000*500=50W個KEY，大小1000*4K=4M
三層樹：1000*1000個節點，1000*1000*500=5億個KEY，大小1000*1000*4K=4G

可以看到，儲存大量的資料（5億），並不需要太高樹的深度（高度3），索引也不是太佔記憶體（4G）。

4、總結

資料庫索引用於加速查詢
雖然雜湊索引是O(1)，樹索引是O(log(n))，但SQL有很多“有序”需求，故資料庫使用樹型索引
InnoDB不支援雜湊索引
資料預讀的思路是：磁碟讀寫並不是按需讀取，而是按頁預讀，一次會讀一頁的資料，每次載入更多的資料，以便未來減少磁碟IO
區域性性原理：軟體設計要儘量遵循“資料讀取集中”與“使用到一個數據，大概率會使用其附近的資料”，這樣磁碟預讀能充分提高磁碟IO
資料庫的索引最常用B+樹：

(1)、很適合磁碟儲存，能夠充分利用區域性性原理，磁碟預讀；

(2)、很低的樹高度，能夠儲存大量資料；

(3)、索引本身佔用的記憶體很小；

(4)、能夠很好的支援單點查詢，範圍查詢，有序性查詢；

MySQL索引，實現方式？

1、問題：資料庫為什麼要設計索引？圖書館存了1000W本圖書，要從中找到《架構師之路》，一本本查，要查到什麼時候去？

MySQL索引底層實現原理

優秀博文： MySQL索引背後的資料結構及演算法原理 B樹、B-樹、B+樹、B*樹【轉】,mysql索引

如何理解mysql索引，事務與儲存引擎

這裡寫目錄標題一索引介紹1.1 索引的概念1.2 索引的作用1.3 索引的分類1.3.1 普通索引1.3.2 唯一性索引1.3.3 主鍵索引1.3.4 組合索引1.3.5 全域性索引

mysql索引，索引結構，索引型別，索引失效

索引：索引就是一個數據結構，是資料庫引擎為了查詢快捷而建立的. 我的理解是：相當於一個圖書館，在沒有編排類目之前，書是隨機放置的，查詢一本書，只能是遍歷，一本本找，但是編排之後，會分為科學類，

Mysql索引，有哪幾種索引，什麼時候該（不該）建索引；SQL怎麼進行優化以及SQL關鍵字的執行順序

索引（Index）是幫助MySQL高效獲取資料的資料結構。提取句子主幹，就可以得到索引的本質：索引是資料結構。

MySQL索引，事務與儲存引擎

文章目錄一、索引介紹 1、索引的概念資料庫索引 ·是一個排序的列表，儲存著索引值和這個值所對應的實體地址 ·無須對整個表進行掃描，通過實體地址就可以找到所需資料 ·是表中一列或者若干

利用JDBC操作mysql資料庫，實現增刪改查的功能

技術標籤：JDBC資料庫javamysqljdbcsql 資料庫連線被用於向資料庫伺服器傳送命令和 SQL 語句，並接受資料庫伺服器返回的結果。其實一個數據庫連接就是一個Socket連線

【MySQL學習筆記（一）】之MySQL架構，啟動方式，C/S連線方式，處理請求流程

技術標籤：MYSQL資料庫mysql 本文章由公號【開發小鴿】釋出！歡迎關注！！！老規矩–妹妹鎮樓：

圖解 MySQL 索引，清晰易懂，寫得太好了！

作者：shuaibing90 來源：https://www.xysycx.cn/articles/2020/12/05/1607146183637.html 什麼是索引？

Linux下Zabbix5.0 LTS新增MySQL監控，實現郵件報警並執行預處理操作

依據前文：Linux下Zabbix5.0 LTS監控基礎原理及安裝部署(圖文教程) 環境，繼續新增MySQL應用集。

在專案中遷移MS SQLServer到Mysql資料庫，實現MySQL資料庫的快速整合

在專案中遷移MS SQLServer到Mysql資料庫，實現MySQL資料庫的快速整合在開發專案的時候，往往碰到的不同的需求情況，相容不同型別的資料庫是我們專案以不變應萬變的舉措之一，在底層能夠相容多種資料庫會使得我們開

圖解｜用好MySQL索引，你需要知道的一些事情

我是蟬沐風。這一篇文章來聊一聊如何用好MySQL索引。為了更好地進行解釋，我建立了一個儲存引擎為InnoDB的表user_innodb，並批量初始化了500W+條資料。包含主鍵id、姓名欄位（name）、性別欄位（gender，用0，1表

mysql索引，事務，檢視，儲存過程，儲存引擎

mysql索引，事務，檢視，儲存過程，儲存引擎一，索引 1.概念索引：提供指向儲存在表的指定列中的資料值的指標，然後根據指定的排序順序對這些指標排序。資料庫使用索引以找到特定值，然後順指標找到包含該值的行。

【實現】表單控制元件的UI佈局，實現方式

一、先說一下表單控制元件要實現的功能吧。 1、繪製UI，包括表格（Table）的繪製，也就是TR 、TD，TR是多少行，TD是有多少列；包括子控制元件的控制元件，TextBox、DropDownList、CheckBoxList等控制元件

elk蒐集日誌，實現logstash根據message中結構不同動態建立索引並擴充套件功能，區分message中json和非json資料簡單方式

蒐集日誌，但是框架本身也會列印很多日誌是字串的。我們自己希望的日誌用json，但是又需要json欄位可以擴充套件，logstash收集日誌後都放在了message欄位中，我們自定義列印的是json串,spring列印的是string，為此我

清空認知，然後重新理解MySQL索引結構

前言 Hello我又來了，快年底了，作為一個有抱負的碼農，我想給自己攢一個年終總結。自上上篇寫了手動搭建Redis叢集和MySQL主從同步(非Docker)和上篇寫了動手實現MySQL讀寫分離and故障轉移之後，索性這次把資料庫中最

MySQL索引的原理，B+樹、聚集索引和二級索引的結構分析

索引是一種用於快速查詢行的資料結構，就像一本書的目錄就是一個索引，如果想在一本書中找到某個主題，一般會先找到對應頁碼。在mysql中，儲存引擎用類似的方法使用索引，先在索引中找到對應值，然後根據匹配的索引記

MySQL學習（七）：Innodb儲存引擎索引的實現原理詳解

概述在資料庫當中，索引就跟樹的目錄一樣用來加快資料的查詢速度，對於一個SQL查詢操作，根據索引快速過濾掉不符合要求的資料並定位到符合要求的資料，從而不需要掃描整個表來獲取所需的資料。

SOCKET編寫客戶端和服務端通訊，連線Mysql資料庫，java實現動態監控

詳細課設報告以及 C#、java 原始碼見碼雲： https://gitee.com/xyy9/socket github： https://github.com/XYYhub/socket

天天用事務，但是你知道MySQL事務的實現原理嗎？

https://mp.weixin.qq.com/s?__biz=MzAxNjk4ODE4OQ==&mid=2247488248&idx=2&sn=231e545c55eb69f2b88d9885f83c6c19&chksm=9bed338aac9aba9c4b4649fad314faa94694dc05fc271bc8f456b9cbc2d0bdeb7e7

MySQL索引，實現方式？

1、問題：資料庫為什麼要設計索引？

2、問題：雜湊(hash)比 樹(tree)更快，索引結構為什麼要設計成Tree型？

（1）、單行查詢

（2）、排序查詢

3、問題：資料庫索引為什麼使用B+樹？

第1種：二叉搜尋樹

第二種：B樹

什麼是區域性性原理？

B樹為何適合做索引？

第三種：B+樹

為什麼m叉的B+樹比BST的高度大大大大降低？

4、總結

相關推薦

2、問題：雜湊(hash)比樹(tree)更快，索引結構為什麼要設計成Tree型？