1. 程式人生 > 資料庫 >獲取 MySQL innodb B+tree 的高度的方法

獲取 MySQL innodb B+tree 的高度的方法

前言

MySQL 的 innodb 引擎之所以使用 B+tree 來儲存索引,就是想盡量減少資料查詢時磁碟 IO 次數。樹的高度直接影響了查詢的效能。一般樹的高度在 3~4 層較為適宜。資料庫分表的目的也是為了控制樹的高度。那麼如何獲取樹的高度呢?下面使用一個示例來說明如何獲取樹的高度。

示例資料準備

建表語句如下:

CREATE TABLE `user` (
`id` int(11) NOT NULL AUTO_INCREMENT,`name` varchar(100) CHARACTER SET latin1 DEFAULT NULL,`age` int(11) DEFAULT NULL,PRIMARY KEY (`id`),KEY `name` (`name`),KEY `age` (`age`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8

表中插入100萬條資料。資料如下:

mysql> select * from user limit 2\G
*************************** 1. row ***************************
id: 110000
name: ab
age: 100
*************************** 2. row ***************************
id: 110001
name: ab
age: 100
2 rows in set (0.00 sec)

通過查詢相關資料表獲取樹的高度

以 MySQL5.6 版本為例說明如何獲取樹的高度。

首先獲取 page_no

mysql> SELECT b.name,a.name,index_id,type,a.space,a.PAGE_NO FROM information_schema.INNODB_SYS_INDEXES a,information_schema.INNODB_SYS_TABLES b WHERE a.table_id = b.table_id AND a.space <> 0 and b.name='test/user';
+-----------+---------+----------+------+-------+---------+
| name | name | index_id | type | space | PAGE_NO |
+-----------+---------+----------+------+-------+---------+
| test/user | PRIMARY | 22 | 3 | 6 | 3 |
| test/user | name | 23 | 0 | 6 | 4 |
| test/user | age | 24 | 0 | 6 | 5 |
+-----------+---------+----------+------+-------+---------+
3 rows in set (0.00 sec)

page_no 是索引樹中Root頁的序列號。其它各項的含義可以參照:
https://dev.mysql.com/doc/refman/5.6/en/innodb-sys-indexes-table.html

再讀取頁的大小

mysql> show global variables like 'innodb_page_size';
+------------------+-------+
| Variable_name | Value |
+------------------+-------+
| innodb_page_size | 16384 |
+------------------+-------+
1 row in set (0.00 sec) 

最後讀取索引樹的高度

$ hexdump -s 49216 -n 10 ./user.ibd
000c040 0200 0000 0000 0000 1600
000c04a

可以發現 PAGE_LEVEL 為 0200,表示這棵二級索引樹的高度為 3。後面的 1600 是索引的 index_id 值。十六進位制的 16 轉換為十進位制數字是 22。這個 22 正好就是上面主鍵的 index_id。
上面 hexdump 命令中 49216 是怎麼算出來的?公式是 page_no * innodb_page_size + 64。
3*16384+64=49216

我們在用這個方式檢視下其他兩個索引的高度。

$ hexdump -s 65600 -n 10 ./user.ibd
0010040 0100 0000 0000 0000 1700
001004a
$ hexdump -s 81984 -n 10 ./user.ibd
0014040 0200 0000 0000 0000 1800
001404a

可見,name 索引的高度是 2,age 索引的高度是 3。

根據索引的結構估算

如果你沒有資料庫伺服器的許可權。自己也可以根據資料庫索引結構進行估算樹的高度。
根據 B+Tree 結構,非葉子節點儲存的是索引資料,葉子節點儲存的是每行的所有資料。
非葉子節點每個索引項的大小是,資料大小+指標大小。假設指標大小為 8 個位元組。每頁不會被佔滿,預留1/5的空隙。下面我們估算下 name 和 age 兩個索引的高度。

name 索引高度估算

非葉子節點每頁存放的索引項數量。每頁大小是 16k。name 的值為 ab。佔2個位元組。每項資料大小是 2+8=10位元組。每頁能存放的索引項數量是 16384 * 0.8 / 10 = 1310 個。
葉子節點每頁存放的索引數量。每頁大小是 16k。每項資料大小是 4+2+8=14 個位元組。沒頁能存放的索引數量是 16384 * 0.8 / 14 = 936 個。
兩層能存放 1310*936=1226160 個數據記錄。可見120萬條記錄以下,樹的高度為2。

age 索引高度估算

非葉子節點每頁存放的索引項數量。每頁大小是 16k。age 的型別為 int。佔4個位元組。每項資料大小是 4+8=12位元組。每頁能存放的索引項數量是 16384 * 0.8 / 12 = 1092 個。
葉子節點每頁存放的索引數量。每頁大小是 16k。每項資料大小是 4+4+8=16 個位元組。沒頁能存放的索引數量是 16384 * 0.8 / 16 = 819 個。
兩層能存放 1092*819=894348 個數據記錄。可見90萬條記錄以下,樹的高度為2。100萬條為 3 層。

其它工具

還有一個小工具可以檢視。InnoDB 表空間視覺化工具innodb_ruby

以上就是獲取 MySQL innodb 的 B+tree 的高度的示例的詳細內容,更多關於MySQL innodb 的 B+tree 的資料請關注我們其它相關文章!