獲取 MySQL innodb B+tree 的高度的方法
前言
MySQL 的 innodb 引擎之所以使用 B+tree 來儲存索引,就是想盡量減少資料查詢時磁碟 IO 次數。樹的高度直接影響了查詢的效能。一般樹的高度在 3~4 層較為適宜。資料庫分表的目的也是為了控制樹的高度。那麼如何獲取樹的高度呢?下面使用一個示例來說明如何獲取樹的高度。
示例資料準備
建表語句如下:
CREATE TABLE `user` ( `id` int(11) NOT NULL AUTO_INCREMENT,`name` varchar(100) CHARACTER SET latin1 DEFAULT NULL,`age` int(11) DEFAULT NULL,PRIMARY KEY (`id`),KEY `name` (`name`),KEY `age` (`age`) ) ENGINE=InnoDB DEFAULT CHARSET=utf8
表中插入100萬條資料。資料如下:
mysql> select * from user limit 2\G *************************** 1. row *************************** id: 110000 name: ab age: 100 *************************** 2. row *************************** id: 110001 name: ab age: 100 2 rows in set (0.00 sec)
通過查詢相關資料表獲取樹的高度
以 MySQL5.6 版本為例說明如何獲取樹的高度。
首先獲取 page_no
mysql> SELECT b.name,a.name,index_id,type,a.space,a.PAGE_NO FROM information_schema.INNODB_SYS_INDEXES a,information_schema.INNODB_SYS_TABLES b WHERE a.table_id = b.table_id AND a.space <> 0 and b.name='test/user'; +-----------+---------+----------+------+-------+---------+ | name | name | index_id | type | space | PAGE_NO | +-----------+---------+----------+------+-------+---------+ | test/user | PRIMARY | 22 | 3 | 6 | 3 | | test/user | name | 23 | 0 | 6 | 4 | | test/user | age | 24 | 0 | 6 | 5 | +-----------+---------+----------+------+-------+---------+ 3 rows in set (0.00 sec)
page_no 是索引樹中Root頁的序列號。其它各項的含義可以參照:
https://dev.mysql.com/doc/refman/5.6/en/innodb-sys-indexes-table.html
再讀取頁的大小
mysql> show global variables like 'innodb_page_size'; +------------------+-------+ | Variable_name | Value | +------------------+-------+ | innodb_page_size | 16384 | +------------------+-------+ 1 row in set (0.00 sec)
最後讀取索引樹的高度
$ hexdump -s 49216 -n 10 ./user.ibd 000c040 0200 0000 0000 0000 1600 000c04a
可以發現 PAGE_LEVEL 為 0200,表示這棵二級索引樹的高度為 3。後面的 1600 是索引的 index_id 值。十六進位制的 16 轉換為十進位制數字是 22。這個 22 正好就是上面主鍵的 index_id。
上面 hexdump 命令中 49216 是怎麼算出來的?公式是 page_no * innodb_page_size + 64。
3*16384+64=49216
我們在用這個方式檢視下其他兩個索引的高度。
$ hexdump -s 65600 -n 10 ./user.ibd 0010040 0100 0000 0000 0000 1700 001004a $ hexdump -s 81984 -n 10 ./user.ibd 0014040 0200 0000 0000 0000 1800 001404a
可見,name 索引的高度是 2,age 索引的高度是 3。
根據索引的結構估算
如果你沒有資料庫伺服器的許可權。自己也可以根據資料庫索引結構進行估算樹的高度。
根據 B+Tree 結構,非葉子節點儲存的是索引資料,葉子節點儲存的是每行的所有資料。
非葉子節點每個索引項的大小是,資料大小+指標大小。假設指標大小為 8 個位元組。每頁不會被佔滿,預留1/5的空隙。下面我們估算下 name 和 age 兩個索引的高度。
name 索引高度估算
非葉子節點每頁存放的索引項數量。每頁大小是 16k。name 的值為 ab。佔2個位元組。每項資料大小是 2+8=10位元組。每頁能存放的索引項數量是 16384 * 0.8 / 10 = 1310 個。
葉子節點每頁存放的索引數量。每頁大小是 16k。每項資料大小是 4+2+8=14 個位元組。沒頁能存放的索引數量是 16384 * 0.8 / 14 = 936 個。
兩層能存放 1310*936=1226160 個數據記錄。可見120萬條記錄以下,樹的高度為2。
age 索引高度估算
非葉子節點每頁存放的索引項數量。每頁大小是 16k。age 的型別為 int。佔4個位元組。每項資料大小是 4+8=12位元組。每頁能存放的索引項數量是 16384 * 0.8 / 12 = 1092 個。
葉子節點每頁存放的索引數量。每頁大小是 16k。每項資料大小是 4+4+8=16 個位元組。沒頁能存放的索引數量是 16384 * 0.8 / 16 = 819 個。
兩層能存放 1092*819=894348 個數據記錄。可見90萬條記錄以下,樹的高度為2。100萬條為 3 層。
其它工具
還有一個小工具可以檢視。InnoDB 表空間視覺化工具innodb_ruby
以上就是獲取 MySQL innodb 的 B+tree 的高度的示例的詳細內容,更多關於MySQL innodb 的 B+tree 的資料請關注我們其它相關文章!