mysql 學習--緩衝池(buffer pool)

阿新 • • 發佈：2020-11-25

應用系統分層架構，為了加速資料訪問，會把最常訪問的資料，放在快取(cache)裡，避免每次都去訪問資料庫。

作業系統，會有緩衝池(buffer pool)機制，避免每次訪問磁碟，以加速資料的訪問。

MySQL作為一個儲存系統，同樣具有緩衝池(buffer pool)機制，以避免每次查詢資料都進行磁碟IO。

今天，和大家聊一聊InnoDB的緩衝池。

InnoDB的緩衝池快取什麼？有什麼用？

快取表資料與索引資料，把磁碟上的資料載入到緩衝池，避免每次訪問都進行磁碟IO，起到加速訪問的作用。

速度快，那為啥不把所有資料都放到緩衝池裡？

凡事都具備兩面性，拋開資料易失性不說，訪問快速的反面是儲存容量小：

（1）快取訪問快，但容量小，資料庫儲存了200G資料，快取容量可能只有64G；

（2）記憶體訪問快，但容量小，買一臺筆記本磁碟有2T，記憶體可能只有16G；

因此，只能把“最熱”的資料放到“最近”的地方，以“最大限度”的降低磁碟訪問。

如何管理與淘汰緩衝池，使得效能最大化呢？

在介紹具體細節之前，先介紹下“預讀”的概念。

什麼是預讀？

磁碟讀寫，並不是按需讀取，而是按頁讀取，一次至少讀一頁資料（一般是4K），如果未來要讀取的資料就在頁中，就能夠省去後續的磁碟IO，提高效率。

預讀為什麼有效？

資料訪問，通常都遵循“集中讀寫”的原則，使用一些資料，大概率會使用附近的資料，這就是所謂的“區域性性原理”，它表明提前載入是有效的，確實能夠減少磁碟IO。

按頁(4K)讀取，和InnoDB的緩衝池設計有啥關係？

（1）磁碟訪問按頁讀取能夠提高效能，所以緩衝池一般也是按頁快取資料；

（2）預讀機制啟示了我們，能把一些“可能要訪問”的頁提前加入緩衝池，避免未來的磁碟IO操作；

InnoDB是以什麼演算法，來管理這些緩衝頁呢？

最容易想到的，就是LRU(Least recently used)。

畫外音：memcache，OS都會用LRU來進行頁置換管理，但MySQL的玩法並不一樣。

傳統的LRU是如何進行緩衝頁管理？

最常見的玩法是，把入緩衝池的頁放到LRU的頭部，作為最近訪問的元素，從而最晚被淘汰。這裡又分兩種情況：

（1）頁已經在緩衝池裡

，那就只做“移至”LRU頭部的動作，而沒有頁被淘汰；

（2）頁不在緩衝池裡，除了做“放入”LRU頭部的動作，還要做“淘汰”LRU尾部頁的動作；

如上圖，假如管理緩衝池的LRU長度為10，緩衝了頁號為1，3，5…，40，7的頁。

假如，接下來要訪問的資料在頁號為4的頁中：

（1）頁號為4的頁，本來就在緩衝池裡；

（2）把頁號為4的頁，放到LRU的頭部即可，沒有頁被淘汰；

畫外音：為了減少資料移動，LRU一般用連結串列實現。

假如，再接下來要訪問的資料在頁號為50的頁中：

（1）頁號為50的頁，原來不在緩衝池裡；

（2）把頁號為50的頁，放到LRU頭部，同時淘汰尾部頁號為7的頁；

傳統的LRU緩衝池演算法十分直觀，OS，memcache等很多軟體都在用，MySQL為啥這麼矯情，不能直接用呢？

這裡有兩個問題：

（1）預讀失效；

（2）緩衝池汙染；

什麼是預讀失效？

由於預讀(Read-Ahead)，提前把頁放入了緩衝池，但最終MySQL並沒有從頁中讀取資料，稱為預讀失效。

如何對預讀失效進行優化？

要優化預讀失效，思路是：

（1）讓預讀失敗的頁，停留在緩衝池LRU裡的時間儘可能短；

（2）讓真正被讀取的頁，才挪到緩衝池LRU的頭部；

以保證，真正被讀取的熱資料留在緩衝池裡的時間儘可能長。

具體方法是：

（1）將LRU分為兩個部分：

新生代(new sublist)
老生代(old sublist)

（2）新老生代收尾相連，即：新生代的尾(tail)連線著老生代的頭(head)；

（3）新頁（例如被預讀的頁）加入緩衝池時，只加入到老生代頭部：

如果資料真正被讀取（預讀成功），才會加入到新生代的頭部
如果資料沒有被讀取，則會比新生代裡的“熱資料頁”更早被淘汰出緩衝池

舉個例子，整個緩衝池LRU如上圖：

（1）整個LRU長度是10；

（2）前70%是新生代；

（3）後30%是老生代；

（4）新老生代首尾相連；

假如有一個頁號為50的新頁被預讀加入緩衝池：

（1）50只會從老生代頭部插入，老生代尾部（也是整體尾部）的頁會被淘汰掉；

（2）假設50這一頁不會被真正讀取，即預讀失敗，它將比新生代的資料更早淘汰出緩衝池；

假如50這一頁立刻被讀取到，例如SQL訪問了頁內的行row資料：

（1）它會被立刻加入到新生代的頭部；

（2）新生代的頁會被擠到老生代，此時並不會有頁面被真正淘汰；

改進版緩衝池LRU能夠很好的解決“預讀失敗”的問題。

畫外音：但也不要因噎廢食，因為害怕預讀失敗而取消預讀策略，大部分情況下，區域性性原理是成立的，預讀是有效的。

新老生代改進版LRU仍然解決不了緩衝池汙染的問題。

什麼是MySQL緩衝池汙染？

當某一個SQL語句，要批量掃描大量資料時，可能導致把緩衝池的所有頁都替換出去，導致大量熱資料被換出，MySQL效能急劇下降，這種情況叫緩衝池汙染。

例如，有一個數據量較大的使用者表，當執行：

select * from user where name like "%shenjian%";

雖然結果集可能只有少量資料，但這類like不能命中索引，必須全表掃描，就需要訪問大量的頁：

（1）把頁加到緩衝池（插入老生代頭部）；

（2）從頁裡讀出相關的row（插入新生代頭部）；

（3）row裡的name欄位和字串shenjian進行比較，如果符合條件，加入到結果集中；

（4）…直到掃描完所有頁中的所有row…

如此一來，所有的資料頁都會被載入到新生代的頭部，但只會訪問一次，真正的熱資料被大量換出。

怎麼這類掃碼大量資料導致的緩衝池汙染問題呢？

MySQL緩衝池加入了一個“老生代停留時間視窗”的機制：

（1）假設T=老生代停留時間視窗；

（2）插入老生代頭部的頁，即使立刻被訪問，並不會立刻放入新生代頭部；

（3）只有滿足“被訪問”並且“在老生代停留時間”大於T，才會被放入新生代頭部；

繼續舉例，假如批量資料掃描，有51，52，53，54，55等五個頁面將要依次被訪問。

如果沒有“老生代停留時間視窗”的策略，這些批量被訪問的頁面，會換出大量熱資料。

加入“老生代停留時間視窗”策略後，短時間內被大量載入的頁，並不會立刻插入新生代頭部，而是優先淘汰那些，短期內僅僅訪問了一次的頁。

而只有在老生代呆的時間足夠久，停留時間大於T，才會被插入新生代頭部。

上述原理，對應InnoDB裡哪些引數？

有三個比較重要的引數。

引數：innodb_buffer_pool_size

介紹：配置緩衝池的大小，在記憶體允許的情況下，DBA往往會建議調大這個引數，越多資料和索引放到記憶體裡，資料庫的效能會越好。

引數：innodb_old_blocks_pct

介紹：老生代佔整個LRU鏈長度的比例，預設是37，即整個LRU中新生代與老生代長度比例是63:37。

畫外音：如果把這個引數設為100，就退化為普通LRU了。

引數：innodb_old_blocks_time

介紹：老生代停留時間視窗，單位是毫秒，預設是1000，即同時滿足“被訪問”與“在老生代停留時間超過1秒”兩個條件，才會被插入到新生代頭部。

總結

（1）緩衝池(buffer pool)是一種常見的降低磁碟訪問的機制；

（2）緩衝池通常以頁(page)為單位快取資料；

（3）緩衝池的常見管理演算法是LRU，memcache，OS，InnoDB都使用了這種演算法；

（4）InnoDB對普通LRU進行了優化：

將緩衝池分為老生代和新生代，入緩衝池的頁，優先進入老生代，頁被訪問，才進入新生代，以解決預讀失效的問題
頁被訪問，且在老生代停留時間超過配置閾值的，才進入新生代，以解決批量資料訪問，大量熱資料淘汰的問題

思路，比結論重要。

解決了什麼問題，比方案重要。

mysql 學習--緩衝池(buffer pool)

應用系統分層架構，為了加速資料訪問，會把最常訪問的資料，放在快取(cache)裡，避免每次都去訪問資料庫。

詳解MySQL中的緩衝池（buffer pool）

Mysql 中資料是要落盤的，這點大家都知道。讀寫磁碟速度是很慢的，尤其和記憶體比起來更是沒的說。但是，我們平時在執行 SQL 時，無論寫操作還是讀操作都能很快得到結果，並沒有預想中的那麼慢。

MySQL的查詢快取和Buffer Pool

一、Caches - 查詢快取下圖是MySQL官網給出的：MySQL架構體系圖。人們常說的查詢快取就是下圖中的Cache部分。

MySQL Innodb Engine--修改資料時先寫Buffer Pool還是先寫Redo Log

問題描述在做DML操作時，是先修改buffer pool資料，還是先記錄redo log呢？答案：先修改buffer pool資料，然後再記錄redo log。

MySQL 轉儲和載入 InnoDB 緩衝池（資料預熱）

對於效能，擁有一個暖的 InnoDB 緩衝池非常重要。那是什麼意思？暖緩衝池意味著生產工作負載所需的最常用的頁面（工作集）已經載入到記憶體中（在緩衝池中）。如果是這樣，MySQL 不需要在每次需要最常用的頁面時從

Buffer Pool 為了讓 MySQL 變快都做了什麼?

a:hover, a:visited, a:link, a:active { text-decoration: none !important; -webkit-box-shadow: none !important; box-shadow: none !important }

MySQL怎麼緩解讀的壓力的？---buffer pool

每當我們想要緩解讀，一般會想到什麼？預讀取，快取快取快取，其實就是將高頻訪問的資料放到記憶體裡面，減少讀盤的次數。

Mysql Buffer Pool

Buffer Poll Buffer Pool 中預設的快取頁大小和在磁碟上預設的頁大小是一樣的，都是 16KB，為了更好的管理這些在 Buffer Pool 中的快取頁，設計 InnoDB 的大叔為每一個快取頁都建立了一些所謂的控制資訊，這些控制

一文了解MySQL的Buffer Pool

摘要：Innodb 儲存引擎設計了一個緩衝池（Buffer Pool），來提高資料庫的讀寫效能。

MySQL中讀頁緩衝區buffer pool

Buffer pool 我們都知道我們讀取頁面是需要將其從磁碟中讀到記憶體中，然後等待CPU對資料進行處理。我們直到從磁碟中讀取資料到記憶體的過程是十分慢的，所以我們讀取的頁面需要將其快取起來，所以MySQL有這個buffer

golng mysql庫連線池分析

0x1 背景 golang的協程是好用，但是有時候瓶頸並不在語言上，而是在後面的資料來源上面，例如我們常見的mysql，redis等，當一個後端服務很多請求的時候，語言是能hold得住，但是

MySql學習day03：資料表之間的連線、查詢詳解

主鍵：關鍵字：primary key 特點：不能為null，並且唯一。主鍵分類：邏輯主鍵:例如ID,不代表實際的業務意義,只是用來唯一標識一條記錄(推薦)

MySQL學習（七）：Innodb儲存引擎索引的實現原理詳解

概述在資料庫當中，索引就跟樹的目錄一樣用來加快資料的查詢速度，對於一個SQL查詢操作，根據索引快速過濾掉不符合要求的資料並定位到符合要求的資料，從而不需要掃描整個表來獲取所需的資料。

mysql學習之引擎、Explain和許可權的深入講解

引擎簡介 Innodb引擎 Innodb引擎提供了對資料庫ACID事務的支援，並且實現了SQL標準的四種隔離級別。該引擎還提供了行級鎖和外來鍵約束，它的設計目標是處理大容量資料庫系統，它本身其實就是基於MySQL後臺的完整資

MySQL學習日記-隨筆PART1

MySQL 1、sql、DB、DBMS分別是什麼，他們之間的關係？ DB: DataBase（資料庫，資料庫實際上在硬碟上以檔案的形式存在）

mySQL學習筆記二

DDL：操作資料庫，表 CRUD操作資料庫 1.C（create）：建立 2.R（Retrieve)：查 3.U（Update) :修改

MySQL學習筆記

一、啟動MySQL 1、 win+R或者CMD中輸入“services.msc”開啟服務，在裡面找到MYSQL服務進行控制

MySQL學習筆記（16）--關係型資料庫設計正規化

·概念正規化：Normal Format，符合某一種級別的關係模式的集合，表示一個關係內部各屬性之間的聯絡的合理化程度

MySQL 學習總結之初步瞭解 InnoDB 儲存引擎的架構設計

一、儲存引擎上節我們最後說到，SQL 的執行計劃是執行器元件呼叫儲存引擎的介面來完成的。

Java使用MySQL實現連線池程式碼例項

官方：資料庫連線池（Connection pooling）是程式啟動時建立足夠的資料庫連線，並將這些連線組成一個連線池，由程式動態地對連線池中的連線進行申請，使用，釋放。

mysql 學習--緩衝池(buffer pool)

相關推薦