InnoDB體系架構總結（二）

阿新 • • 發佈：2018-02-04

原子性 val 新版本 insert logfile net row syn 數據頁

事務

確保事務內的SQL都可以同步執行 要麽一起成功 要麽一起失敗。事務有四個特性原子性 一致性，隔離性，持久性

實現方式

開始事務的時候回家記錄記錄一個LSN日誌序列 當事務執行的時候 會首先在Innodb_log_buffer 日誌緩沖區插入事務日誌 redo log;當事務提交的時候 再根據不同的策略將緩沖日誌刷新到日誌文件和磁盤中。

將數據寫入InnoDB buffer pool 並加上獨占鎖

將UNDO信息寫入undo表的回滾段以備回滾數據的時候使用

更改緩存頁中的數據並將更新記錄寫入redo buffer

提交時根據innodb_flush_log_at_trx_commit的設置用不同的方式將redo buffer中的數據刷新到 redo log file中然後釋放獨占鎖

最後後臺IO線程根據將緩存中的數據刷新到磁盤

innodb_flush_log_at_trx_commit

默認設置為1  既在每次事務提交的時候 都會將緩沖池中的數據寫入到日誌文件中 並立即調用系統fsync 刷新日誌文件到磁盤
設置為0  每秒鐘執行數據寫入日誌並調用系統fsync
設置為2 只在事務提交的時候 屬性buffer中的redo 數據寫入日誌文件中 但是將日誌文件寫入到磁盤 則由系統配置確認

innodb_log_buffer_size

決定了重做日誌緩存的大小 如果是無語中有大量的插入或者更新數據 則需要調整默認配置 以提高性能

Redo log 重做日誌緩沖

主要是解決 提交的事務沒有執行完成但是數據庫奔潰了，當數據庫恢復之後，可以完整的恢復數據。
InnoDB存儲引擎會首先將重做日誌信息放到這個緩沖區 redo log buffer,然後按照不同的策略和頻率將buffer中的數據刷新到重做日誌中。

redo log 在磁盤中保存的名稱為 ib_logfile0 and ib_logfile1

Checkpoing技術

當事務提交時 需要先寫重做日誌 然後再修改頁。如果數據庫由於未知原因崩潰 而導致數據丟失的時候 需要通過重做日誌來完成

當數據庫發生宕機的時候 數據的恢復 不需要重做所有的日誌 這個時候就用到checkpoint。數據恢復的時候 只要恢復Checkpoint這個點，之後的數據即可。

對於InnoDB存儲引擎來來說 有一個LSN的數字 來標記版本的

數據庫並發

相對於串行處理 支持並發可以提高數據庫的利用率 但是數據庫並發可能會帶來下面的問題

更新丟失例如同一條數據被不同事物更新導致有一個事務更新錯誤

臟讀事務更新的數據還未提交就被另外一個事務讀取讀取的數據就有可能是臟數據

不可重復讀前後兩次讀取數據的過程中數據被另外的事務修改導致數據不一致

幻讀解決了不可重復讀但是如果另外一個事務同時提交了新的數據

innodb隔離級別

MariaDB [(none)]> show variables like "%tx_isolation%";
+---------------+-----------------+
| Variable_name | Value           |
+---------------+-----------------+
| tx_isolation  | REPEATABLE-READ |
+---------------+-----------------+

在同一個事務內的查詢 與事務開始時刻的數據 保持一致 ，但是存在幻讀

幻讀演示

session1 開啟事務

mysql> begin;
Query OK, 0 rows affected

mysql> select *  from phone;    ##事務開始的時候 電話是123456的數據只有一條數據
+----+----------+
| id | phone    |
+----+----------+
|  3 | 123456   |
+----+----------+

session2 如果是事務添加的話也是一樣的結果

## 這裏插入一條新的數據 電話也是 123456
INSERT INTO `tmp`.`phone` (`id`, `phone`) VALUES (‘2‘, ‘123456‘);

session1

mysql> select *  from phone;    ##這裏再次讀取數據 和事務開始的時候 數據相同 電話是123456的數據只有一條數據
+----+----------+
| id | phone    |
+----+----------+
|  3 | 123456   |
+----+----------+


## 這裏更新數據的時候 顯示有2行數據被更新了
mysql> update phone set phone=111111 where phone=123456;
Query OK, 2 rows affected
Rows matched: 2  Changed: 2 

## 這個時候 數據庫有兩條數據 被更新成111111了 出現了幻讀
mysql> select *  from phone;
+----+----------+
| id | phone    |
+----+----------+
|  2 | 111111   |
|  3 | 111111   |

解決方式加鎖

Session1 開啟一個事務並通過for update的方式加鎖

mysql> begin;

mysql> select *  from phone for update;

Session2 開啟一個事務

mysql> INSERT INTO `tmp`.`phone` (`id`, `phone`) VALUES (‘2‘, ‘123456‘);

1205 - Lock wait timeout exceeded; try restarting transaction

## 鎖等待超時 退出事務

MVCC

多版本並發控制協議 優點是 讀不加鎖 讀寫不沖突。InnoDB通過Undo Log實現了數據的多版本。而並發控制則是通過鎖來實現。讀操作可以分為兩種 一種是快照讀另外一種是當前讀

快照讀：讀取的是記錄的可見版本 也有可能是歷史版本 不用加鎖。
當前讀：讀取的是記錄的最新版本

InnoDB實現的MVVC沒有解決幻讀 可以通過加鎖的方式解決這個問題

innodb buffer pool

參考博客 ：https://michael.bouvy.net/blog/en/2015/01/18/understanding-mysql-innodb-buffer-pool-size/

查看包含的數據類型及大小

SELECT
    page_type AS Page_Type,
    sum(data_size) / 1024 / 1024 AS Size_in_MB
FROM
    information_schema.innodb_buffer_page
GROUP BY
    page_type
ORDER BY
    Size_in_MB DESC;

結果

+-------------------+------------+
| Page_Type         | Size_in_MB |
+-------------------+------------+
| INDEX             | 0.13445091 |
| UNKNOWN           | 0.00000000 |
| INODE             | 0.00000000 |
| IBUF_INDEX        | 0.00000000 |
| TRX_SYSTEM        | 0.00000000 |
| SYSTEM            | 0.00000000 |
| UNDO_LOG          | 0.00000000 |
| FILE_SPACE_HEADER | 0.00000000 |
| IBUF_BITMAP       | 0.00000000 |
+-------------------+------------+

一些重要的且常用的數據類型解釋

INDEX：B-Tree 索引這裏應該也包含行數據頁的數據因為聚簇索引中主鍵索引和數據是放在一起的

IBUF_INDEX: 插入緩存索引（下文 innodb_change_buffering）

UNKNOWN：未被使用或者不知道狀態的

TRX_SYSTEM：系統數據（有可能是指事務這裏不確定）

UNDO_LOG:Undo日誌(下文 Undo log)

innodb_change_buffering

https://dev.mysql.com/doc/refman/5.5/en/innodb-performance-change_buffering.html

大致意思如下

在 insert update 和 delete操作 如果涉及到索引列 特別是 secondary keys 的時候；如果所涉及到的數據不在buffer pool的時候，由於涉及到的數據 是無序的 那麽 頻繁的操作會導致大量的IO消耗。到數據被載入到buffer pool的時候，change buffer 會將數據合並在一起 然後更新到磁盤文件中。在空閑的時候，InnoDB的主線程 會合並buffer changes的數據。

由於change buffer 占用了部分buffer pool，降低了內存中可以緩存的數據頁，如果數據已經載入到buffer pool或者有很少的secondary indexs，最好禁用掉這個特性。

可設置的值如下

all
The default value: buffer inserts, delete-marking operations, and purges.

none
Do not buffer any operations.

inserts
Buffer insert operations.

deletes
Buffer delete-marking operations.

changes
Buffer both inserts and delete-marking operations.

purges
Buffer the physical deletion operations that happen in the background.

Undo log

Undo log是InnoDB MVCC事務特性的重要組成部分，記錄的是老版本的數據。主要作用是回滾數據，也可以根據undo log回溯到某個特別的版本的數據，實現MVCC。undo數據會首先被刷新到undo buffer中 之後在合適的時間 undo buffer中的數據 會被刷新到磁盤中，所有的undo log 會存放在ibd數據文件中（表空間）。Innodb 中存在purge線程，他們會查詢那些無人問津的舊版本數據或者也內容標記為刪除的操作也會被清理掉,從而保證undo log 不至於無限增長。

內存管理算法

通常，數據庫中的緩沖池是通過LRU即最近最少使用算法來管理，最少使用的也在LRU列表的尾端，當緩沖池中的數據滿了之後，會首先釋放LRU列表中的尾端的頁數據。

但是InnoDBd的存儲引擎在讀取到新的數據頁的時候，不是直接放到LRU列表的首部，而是根據midpoint位置。這樣的好處是如果是掃描數據的時候，通常需要操作許多的數據頁，而這些數據又僅僅是在這次查詢中需要，並不屬於活躍的熱數據。防止將最活躍的數據被移動到LRU尾部而被釋放。

InnoDB體系架構總結（二）

原子性 val 新版本 insert logfile net row syn 數據頁事務確保事務內的SQL都可以同步執行要麽一起成功要麽一起失敗。事務有四個特性原子性一致性，隔離性，持久性實現方式開始事務的時候回家記錄記錄一個LSN日誌序列當事務執行的時候

電商系統架構總結（二）

esp 簡單 zed expire cts project scac 允許類型二 Redis緩存考慮到將來服務器的升級擴展，使用redis代替.net內置緩存是比較理想的選擇。redis是非常成熟好用的緩存系統，安裝配置非常簡單，直接上官網下載安裝包安裝啟動就行

ElasticSearch學習總結（二）：ES介紹與架構說明

本文主要從概念以及架構層面對Elasticsearch做一個簡單的介紹，在介紹ES之前，會先對ES的“發動機”Lucene做一個簡單的介紹 1. Lucene介紹為了更深入地理解ElasticSearch的工作原理，特別是索引和查詢這兩個過程，理解Lucene的工作原理至關重要。本

遠程協助開發總結（二）

控制 amp 為什麽不能 username 開發 col dsc exce nec 遠程協助開發的過程中繼續總結針對開發總結一的問題，改正了一些地方 1.圖像和命令采用兩個套接字，為什麽不能采用一個套接字？遠程協助是快頻的通信，圖像需要不間斷的從受控端發送到控制端，發送接

[轉]畢設- 深入HBase架構解析（二）

node 角度發送 under 收集 .org fig 服務器 url 深入HBase架構解析（二）前言這是《深入HBase架構解析（一）》的續，不多廢話，繼續。。。。 HBase讀的實現通過前文的描述，我們知道在HBase寫時，相同Cell(RowKe

.net Kafka.Client多個Consumer Group對Topic消費不能完全覆蓋研究總結（二）

eight 分享 stat .com ima topic consumer 閱讀 padding 依據Partition和Consumer的Rebalance策略，找到Kafka.Client Rebalance代碼塊，還原本地環境，跟蹤調試，發現自定義Consumer G

命令和符號總結（二）

命令2017-05-13隨記—————————————————————————————— 20.uname 顯示系統內核信息 -r 顯示內核版本 -m 32位，64位本文出自 “一個Linux小白-學習運維” 博客，謝絕轉載！命令和符號總結（二）

設計模式總結（二）

靈活性 mil 一個 blog 以及對象模式結構型設計模式 con 建模設計模式可分為三種：創建型設計模式。結構型設計模式和行為型設計模式。一、創建型設計模式在設計模式中，創建型設計模式處理對象創建過程的設計模式。它依據實際情況來決定詳細如何創建對象。創建型模

String 經常用法最優算法實現總結（二）

lean ... itl min empty turn system then 實現 1. String getOrderedString(boolean isDuplicated, String … str) 說明： Orders all characters in

ListView優化總結（二）--Android

ride edittext over 變化業務適配器全部 number moved 3.使用Activity和Delegate與適配器交互這個內容是從書裏看到的，通過托付模式幫助開發人員把全部的業務邏輯從適配器中移到Activity中。以下是加入電話號碼的樣例

工作中能用到的基礎知識總結（二）

protected 構造函數 blog 繼承鏈附加調用初始化傳統 -s 簡介繼承、封裝和多態是面向對象編程的重要特性。要想運用好，就必須熟悉這三種特性，本篇說說我對封裝、繼承和多態相關的知識總結。知識點一、訪問修飾符 C#中類及

Android4.0設置界面改動總結（二）

idg 手機中新 pop istview _id 實例 cycle 系統應用今年1月份的時候。有和大家分享給予Android4.0+系統設置的改動：Android4.0設置界面改動總結時隔半年。回頭看看那個時候的改動。事實上是有非常多問題的，比方說

css基礎知識的復習總結（二）

文本 pin zoom clear head 導航設置 mage 之間文檔流、浮動、清除浮動、overflow、定位 1.文檔流 css文檔流，標準流是什麽？元素自上而下，自左而右，塊元素獨占一行，行內元素在一行上顯示，碰到父集元素的邊框換行。

freemarker寫select組件報錯總結（二）

popu sts 定義 style runt schedule size template marker 1、錯誤描寫敘述六月 25, 2014 11:32:49 下午 freemarker.log.JDK14LoggerFactory$JDK14Logge

I/O操做總結（二）

路徑名 con abc 虛擬參考 () dpa dir isa 文件的操作這一節我們來討論關於文件自身的操作不浪費唾沫了，用代碼說話…… 實例1：創建文件對象 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18

[轉載] java多線程總結（二）

判斷 home run 選擇作者得到生命周期 on() .com 轉載自：http://www.cnblogs.com/lwbqqyumidi/p/3817517.html 作者：Windstep 四.Java多線程的阻塞狀態與線程控制上文已經提到Java阻塞的

java基礎總結（二）---關鍵字

-- rem 關鍵字 rgs java err style ret 基礎總結 1.this 　　在java中， this 對象，它可以在類裏面來引用這個類的屬性和方法。　　1.它在方法內部使用，即這個方法所屬的對象的引用。　　2.它在構造器內部使用，表示該構造器正在初始

Jsp學習總結（二）

font 返回 dir ica 兩種方法 http 形參狀態信息 string Jsp腳本中的9大內置對象（都是_jspService()方法中的形參，或者是局部變量）： application：對應javax.servlet.ServletContext實例，代表

第79天：jQuery事件總結（二）

ide 是什麽導致另一個 prevent 移除 prop fun 限制上一篇講到jQuery中的事件，深入學習了加載DOM和事件綁定的相關知識，這篇主要深入討論jQuery事件中的合成事件、事件冒泡和事件移除等內容。　　一、合成事件　　jQuery有

LeetCode題目總結（二）

bsp 大小思路括號 font 一個 star art spa 這裏只提供個人的解題思路，不一定是最好的。 Problems 21-40 合並兩個排好序的鏈表，遞歸比較好一點，每次返回當前的結點。給定括號的個數，生成所有的可以的括號的組合方式，DFS，沒啥好說

InnoDB體系架構總結（二）

事務

實現方式

innodb_flush_log_at_trx_commit

innodb_log_buffer_size

Redo log 重做日誌緩沖

Checkpoing技術

數據庫並發

innodb隔離級別

幻讀演示

解決方式 加鎖

MVCC

innodb buffer pool

查看包含的數據類型及大小

結果

一些重要的且常用的數據類型解釋

innodb_change_buffering

Undo log

內存管理算法

相關推薦

解決方式加鎖