1. 程式人生 > >重做日誌相關

重做日誌相關

redo_log 記錄 寫到 innodb 修改 enter 技術 等待 let

Ⅰ、事務的實現

這裏我們先拋出答案,通過答案再展開分析

特性 實現
A(原子性) redo
C(一致性) undo
I(隔離性) lock
D(持久性) redo/undo

本節針對redo展開分析

Ⅱ、redo詳解

2.1 redo log buffer

  • redo就是我們常說的重做日誌,用來實現持久性
  • mysql目錄下兩個ib_logfile文件,就是重做日誌文件,在ssd場景下至少設置為4G
  • redo log裏面記錄的是每個page修改操作的物理邏輯日誌(不是完全的二進制的差異值,比如一個sql修改了一千萬行,一千萬個page被修改了,那記錄的是1000w page的變化,而不是sql語句)

redo由redo log buffer和redo log file組成,重做日誌先寫入一塊內存,再定期刷新到磁盤

先看下redo log buffer

它由很多個log block組成,每個log block 512個字節,不需要doublewrite
技術分享圖片

innodb_log_buffer_size    8M即可,不需要太大,一秒鐘寫滿8M不太可能

redo log刷盤的條件

①master thread    每秒從內存刷到磁盤
  5.6版本後,增加innodb_flush_log_at_timeout參數,可以設置刷新間隔,默認為1,調大一點可減少io,提升性能,但不建議

②redo log buffer  使用大於1/2也會刷

③事務提交時進行刷新,即使上面兩個條件不滿足(事務持久性的要求)
  innodb_flush_log_at_trx_commit={0|1|2},默認為1,事務提交時將redo log buffer寫到磁盤(即使上面兩個條件不滿足,這樣crash了就還可以通過redo恢復),只有是1的時候innodb才能真正達到持久性的標準
  事務對page做了修改,提交的時候並不需要保證贓頁刷到磁盤,只需要保證將對應修改的日誌刷過去就可以了
  0表示交給master thread每秒刷新,事務提交不將redo log buffer刷到磁盤,最多會丟失1s的事務
  2表示事務提交時僅將redo log buffer寫到操作系統緩存,所以mysql重啟,只要操作系統沒重啟,那數據還是在的額

2.2 redo log file

先弄個圖看看redo buffer刷盤吧

技術分享圖片

每個ib_logfile都分為很多個512bits的塊,最前頭2k是留出來寫checkpoint的,cp1和cp2輪詢寫確保cp不會壞掉,沒有oracle的歸檔

優點: 這樣做的好處是不需要歸檔,少了IO操作
缺點: 如果redo_log_file太小則可能需要等待,因為當要覆蓋log_file中的log_block時,如果該log_block中的臟頁還沒有進行刷新的話,則需要等待這個臟頁進行刷新
所以需要把redo log file設置的盡可能的大

redo日誌分類

物理日誌:記錄整個page的變化(diff)

邏輯日誌:Like SQL語句

物理邏輯日誌:根據page進行記錄,內容邏輯

redo log file與redo log buffer內容一致

+---------------+----------+---------+---------------+
| redo_log_type | space no | page no | redo log body |
+---------------+----------+---------+---------------+
#  redo log 類型  表空間號     頁號    redo log 內容
MLOG_REC_INSERT
+------+--------+------+---------+------------+-------+---------+-----------+----------+
| type | space  | page | cur_rec | len &      | info  | origin  | mis_match | rec body |
|      |   no   |  no  | _offset | extra_info | _bits | _offset | _index    |          |
+------+--------+------+---------+------------+-------+---------+-----------+----------+
MLOG_REC_DELETE
+------+----------+---------+--------+
| type | space no | page no | offset |
+------+----------+---------+--------+

rec body根據page的變化來記錄,而不是根據操作SQL來記錄,所以偏物理日誌
因為還記錄了redo log body,一個具體操作,所以又叫邏輯

每種不同類型的redo log的內在格式可能長得不一樣

相關參數

innodb_log_file_size 單個redo文件大小(推薦8G,官方推薦等於bp)
  之前不建議調大因為有bug,如果調大,恢復速度會很慢O(N^2)
  5.5版本的redo文件總大小(num * size)最大只能4G
  5.6之後限制未512G,調大後唯一的問題就是恢復的內容變多了
  5.6之後,正常關閉MySQL,然後調整該值,會自動調整文件大小
innodb_log_files_in_group
innodb_log_group_home_dir 和數據文件分開,選擇更快的磁盤

重做日誌相關