重做日誌相關
阿新 • • 發佈:2018-05-20
redo_log 記錄 寫到 innodb 修改 enter 技術 等待 let
Ⅰ、事務的實現
這裏我們先拋出答案,通過答案再展開分析
特性 | 實現 |
---|---|
A(原子性) | redo |
C(一致性) | undo |
I(隔離性) | lock |
D(持久性) | redo/undo |
本節針對redo展開分析
Ⅱ、redo詳解
2.1 redo log buffer
- redo就是我們常說的重做日誌,用來實現持久性
- mysql目錄下兩個ib_logfile文件,就是重做日誌文件,在ssd場景下至少設置為4G
- redo log裏面記錄的是每個page修改操作的物理邏輯日誌(不是完全的二進制的差異值,比如一個sql修改了一千萬行,一千萬個page被修改了,那記錄的是1000w page的變化,而不是sql語句)
redo由redo log buffer和redo log file組成,重做日誌先寫入一塊內存,再定期刷新到磁盤
先看下redo log buffer
它由很多個log block組成,每個log block 512個字節,不需要doublewrite
innodb_log_buffer_size 8M即可,不需要太大,一秒鐘寫滿8M不太可能
redo log刷盤的條件
①master thread 每秒從內存刷到磁盤 5.6版本後,增加innodb_flush_log_at_timeout參數,可以設置刷新間隔,默認為1,調大一點可減少io,提升性能,但不建議 ②redo log buffer 使用大於1/2也會刷 ③事務提交時進行刷新,即使上面兩個條件不滿足(事務持久性的要求) innodb_flush_log_at_trx_commit={0|1|2},默認為1,事務提交時將redo log buffer寫到磁盤(即使上面兩個條件不滿足,這樣crash了就還可以通過redo恢復),只有是1的時候innodb才能真正達到持久性的標準 事務對page做了修改,提交的時候並不需要保證贓頁刷到磁盤,只需要保證將對應修改的日誌刷過去就可以了 0表示交給master thread每秒刷新,事務提交不將redo log buffer刷到磁盤,最多會丟失1s的事務 2表示事務提交時僅將redo log buffer寫到操作系統緩存,所以mysql重啟,只要操作系統沒重啟,那數據還是在的額
2.2 redo log file
先弄個圖看看redo buffer刷盤吧
每個ib_logfile都分為很多個512bits的塊,最前頭2k是留出來寫checkpoint的,cp1和cp2輪詢寫確保cp不會壞掉,沒有oracle的歸檔
優點: 這樣做的好處是不需要歸檔,少了IO操作
缺點: 如果redo_log_file太小則可能需要等待,因為當要覆蓋log_file中的log_block時,如果該log_block中的臟頁還沒有進行刷新的話,則需要等待這個臟頁進行刷新
所以需要把redo log file設置的盡可能的大
redo日誌分類
物理日誌:記錄整個page的變化(diff)
邏輯日誌:Like SQL語句
物理邏輯日誌:根據page進行記錄,內容邏輯
redo log file與redo log buffer內容一致
+---------------+----------+---------+---------------+
| redo_log_type | space no | page no | redo log body |
+---------------+----------+---------+---------------+
# redo log 類型 表空間號 頁號 redo log 內容
MLOG_REC_INSERT
+------+--------+------+---------+------------+-------+---------+-----------+----------+
| type | space | page | cur_rec | len & | info | origin | mis_match | rec body |
| | no | no | _offset | extra_info | _bits | _offset | _index | |
+------+--------+------+---------+------------+-------+---------+-----------+----------+
MLOG_REC_DELETE
+------+----------+---------+--------+
| type | space no | page no | offset |
+------+----------+---------+--------+
rec body根據page的變化來記錄,而不是根據操作SQL來記錄,所以偏物理日誌
因為還記錄了redo log body,一個具體操作,所以又叫邏輯
每種不同類型的redo log的內在格式可能長得不一樣
相關參數
innodb_log_file_size 單個redo文件大小(推薦8G,官方推薦等於bp)
之前不建議調大因為有bug,如果調大,恢復速度會很慢O(N^2)
5.5版本的redo文件總大小(num * size)最大只能4G
5.6之後限制未512G,調大後唯一的問題就是恢復的內容變多了
5.6之後,正常關閉MySQL,然後調整該值,會自動調整文件大小
innodb_log_files_in_group
innodb_log_group_home_dir 和數據文件分開,選擇更快的磁盤
重做日誌相關