1. 程式人生 > 資料庫 >MySQL中使用binlog時格式該如何選擇

MySQL中使用binlog時格式該如何選擇

一、binlog的三種模式

1.statement level模式

每一條會修改資料的sql都會記錄到master的bin-log中。slave在複製的時候sql程序會解析成和原來master端執行過的相同的sql來再次執行。

優點:statement level下的優點,首先就是解決了row level下的缺點,不需要記錄每一行資料的變化,減少bin-log日誌量,節約io,提高效能。因為他只需要記錄在master上所執行的語句的細節,以及執行語句時候的上下文的資訊。

缺點:由於它是記錄的執行語句,所以為了讓這些語句在slave端也能正確執行,那麼他還必須記錄每條語句在執行的時候的一些相關資訊,也就是上下文資訊,以保證所有語句在slave端被執行的時候能夠得到和在master端執行時候相同的結果。另外就是,由於mysql現在發展比較快,很多的新功能加入,使mysql的複製遇到了不小的挑戰,自然複製的時候涉及到越複雜的內容,bug也就越容易出現。在statement level下,目前已經發現的就有不少情況會造成mysql的複製問題,主要是修改資料的時候使用了某些特定的函式或者功能的時候會出現,比如sleep()在有些版本就不能正確複製。

2.rowlevel模式

日誌中會記錄成每一行資料被修改的形式,然後在slave端再對相同的資料進行修改

優點:bin-log中可以不記錄執行的sql語句的上下文相關的資訊,僅僅只需要記錄那一條記錄被修改了,修改成什麼樣了。所以row level的日誌的內容會非常清楚的記錄下每一行資料修改的細節。而且不會出現某些特定情況下的儲存過程,或function,以及trigger的呼叫和觸發無法被正確複製的問題。

缺點:row level下,所有的執行的語句當記錄到日誌中的時候,都將以每行記錄的修改記錄,這樣可能會產生大量的日誌內容,比如有這樣一條update語句:update product set owner_member_id='d' where owner_member_id='a',執行之後,日誌中記錄的不是這條update語句所對應的事件(mysql是以事件的形式來記錄bin-log日誌),而是這條語句所更新的每一條記錄的變化情況,這樣就記錄成很多條記錄被更新的很多事件。自然,bin-log日誌的量會很大。

3.mixed模式

實際上就是前兩種模式的結合,在mixed模式下,mysql會根據執行的每一條具體的sql語句來區分對待記錄的日誌形式,也就是在statement和row之間選一種。新版本中的statement level還是和以前一樣,僅僅記錄執行的語句。而新版本的mysql中對row level模式被做了優化,並不是所有的修改都會以row level來記錄,像遇到表結構變更的時候就會以statement模式來記錄,如果sql語句確實就是update或者delete 等修改資料的語句,那麼還是會記錄所有行的變更。

二、我們使用binlog時應該選擇什麼格式呢

通過上面的介紹我們知道了binlog_format為STATEMENT在一些場景下能夠節省IO、加快同步速度,但是對於InnoDB這種事務引擎,在READ-COMMITTED、READ-UNCOMMITTED隔離級別或者引數innodb_locks_unsafe_for_binlog為ON時,禁止binlog_format=statement下的寫入,同時對於binlog_format=mixed這種對於非事務引擎、其他隔離級別預設寫statement格式的模式也只會記錄row格式。

> select @@tx_isolation;
+----------------+
| @@tx_isolation |
+----------------+
| READ-COMMITTED |
+----------------+

> create table t(c1 int) engine=innodb;

> set binlog_format=statement;

> insert into t values(1);
ERROR 1665 (HY000): Cannot execute statement: impossible to write to binary log since BINLOG_FORMAT = STATEMENT and at least one table uses a storage engine limited to row-based logging. InnoDB is limited to row-logging when transaction isolation level is READ COMMITTED or READ UNCOMMITTED.

> set binlog_format='mixed';

> show binlog events in 'mysql-bin.000004'\G
*************************** 3. row ***************************
 Log_name: mysql-bin.000002
  Pos: 287
 Event_type: Gtid
 Server_id: 3258621899
End_log_pos: 335
  Info: SET @@SESSION.GTID_NEXT= 'ed0eab2f-dfb0-11e7-8ad8-a0d3c1f20ae4:9375'
*************************** 4. row ***************************
 Log_name: mysql-bin.000002
  Pos: 335
 Event_type: Query
 Server_id: 3258621899
End_log_pos: 407
  Info: BEGIN
*************************** 5. row ***************************
 Log_name: mysql-bin.000002
  Pos: 407
 Event_type: Table_map
 Server_id: 3258621899
End_log_pos: 452
  Info: table_id: 124 (test.t)
*************************** 6. row ***************************
 Log_name: mysql-bin.000002
  Pos: 452
 Event_type: Write_rows_v1
 Server_id: 3258621899
End_log_pos: 498
  Info: table_id: 124 flags: STMT_END_F
*************************** 7. row ***************************
 Log_name: mysql-bin.000002
  Pos: 498
 Event_type: Xid
 Server_id: 3258621899
End_log_pos: 529
  Info: COMMIT /* xid=18422 */

為什麼READ-COMMITTED(RC)、READ-UNCOMMITTED下無法使用statement格式binlog?這是因為語句在事務中執行時,能夠看到其他事務提交或者正在寫入的資料。事務提交後binlog寫入,然後在從庫回放,就會看到的資料會與主庫寫入時候不對應。

例如:

有表:

+------+------+
| a | b |
+------+------+
| 10 | 2 |
| 20 | 1 |
+------+------+

我們做如下操作:

  1. session1在事務中做update,UPDATE t1 SET a=11 where b=2;滿足條件的有行(10,2)的一條記錄,並未提交。
  2. session2也做update操作,將行(20,1)更新為(20,2)並提交。
  3. 然後前面的sesssion1提交對行(10,2)的更新。

如果binlog中使用Statement格式記錄,在slave回放的時候,session2中的更新由於先提交會先回放,將行(20,1)更新為(20,2)。隨後回放session1的語句UPDATE t1 SET a=11 where b=2;語句就會將更新(10,2)和(20,2)兩行為(11,2)。這就導致主庫行為(11,2),(20,2),slave端為(11,(11,2)。

三、問題分析

上面是通過一個具體的例子說明。本質原因是RC事務隔離級別並不滿足事務序列化執行要求,沒有解決不可重複和幻象讀。

對於Repetable-Read和Serializable隔離級別就沒關係,Statement格式記錄。這是因為對於RR和Serializable,會保證可重複讀,在執行更新時候除了鎖定對應行還會在可能插入滿足條件行的時候加GAP Lock。上述case更新時,session1更新b =2的行時,會把所有行和範圍都鎖住,這樣session2在更新的時候就需要等待。從隔離級別的角度看Serializable滿足事務的序列化,因此binlog序列記錄事務statement格式是可以的。同時InnoDB的RR隔離級別實際已經解決了不可重複讀和幻象讀,滿足了ANSI SQL標準的事務隔離性要求。

READ-COMMITTED、READ-UNCOMMITTED的binlog_format限制可以說對於所有事務引擎都適用。

四、拓展內容

對於InnoDB RR和Serializable隔離級別下就一定能保證binlog記錄Statement格式麼?也不一定。在Innodb中存在引數innodb_locks_unsafe_for_binlog控制GAP Lock,該引數預設為OFF:

mysql> show variables like 'innodb_locks_unsafe_for_binlog';
+--------------------------------+-------+
| Variable_name     | Value |
+--------------------------------+-------+
| innodb_locks_unsafe_for_binlog | OFF |
+--------------------------------+-------+
1 row in set (0.01 sec)

即RR級別及以上除了行鎖還會加GAP Lock。但如果該引數設定為ON,對於當前讀就不會加GAP Lock,即在RR隔離級別下需要加Next-key lock的當前讀蛻化為READ-COMMITTED。所以如果此引數設定為ON時即便使用的事務隔離級別為Repetable-Read也不能保證從庫資料的正確性。

五、總結

對於線上業務,如果使用InnoDB等事務引擎,除非保證RR及以上隔離級別的寫入,一定不要設定為binlog_format為STATEMENT,否則業務就無法寫入了。而對於binlog_format為Mixed模式,RR隔離級別以下這些事務引擎也一定寫入的是ROW event。

到此這篇關於MySQL中使用binlog時格式該如何選擇的文章就介紹到這了,更多相關MySQL使用binlog時格式選擇內容請搜尋我們以前的文章或繼續瀏覽下面的相關文章希望大家以後多多支援我們!