1. 程式人生 > >MySQL從庫實用技能(一)--巧用slave_exec_mode引數

MySQL從庫實用技能(一)--巧用slave_exec_mode引數

想必從庫異常中斷的情況不在少數,其中報錯資訊中1032及1062的錯誤佔了不少的比重

錯誤1032指的是從庫中找不到對應行的記錄

錯誤1062指的是主鍵衝突

遇到此報錯時,大多DBA會使用如下方法進行處理

1 手動處理

方法一: 找出引起異常的資料然後手動在從庫處理後重啟SQL執行緒繼續觀察;

根據報錯的資訊,通過mysqlbinlog解析binlog日誌,找到對應的資料,然後檢視從庫是否缺失資料或者已存在對應主鍵的資料,然後手動在從庫處理對應記錄的資料。處理完畢後再次開啟同步。

但是,後續還得觀察是否再次出現錯誤

方法二: 手動跳過1個或更多個事務,然後繼續觀察。

/* 傳統點位模式複製 */
SQL>set global sql_slave_skip_counter=1;
SQL>start sql_thread;

/* GTID模式複製 */
SQL>set gtid_next='e29d3917-9dbb-11e9-8b64-e4434b6e2c80:11103335-16054791';
SQL>begin;commit;
SQL>set gtid_next='AUTOMATIC';

注意,手動跳過事務的方式存在一個很大的缺點: 1個事務中存在多個sql,用此方式,本事務中的其他SQL也會被跳過(具體的和binlog-format有關,對於當前常用的ROW格式均有影響)。

2  持續跳過錯誤

但是,如果一直報錯,但是,這些報錯又可以忽略可以怎麼處理,此時也有很多方法,通常使用的是如下幾種:

方法一:  使用pt-slave-restart工具跳過對應錯誤

但是使用pt-slave-restart工具跳過報錯時,必須關閉多執行緒複製,因為工具分不清到底哪個執行緒複製出了問題,然後會報類似如下的報錯:

Cannot skip transactions properly because GTID is enabled and slave_parallel_workers > 0.  See 'GLOBAL TRANSACTION IDS' in the tool's documentation

處理步驟為:

/*  暫停並行複製  */
SQL> set global slave_parallel_workers=0;

/*  使用pt-slave-restart工具跳過錯誤(填寫錯誤號)*/
pt-slave-restart  --user=root --password='Admin@123' --socket=/data/mysql3306/tmp/mysql.sock  --error-numbers=1062

/* 不再報錯時,再開啟並行複製 */
mysql> set global slave_parallel_workers=8;

方法二:  在配置檔案裡配置跳過指定錯誤

在配置檔案[mysqld]項里加入引數slave-skip-errors

 

slave-skip-errors=1032,1062

 

但是,此方法存在一個致命缺點:該引數是靜態引數,無法動態修改,需要修改配置檔案後重啟資料庫方可生效。

3  冪等模式

因為手動跳過事務時,會忽略相同事務下的其他正常的SQL在從庫的應用;pt-slave-restart工具需要停止多執行緒複製,影響從庫應用速度;配置slave-skip-errors又需要重啟資料庫方可生效。那麼有沒有一種方式既不會跳過多餘的SQL,又無需重啟資料庫也不影響從庫應用SQL的速度呢?答案是有的,也就是將slave_exec_mode引數設定為IDEMPOTENT,即冪等模式(預設為嚴格模式STRICT)。

/*  線上動態修改 */
SQL > set global slave_exec_mode='IDEMPOTENT';

改為冪等模式後,可以忽略1032及1062的錯誤,對同一事務內的其他SQL無影響,依舊能正常執行。

 

4. 結語

本文中沒有舉具體案例進行實戰演示,不過建議大家還是自行搭建環境進行場景復現的演示(在從庫先插入部分資料或先更新部分資料),然後再在主庫執行,即可出現1062或1032的錯誤。

很多初學者或實戰經驗不足的同學可能不知道該引數,因此,更加建議在多種場景下測試。

如想和更多的資料庫技術愛好者及時交流,可以關注公眾號:資料庫乾貨鋪  回覆“加群”,進入技術交流群進行溝通。

&n