MySQL 8.0版本 binlog2sql 解析binlog
概述
binlog2sql是一個Python開發開源的MySQL Binlog解析工具,能夠將Binlog解析為原始的SQL,也支援將Binlog解析為回滾的SQL,去除主鍵的INSERT SQL,是DBA和運維人員資料恢復好幫手。
一、安裝配置
1.1 用途
-
資料快速回滾(閃回)
-
主從切換後新master丟資料的修復
-
從binlog生成標準SQL,帶來的衍生功能
-
支援MySQL5.6,5.7
1.2 安裝
shell> git clone https://github.com/danfengcao/binlog2sql.git && cd binlog2sql
shell> pip install -r requirements.txt
注:如果是mysql 8.0需要修改以下配置
**binlog2sq1路徑下的requirements.txt檔案需要調整** cat requirements.txt PyMySQL==0.7.11 whee1==0.29.0 mysq1-replication==0.13 需要將PyMySQL由0.7.11調整為0.9.3 she11>pip install-r requirements.txt
二、使用方法
2.1 使用前配置
2.1.1引數配置
[mysqld]
server_id = 1
log_bin = /var/log/mysql/mysql-bin.log
max_binlog_size = 1G
binlog_format = row
binlog_row_image = full
2.1.2 user需要的最小許可權集合
select, super/replication client, replication slave
建議授權
GRANT SELECT, REPLICATION SLAVE, REPLICATION CLIENT ON *.* TO
許可權說明
-
select:需要讀取server端information_schema.COLUMNS表,獲取表結構的元資訊,拼接成視覺化的sql語句
-
super/replication client:兩個許可權都可以,需要執行'SHOW MASTER STATUS', 獲取server端的binlog列表
-
replication slave:通過BINLOG_DUMP協議獲取binlog內容的許可權
2.2 基本用法
2.2.1基本用法
解析出標準SQL
shell> python binlog2sql.py -h127.0.0.1 -P3306 -uadmin -p'admin' -dtest -t test3 test4 --start-file='mysql-bin.000002'
輸出:
INSERT INTO `test`.`test3`(`addtime`, `data`, `id`) VALUES ('2016-12-10 13:03:38', 'english', 4); #start 570 end 736
UPDATE `test`.`test3` SET `addtime`='2016-12-10 12:00:00', `data`='中文', `id`=3 WHERE `addtime`='2016-12-10 13:03:22' AND `data`='中文' AND `id`=3 LIMIT 1; #start 763 end 954
DELETE FROM `test`.`test3` WHERE `addtime`='2016-12-10 13:03:38' AND `data`='english' AND `id`=4 LIMIT 1; #start 981 end 1147
解析出回滾SQL
shell> python binlog2sql.py --flashback -h127.0.0.1 -P3306 -uadmin -p'admin' -dtest -ttest3 --start-file='mysql-bin.000002' --start-position=763 --stop-position=1147
輸出:
INSERT INTO `test`.`test3`(`addtime`, `data`, `id`) VALUES ('2016-12-10 13:03:38', 'english', 4); #start 981 end 1147
UPDATE `test`.`test3` SET `addtime`='2016-12-10 13:03:22', `data`='中文', `id`=3 WHERE `addtime`='2016-12-10 12:00:00' AND `data`='中文' AND `id`=3 LIMIT 1; #start 763 end 954
2.2.2 選項
mysql連線配置
-h host; -P port; -u user; -p password
解析模式
--stop-never 持續解析binlog。可選。預設False,同步至執行命令時最新的binlog位置。
-K, --no-primary-key 對INSERT語句去除主鍵。可選。預設False
-B, --flashback 生成回滾SQL,可解析大檔案,不受記憶體限制。可選。預設False。與stop-never或no-primary-key不能同時新增。
--back-interval -B模式下,每列印一千行回滾SQL,加一句SLEEP多少秒,如不想加SLEEP,請設為0。可選。預設1.0。
解析範圍控制
--start-file 起始解析檔案,只需檔名,無需全路徑 。必須。
--start-position/--start-pos 起始解析位置。可選。預設為start-file的起始位置。
--stop-file/--end-file 終止解析檔案。可選。預設為start-file同一個檔案。若解析模式為stop-never,此選項失效。
--stop-position/--end-pos 終止解析位置。可選。預設為stop-file的最末位置;若解析模式為stop-never,此選項失效。
--start-datetime 起始解析時間,格式'%Y-%m-%d %H:%M:%S'。可選。預設不過濾。
--stop-datetime 終止解析時間,格式'%Y-%m-%d %H:%M:%S'。可選。預設不過濾。
物件過濾
-d, --databases 只解析目標db的sql,多個庫用空格隔開,如-d db1 db2。可選。預設為空。
-t, --tables 只解析目標table的sql,多張表用空格隔開,如-t tbl1 tbl2。可選。預設為空。
--only-dml 只解析dml,忽略ddl。可選。預設False。
--sql-type 只解析指定型別,支援INSERT, UPDATE, DELETE。多個型別用空格隔開,如--sql-type INSERT DELETE。可選。預設為增刪改都解析。用了此引數但沒填任何型別,則三者都不解析。
2.3 應用案例
2.3.1 誤刪整張表資料,需要緊急回滾
閃回詳細介紹可參見example目錄下《閃回原理與實戰》
test庫tbl表原有資料
mysql> select * from tbl;
+----+--------+---------------------+
| id | name | addtime |
+----+--------+---------------------+
| 1 | 小趙 | 2016-12-10 00:04:33 |
| 2 | 小錢 | 2016-12-10 00:04:48 |
| 3 | 小孫 | 2016-12-13 20:25:00 |
| 4 | 小李 | 2016-12-12 00:00:00 |
+----+--------+---------------------+
4 rows in set (0.00 sec)
mysql> delete from tbl;
Query OK, 4 rows affected (0.00 sec)
20:28時,tbl表誤操作被清空
mysql> select * from tbl;
Empty set (0.00 sec)
恢復資料步驟:
-
登入mysql,檢視目前的binlog檔案
mysql> show master status;
+------------------+-----------+
| Log_name | File_size |
+------------------+-----------+
| mysql-bin.000051 | 967 |
| mysql-bin.000052 | 965 |
+------------------+-----------+ -
最新的binlog檔案是mysql-bin.000052,我們再定位誤操作SQL的binlog位置。誤操作人只能知道大致的誤操作時間,我們根據大致時間過濾資料。
shell> python binlog2sql/binlog2sql.py -h127.0.0.1 -P3306 -uadmin -p'admin' -dtest -ttbl --start-file='mysql-bin.000052' --start-datetime='2016-12-13 20:25:00' --stop-datetime='2016-12-13 20:30:00'
輸出:
INSERT INTO `test`.`tbl`(`addtime`, `id`, `name`) VALUES ('2016-12-13 20:26:00', 4, '小李'); #start 317 end 487 time 2016-12-13 20:26:26
UPDATE `test`.`tbl` SET `addtime`='2016-12-12 00:00:00', `id`=4, `name`='小李' WHERE `addtime`='2016-12-13 20:26:00' AND `id`=4 AND `name`='小李' LIMIT 1; #start 514 end 701 time 2016-12-13 20:27:07
DELETE FROM `test`.`tbl` WHERE `addtime`='2016-12-10 00:04:33' AND `id`=1 AND `name`='小趙' LIMIT 1; #start 728 end 938 time 2016-12-13 20:28:05
DELETE FROM `test`.`tbl` WHERE `addtime`='2016-12-10 00:04:48' AND `id`=2 AND `name`='小錢' LIMIT 1; #start 728 end 938 time 2016-12-13 20:28:05
DELETE FROM `test`.`tbl` WHERE `addtime`='2016-12-13 20:25:00' AND `id`=3 AND `name`='小孫' LIMIT 1; #start 728 end 938 time 2016-12-13 20:28:05
DELETE FROM `test`.`tbl` WHERE `addtime`='2016-12-12 00:00:00' AND `id`=4 AND `name`='小李' LIMIT 1; #start 728 end 938 time 2016-12-13 20:28:05 -
我們得到了誤操作sql的準確位置在728-938之間,再根據位置進一步過濾,使用flashback模式生成回滾sql,檢查回滾sql是否正確(注:真實環境下,此步經常會進一步篩選出需要的sql。結合grep、編輯器等)
shell> python binlog2sql/binlog2sql.py -h127.0.0.1 -P3306 -uadmin -p'admin' -dtest -ttbl --start-file='mysql-bin.000052' --start-position=3346 --stop-position=3556 -B > rollback.sql | cat
輸出:
INSERT INTO `test`.`tbl`(`addtime`, `id`, `name`) VALUES ('2016-12-12 00:00:00', 4, '小李'); #start 728 end 938 time 2016-12-13 20:28:05
INSERT INTO `test`.`tbl`(`addtime`, `id`, `name`) VALUES ('2016-12-13 20:25:00', 3, '小孫'); #start 728 end 938 time 2016-12-13 20:28:05
INSERT INTO `test`.`tbl`(`addtime`, `id`, `name`) VALUES ('2016-12-10 00:04:48', 2, '小錢'); #start 728 end 938 time 2016-12-13 20:28:05
INSERT INTO `test`.`tbl`(`addtime`, `id`, `name`) VALUES ('2016-12-10 00:04:33', 1, '小趙'); #start 728 end 938 time 2016-12-13 20:28:05 -
確認回滾sql正確,執行回滾語句。登入mysql確認,資料回滾成功。
shell> mysql -h127.0.0.1 -P3306 -uadmin -p'admin' < rollback.sql
mysql> select * from tbl;
+----+--------+---------------------+
| id | name | addtime |
+----+--------+---------------------+
| 1 | 小趙 | 2016-12-10 00:04:33 |
| 2 | 小錢 | 2016-12-10 00:04:48 |
| 3 | 小孫 | 2016-12-13 20:25:00 |
| 4 | 小李 | 2016-12-12 00:00:00 |
+----+--------+---------------------+
三、總結
3.1 限制(對比mysqlbinlog)
-
mysql server必須開啟,離線模式下不能解析
-
引數 binlog_row_image 必須為FULL,暫不支援MINIMAL
-
解析速度不如mysqlbinlog
3.2 優點(對比mysqlbinlog)
-
純Python開發,安裝與使用都很簡單
-
自帶flashback、no-primary-key解析模式,無需再裝補丁
-
flashback模式下,更適合
-
解析為標準SQL,方便理解、篩選
-
程式碼容易改造,可以支援更多個性化解析
微信讚賞
支付寶讚賞