mysql資料庫誤刪恢復
日常工作中,總會有因手抖、寫錯條件、寫錯表名、錯連生產庫造成的誤刪庫表和資料的事情發生。那麼,如果連資料都恢復不了,還要什麼 DBA。
1 前言
資料恢復的前提的做好備份,且開啟 binlog,格式為 row。如果沒有備份檔案,那麼刪掉庫表後就真的刪掉了,lsof 中還有記錄的話,有可能恢復一部分檔案。但若剛好資料庫沒有開啟這個表文件,那就只能跑路了。如果沒有開啟 binlog,那麼恢復資料後,從備份時間點開始的資料都沒了。如果 binlog 格式不為 row,那麼在誤操作資料後就沒有辦法做閃回操作,只能老老實實地走備份恢復流程。
2 直接恢復
直接恢復是使用備份檔案做全量恢復,這是最常見的場景。
2.1 mysqldump 備份全量恢復
使用 mysqldump 檔案恢復資料非常簡單,直接解壓了執行:
gzip-dbackup.sql.gz|mysql-u<user>-h<host>-P<port>-p
2.2 xtrabackup 備份全量恢復
恢復過程:
#步驟一:解壓(如果沒有壓縮可以忽略這一步)
innobackupex--decompress<備份檔案所在目錄>
#步驟二:應用日誌
innobackupex--apply-log<備份檔案所在目錄>
#步驟三:複製備份檔案到資料目錄
innobackupex--datadir=<MySQL資料目錄>--copy-back<備份檔案所在目錄>
2.3 基於時間點恢復
基於時間點的恢復依賴的是 binlog 日誌,需要從 binlog 中找過從備份點到恢復點的所有日誌,然後應用。我們測試一下。
新建測試表:
chengqm-3306>>showcreatetablemytest.mytest\G;
***************************1.row***************************
Table:mytest
CreateTable:CREATETABLE`mytest`(
`id`int(11)NOTNULLAUTO_INCREMENT,
`ctime`datetimeDEFAULTNULL,
PRIMARYKEY(`id`)
)ENGINE=InnoDBDEFAULTCHARSET=utf8
每秒插入一條資料:
[mysql@mysql-test~]$whiletrue;domysql-S/tmp/mysql.sock-e'insertintomytest.mytest(ctime)values(now())';date;sleep1;done
備份:
[mysql@mysql-test~]$mysqldump--opt--single-transaction--master-data=2--default-character-set=utf8-S/tmp/mysql.sock-A>backup.sql
找出備份時的日誌位置:
[mysql@mysql-test~]$head-n25backup.sql|grep'CHANGEMASTERTOMASTER_LOG_FILE'
--CHANGEMASTERTOMASTER_LOG_FILE='mysql-bin.000032',MASTER_LOG_POS=39654;
假設要恢復到 2019-08-09 11:01:54 這個時間點,我們從 binlog 中查詢從 39654 到 019-08-09 11:01:54 的日誌。
[mysql@mysql-test~]$mysqlbinlog--start-position=39654--stop-datetime='2019-08-0911:01:54'/data/mysql_log/mysql_test/mysql-bin.000032>backup_inc.sql
[mysql@mysql-test-83~]$tail-n20backup_inc.sql
......
###INSERTINTO`mytest`.`mytest`
###SET
###@1=161/*INTmeta=0nullable=0is_null=0*/
###@2='2019-08-0911:01:53'/*DATETIME(0)meta=0nullable=1is_null=0*/
......
當前資料條目數:
--2019-08-0911:01:54之前的資料條數
chengqm-3306>>selectcount(*)frommytest.mytestwherectime<'2019-08-0911:01:54';
+----------+
|count(*)|
+----------+
|161|
+----------+
1rowinset(0.00sec)
--所有資料條數
chengqm-3306>>selectcount(*)frommytest.mytest;
+----------+
|count(*)|
+----------+
|180|
+----------+
1rowinset(0.00sec)
然後執行恢復:
#全量恢復
[mysql@mysql-test~]$mysql-S/tmp/mysql.sock<backup.sql
#應用增量日誌
[mysql@mysql-test~]$mysql-S/tmp/mysql.sock<backup_inc.sql
檢查資料:
chengqm-3306>>selectcount(*)frommytest.mytest;
+----------+
|count(*)|
+----------+
|161|
+----------+
1rowinset(0.00sec)
chengqm-3306>>select*frommytest.mytestorderbyiddesclimit5;
+-----+---------------------+
|id|ctime|
+-----+---------------------+
|161|2019-08-0911:01:53|
|160|2019-08-0911:01:52|
|159|2019-08-0911:01:51|
|158|2019-08-0911:01:50|
|157|2019-08-0911:01:49|
+-----+---------------------+
5rowsinset(0.00sec)
已經恢復到 2019-08-09 11:01:54 這個時間點。
3 恢復一個表
3.1 從 mysqldump 備份恢復一個表
假設要恢復的表是 mytest.mytest:
#提取某個庫的所有資料
sed-n'/^--CurrentDatabase:`mytest`/,/^--CurrentDatabase:/p'backup.sql>backup_mytest.sql
#從庫備份檔案中提取建表語句
sed-e'/./{H;$!d;}'-e'x;/CREATETABLE`mytest`/!d;q'backup_mytest.sql>mytest_table_create.sql
#從庫備份檔案中提取插入資料語句
grep-i'INSERTINTO`mytest`'backup_mytest.sql>mytest_table_insert.sql
#恢復表結構到mytest庫
mysql-u<user>-pmytest<mytest_table_create.sql
#恢復表資料到mytest.mytest表
mysql-u<user>-pmytest<mytest_table_insert.sql
3.2 從 xtrabackup 備份恢復一個表
假設 ./backup_xtra_full 目錄為解壓後應用過日誌的備份檔案。
3.2.1 MyISAM 表
假設從備份檔案中恢復表 mytest.t_myisam。從備份檔案中找到 t_myisam.frm, t_myisam.MYD, t_myisam.MYI 這 3 個檔案,複製到對應的資料目錄中,並授權 進入 MySQL。檢查表情況:
chengqm-3306>>showtables;
+------------------+
|Tables_in_mytest|
+------------------+
|mytest|
|t_myisam|
+------------------+
2rowsinset(0.00sec)
chengqm-3306>>checktablet_myisam;
+-----------------+-------+----------+----------+
|Table|Op|Msg_type|Msg_text|
+-----------------+-------+----------+----------+
|mytest.t_myisam|check|status|OK|
+-----------------+-------+----------+----------+
1rowinset(0.00sec)
3.2.2 Innodb 表
假設從備份檔案中恢復表 mytest.t_innodb,恢復前提是設定了innodb_file_per_table = on
:
- 起一個新例項;
- 在例項上建一個和原來一模一樣的表;
- 執行
alter table t_innodb discard tablespace
; 刪除表空間,這個操作會把t_innodb.ibd 刪除; - 從備份檔案中找到
t_innodb.ibd
這個檔案,複製到對應的資料目錄,並授權; - 執行
alter table t_innodb IMPORT tablespace
; 載入表空間; - 執行
flush table t_innodb;check table t_innodb
; 檢查表; - 使用
mysqldump
匯出資料,然後再匯入到要恢復的資料庫。
注意:
- 在新例項上恢復再 dump 出來是為了避免風險,如果是測試,可以直接在原庫上操作步驟 2-6;
- 只在 8.0 以前的版本有效。
4 跳過誤操作SQL
跳過誤操作 SQL 一般用於執行了無法閃回的操作比如 drop table\database。
4.1 使用備份檔案恢復跳過
4.1.1 不開啟 GTID
使用備份檔案恢復的步驟和基於時間點恢復的操作差不多,區別在於多一個查詢 binlog 操作。舉個例子,我這裡建立了兩個表 a 和 b,每分鐘插入一條資料,然後做全量備份,再刪除表 b,現在要跳過這條 SQL。
刪除表 b 後的資料庫狀態:
chgnqm-3306>>showtables;
+------------------+
|Tables_in_mytest|
+------------------+
|a|
+------------------+
1rowinset(0.00sec)
1. 找出備份時的日誌位置
[mysql@mysql-test~]$head-n25backup.sql|grep'CHANGEMASTERTOMASTER_LOG_FILE'
--CHANGEMASTERTOMASTER_LOG_FILE='mysql-bin.000034',MASTER_LOG_POS=38414;
2. 找出執行了 drop table 語句的 pos 位置
[mysql@mysql-testmysql_test]$mysqlbinlog-vv/data/mysql_log/mysql_test/mysql-bin.000034|grep-i-B3'droptable`b`';
#at120629
#19081819:48:30serverid83end_log_pos120747CRC320x6dd6ab2aQuerythread_id=29488exec_time=0error_code=0
SETTIMESTAMP=1566128910/*!*/;
DROPTABLE`b`/*generatedbyserver*/
從結果中我們可以看到 drop 所在語句的開始位置是 120629,結束位置是 120747。
3. 從 binglog 中提取跳過這條語句的其他記錄
#第一條的start-position為備份檔案的pos位置,stop-position為drop語句的開始位置
mysqlbinlog-vv--start-position=38414--stop-position=120629/data/mysql_log/mysql_test/mysql-bin.000034>backup_inc_1.sql
#第二條的start-position為drop語句的結束位置
mysqlbinlog-vv--start-position=120747/data/mysql_log/mysql_test/mysql-bin.000034>backup_inc_2.sql
4. 恢復備份檔案
[mysql@mysql-test~]$mysql-S/tmp/mysql.sock<backup.sql
全量恢復後狀態:
chgnqm-3306>>showtables;
+------------------+
|Tables_in_mytest|
+------------------+
|a|
|b|
+------------------+
2rowsinset(0.00sec)
chgnqm-3306>>selectcount(*)froma;
+----------+
|count(*)|
+----------+
|71|
+----------+
1rowinset(0.00sec)
5. 恢復增量資料
[mysql@mysql-test~]$mysql-S/tmp/mysql.sock<backup_inc_1.sql
[mysql@mysql-test~]$mysql-S/tmp/mysql.sock<backup_inc_2.sql
恢復後狀態,可以看到已經跳過了 drop 語句:
chgnqm-3306>>showtables;
+------------------+
|Tables_in_mytest|
+------------------+
|a|
|b|
+------------------+
2rowsinset(0.00sec)
chgnqm-3306>>selectcount(*)froma;
+----------+
|count(*)|
+----------+
|274|
+----------+
1rowinset(0.00sec)
4.1.2 開啟 GTID
使用 GTID 可以直接跳過錯誤的 SQL:
-
找出備份時的日誌位置;
-
找出執行了 drop table 語句的 GTID 值;
-
匯出備份時日誌位置到最新的 binglog 日誌;
-
恢復備份檔案;
-
跳過這個 GTID;
SETSESSIONGTID_NEXT='對應的GTID值';
BEGIN;COMMIT;
SETSESSIONGTID_NEXT=AUTOMATIC; -
應用步驟 3 得到的增量 binlog 日誌。
4.2 使用延遲庫跳過
4.2.1 不開啟 GTID
使用延遲庫恢復的關鍵操作在於start slave until
。我在測試環境搭建了兩個 MySQL 節點,節點二延遲600秒,新建 a,b 兩個表,每秒插入一條資料模擬業務資料插入。
localhost:3306->localhost:3307(delay600)
當前節點二狀態:
chengqm-3307>>showslavestatus\G;
...
Master_Port:3306
Connect_Retry:60
Master_Log_File:mysql-bin.000039
Read_Master_Log_Pos:15524
Relay_Log_File:mysql-relay-bin.000002
Relay_Log_Pos:22845
Relay_Master_Log_File:mysql-bin.000038
Slave_IO_Running:Yes
Slave_SQL_Running:Yes
...
Seconds_Behind_Master:600
...
當前節點二表:
chengqm-3307>>showtables;
+------------------+
|Tables_in_mytest|
+------------------+
|a|
|b|
+------------------+
在節點一刪除表 b:
chengqm-3306>>droptableb;
QueryOK,0rowsaffected(0.00sec)
chengqm-3306>>showtables;
+------------------+
|Tables_in_mytest|
+------------------+
|a|
+------------------+
1rowinset(0.00sec)
接下來就是跳過這條 SQL 的操作步驟。
1. 延遲庫停止同步
stopslave;
- 找出執行了 drop table 語句的前一句的 pos 位置
[mysql@mysql-test~]$mysqlbinlog-vv/data/mysql_log/mysql_test/mysql-bin.000039|grep-i-B10'droptable`b`';
...
#at35134
#19081911:40:25serverid83end_log_pos35199CRC320x02771167Anonymous_GTIDlast_committed=132sequence_number=133rbr_only=no
SET@@SESSION.GTID_NEXT='ANONYMOUS'/*!*/;
#at35199
#19081911:40:25serverid83end_log_pos35317CRC320x50a018aaQuerythread_id=37155exec_time=0error_code=0
use`mytest`/*!*/;
SETTIMESTAMP=1566186025/*!*/;
DROPTABLE`b`/*generatedbyserver*/
從結果中我們可以看到 drop 所在語句的前一句開始位置是 35134,所以我們同步到 35134(這個可別選錯了)。
3. 延遲庫同步到要跳過的 SQL 前一條
changemastertomaster_delay=0;
startslaveuntilmaster_log_file='mysql-bin.000039',master_log_pos=35134;
檢視狀態看到已經同步到對應節點:
chengqm-3307>>showslavestatus\G;
...
Master_Port:3306
Connect_Retry:60
Master_Log_File:mysql-bin.000039
Read_Master_Log_Pos:65792
...
Slave_IO_Running:Yes
Slave_SQL_Running:No
Exec_Master_Log_Pos:35134
...
Until_Log_File:mysql-bin.000039
Until_Log_Pos:35134
4. 跳過一條 SQL 後開始同步
setglobalsql_slave_skip_counter=1;
startslave;
檢視同步狀態,刪除表 b 的語句已經被跳過:
chengqm-3307>>showslavestatus\G;
...
Slave_IO_Running:Yes
Slave_SQL_Running:Yes
...
1rowinset(0.00sec)
chengqm-3307>>showtables;
+------------------+
|Tables_in_mytest|
+------------------+
|a|
|b|
+------------------+
2rowsinset(0.00sec)
4.2.2 開啟 GTID
使用 GTID 跳過的步驟會簡單很多,只要執行一條和要跳過的 SQL 的 GTID 相同的事務就可以跳過了。
-
停止同步;
-
找出執行了 drop table 語句的 GTID;
-
執行這個 GTID 的事務;
SETSESSIONGTID_NEXT='對應的GTID值';
BEGIN;COMMIT;
SETSESSIONGTID_NEXT=AUTOMATIC; -
繼續同步;
-
閃回。
閃回操作就是反向操作,比如執行了delete from a where id=1
,閃回就會執行對應的插入操作insert into a (id,...) values(1,...)
,用於誤操作資料,只對 DML 語句有效,且要求 binlog 格式設為 ROW。本章介紹兩個比較好用的開源工具。
5.1 binlog2sql
binlog2sql 是大眾點評開源的一款用於解析 binlog 的工具,可以用於生成閃回語句,專案地址 binlog2sql。
5.1.1 安裝
wgethttps://github.com/danfengcao/binlog2sql/archive/master.zip-Obinlog2sql.zip
unzipbinlog2sql.zip
cdbinlog2sql-master/
#安裝依賴
pipinstall-rrequirements.txt
5.1.2 生成回滾SQL
pythonbinlog2sql/binlog2sql.py--flashback\
-h<host>-P<port>-u<user>-p'<password>'-d<dbname>-t<table_name>\
--start-file='<binlog_file>'\
--start-datetime='<start_time>'\
--stop-datetime='<stop_time>'>./flashback.sql
pythonbinlog2sql/binlog2sql.py--flashback\
-h<host>-P<port>-u<user>-p'<password>'-d<dbname>-t<table_name>\
--start-file='<binlog_file>'\
--start-position=<start_pos>\
--stop-position=<stop_pos>>./flashback.sql
5.2 MyFlash
MyFlash 是由美團點評公司技術工程部開發維護的一個回滾 DML 操作的工具,專案連結 MyFlash。
限制:
- binlog 格式必須為 row,且 binlog_row_image=full;
- 僅支援5.6與5.7;
- 只能回滾 DML(增、刪、改)。
5.2.1 安裝
#依賴(centos)
yuminstallgcc*pkg-configglib2libgnomeui-devel-y
#下載檔案
wgethttps://github.com/Meituan-Dianping/MyFlash/archive/master.zip-OMyFlash.zip
unzipMyFlash.zip
cdMyFlash-master
#編譯安裝
gcc-w`pkg-config--cflags--libsglib-2.0`source/binlogParseGlib.c-obinary/flashback
mvbinary/usr/local/MyFlash
ln-s/usr/local/MyFlash/flashback/usr/bin/flashback
5.2.2 使用
生成回滾語句:
flashback--databaseNames=<dbname>--binlogFileNames=<binlog_file>--start-position=<start_pos>--stop-position=<stop_pos>
執行後會生成 binlog_output_base.flashback 檔案,需要用 mysqlbinlog 解析出來再使用:
mysqlbinlog-vvbinlog_output_base.flashback|mysql-u<user>-p
- EOF -