一次主從復制出錯解決與pt-slave-restart工具使用

阿新 • • 發佈：2017-10-01

mysql 復制 slave

緣由：

測試環境中，主庫執行了DDL語句增加一個字段的長度後，從庫報無法修改這個字段長的的問題，且這個字段的長度已經介於原來的長度和目標長度中間了

環境

5.7.19 GTID雙主復制

解決步驟：

1.嘗試手工修改字段長度，恢復到未修改前的長度，重啟slave進程。結果：失敗，報同樣的錯誤，錯誤編號1677

2.嘗試手工修改字段長度，同步到修改後長度，跳過這個事務：

mysql>stop slave;

mysql>set gtid_next="d7c35015-9dd1-11e7-b70d-005056aa19c3:51629";  
  ##這裏需要註意，由於開啟了雙主GTID復制,show master status和Executed_gtid_set會有兩個GTID值，其中一個為自己的GTID，另一個為主的GTID。
  ##設置的時候只要把主庫的GTID寫進“”即可。自身的GTID不需要指明，但如果使用set gtid_purged的方式跳過，是需要可以指明兩個GTID的

mysql>begin;commit;
  ##設置後，插入一個空事務進行更新GTID。
  
mysql>set gtid_next=‘automatic‘；
  ##官方手冊規定：精確的指定過一次GTID，並產生一次事務後，後面必須再次指定一次gtid_next的模式（是模式，不是精確值，官方手冊這裏沒有寫清楚）
  ##“After this variable has been set to UUID:NUMBER, and a transaction has been committed or rolled back, an explicit SET GTID_NEXT statement must again be issued before any other statement.”
mysql>start slave；

講道理，這裏就應該正常了，但還是報同樣的錯誤，一次次的這樣操作也很麻煩，

3.批量跳過復制錯誤有如下兩個方法

使用slave-skip-errors=123,456,789，但這個參數不是動態參數，需要寫進配置文件並重啟，而且也不方便觀測

使用percona公司的pt-slave-restart工具

pt-slave-restart是percona-toolkit工具集中的一個專用於處理復制錯誤的工具

原理：根據設置，跳過從主庫過來的指定錯誤事務

1.支持GTID復制，但是不支持多線程復制，工具分不清到底哪個線程復制出了問題

2.除了主機指定外的實用參數：

--always :永不停止slave線程，手工停止也不行

--ask-pass :替換-p命令，防止密碼輸入被身後的開發窺屏

--error-numbers ：指定跳過哪些錯誤，可用,進行分隔

--error-text ：根據錯誤信息進行匹配跳過

--log ：輸出到文件

--recurse ：在主端執行，監控從端

--runtime ：工具執行多長時間後退出：默認秒， m=minute,h=hours,d=days

--slave-user --slave-password ：從庫的賬號密碼，從主端運行時使用

--skip-count ：一次跳過錯誤的個數，膽大的可以設置大些，不指定默認1個

--master-uuid :級聯復制的時候，指定跳過上級或者上上級事務的錯誤

--until-master :到達指定的master_log_pos,file位置後停止，

格式：”file:pos“

--until-relay :和上面一樣，但是時根據relay_log的位置來停止

安裝：

  centos#yum install https://www.percona.com/redir/downloads/percona-release/redhat/percona-release-0.1-4.noarch.rpm
  centos#yum search percon-tool
  centos#yum -y install yum install percona-toolkit

查看幫助文件:

  perldoc /usr/bin/pt-slave-restart

運行工具：

  pt-slave-restart --user=root --password=123456 --socket=/data/mysql/3304/tmp/mysql3304.sock --error-numbers=1677

輸出如下：

Not checking slave because relay log file or position has not changed (file relay-bin.000002 pos 205804892)
2017-09-30T12:55:03 S=/data/mysql/3304/tmp/mysql3304.sock,p=...,u=root relay-bin.000002   205805634 1677 
Not checking slave because relay log file or position has not changed (file relay-bin.000002 pos 205805634)
Not checking slave because relay log file or position has not changed (file relay-bin.000002 pos 205805634)
Not checking slave because relay log file or position has not changed (file relay-bin.000002 pos 205805634)
2017-09-30T12:55:03 S=/data/mysql/3304/tmp/mysql3304.sock,p=...,u=root relay-bin.000002   205806382 1677 
2017-09-30T12:55:04 S=/data/mysql/3304/tmp/mysql3304.sock,p=...,u=root relay-bin.000002   205807125 1677 
2017-09-30T12:55:04 S=/data/mysql/3304/tmp/mysql3304.sock,p=...,u=root relay-bin.000002   205807873 1677 
Not checking slave because relay log file or position has not changed (file relay-bin.000002 pos 205807873)
2017-09-30T12:55:20 S=/data/mysql/3304/tmp/mysql3304.sock,p=...,u=root relay-bin.000002   205997621 1677 
2017-09-30T12:55:21 S=/data/mysql/3304/tmp/mysql3304.sock,p=...,u=root relay-bin.000002   205998353 1677 
2017-09-30T12:55:22 S=/data/mysql/3304/tmp/mysql3304.sock,p=...,u=root relay-bin.000002   205999085 1677 
2017-09-30T12:55:23 S=/data/mysql/3304/tmp/mysql3304.sock,p=...,u=root relay-bin.000002   205999823 1677 
2017-09-30T12:55:24 S=/data/mysql/3304/tmp/mysql3304.sock,p=...,u=root relay-bin.000002   206000565 1677 
2017-09-30T12:55:24 S=/data/mysql/3304/tmp/mysql3304.sock,p=...,u=root relay-bin.000002   206001307 1677 
2017-09-30T12:55:24 S=/data/mysql/3304/tmp/mysql3304.sock,p=...,u=root relay-bin.000002   206002049 1677
2017-09-30T12:55:24 S=/data/mysql/3304/tmp/mysql3304.sock,p=...,u=root relay-bin.000002   206002783 1677 
2017-09-30T12:55:24 S=/data/mysql/3304/tmp/mysql3304.sock,p=...,u=root relay-bin.000002   206003517 1677 
2017-09-30T12:55:24 S=/data/mysql/3304/tmp/mysql3304.sock,p=...,u=root relay-bin.000002   206004253 1677

查看從庫線程情況：

************** 1. row ***************************
                         Slave_IO_State: Waiting for master to send event
                  Master_Host: 192.168.100.200
                  Master_User: bt_repl
                  Master_Port: 3304
                Connect_Retry: 60
              Master_Log_File: 3304binlog.000002
          Read_Master_Log_Pos: 665635124
               Relay_Log_File: relay-bin.000006
                Relay_Log_Pos: 2080902
        Relay_Master_Log_File: 3304binlog.000002
             Slave_IO_Running: Yes
            Slave_SQL_Running: Yes
                   Last_Errno: 0
                   Last_Error: 
                 Skip_Counter: 0
          Exec_Master_Log_Pos: 665635124
              Relay_Log_Space: 2081454
              Until_Condition: None
               Until_Log_File: 
                Until_Log_Pos: 0
           Master_SSL_Allowed: No
        Seconds_Behind_Master: 0
Master_SSL_Verify_Server_Cert: No
                Last_IO_Errno: 0
                Last_IO_Error: 
               Last_SQL_Errno: 0
               Last_SQL_Error: 
  Replicate_Ignore_Server_Ids: 
             Master_Server_Id: 3304
                  Master_UUID: d7c35015-9dd1-11e7-b70d-005056aa19c3
             Master_Info_File: mysql.slave_master_info
                    SQL_Delay: 0
          SQL_Remaining_Delay: NULL
      Slave_SQL_Running_State: Slave has read all relay log; waiting for more updates
           Master_Retry_Count: 86400
                  Master_Bind: 
           Retrieved_Gtid_Set: d7c35015-9dd1-11e7-b70d-005056aa19c3:1-430778
            Executed_Gtid_Set: 886f86e9-9dd6-11e7-ba30-005056aa6236:1-2,
d7c35015-9dd1-11e7-b70d-005056aa19c3:1-430778
                Auto_Position: 1
         1 row in set (0.07 sec)

已經沒有錯誤了。OK

attention:

1.gtid_next是一個會話級別的參數，而gtid_purged則是一個全局級別的參數

本文出自 “漫漫SQL路......” 博客，請務必保留此出處http://l0vesql.blog.51cto.com/4159433/1970042

一次主從復制出錯解決與pt-slave-restart工具使用

mysql 復制 slave 緣由：測試環境中，主庫執行了DDL語句增加一個字段的長度後，從庫報無法修改這個字段長的的問題，且這個字段的長度已經介於原來的長度和目標長度中間了環境5.7.19 GTID雙主復制解決步驟：1.嘗試手工修改字段長度，恢復到未修改前的長度，重啟slave進程。結果：失敗，

NO4.Mysql數據庫主從復制出錯的解決辦法

Linux運維當然了，要想解決問題得先有環境。一主一從的配置流程：主：先配置DNS解析，實驗環境可以利用 /etc/hosts 解析vim /etc/hosts192.168.122.45 master1192.168.122.46 master2從機不用在配置，通過scp發送到從機scp /etc/host

MySQL主從復制出錯的解決方法

all 數據變量清除輸入 grant gen ... https MySQL主從復制出錯的解決方法主從復制中若是出現錯誤可以通過幾個方法來進行解決 1.如果主從復制時發生了主鍵沖突，從而阻止了主從復制，可以使用sql_slave_skip_counter這個變量來

MySQL 5.7下主從復制延遲解決方案

mysql replication 在MySQL下主從復制的延遲問題一直是在業界內比較大的困擾，主從的延遲會因為受到網絡磁盤等等相關的因素影響，但其中最主要的影響是就是在master太過繁忙的寫入導致slave無法有效的從relay_log中讀取到最新的相關記錄，這樣對於數據實時性很高的業務來說

Mysql DBA 高級運維學習筆記-MySQL主從復制故障解決

解決 .cn 行修改大數據庫 soc 內存回滾 root 錯誤號 1.MySQL從庫數據沖突導致同步停止 Show slave status報錯且show slave status\G Slave_IO_Running: Yes Slave_SQL_Running: N

記一次業務復雜的解決流程

控制 blog 修改流程 block 今天原子性道理復雜一、遇到的問題：　　今天在搬磚的時候，分類情況比較多，多次修改後，總是會報出一些問題　　大概條件有兩種摻雜：表類型、列包含標誌　　二、解決思路：　　1、縮小到最小變化量，首先確定有兩種

【20180719】記錄一次MariaDB主從復制由於tokudb出現主鍵1062錯誤問題

-h prepare prev ria tree 時間比較 make poi lin 記一次MariaDB主從復制的搭建環境: 系統: CentOS release 6.3 內核: 2.6.32-431.23.3.el6.centos.plus.x86_64 數據庫版本

記一次完整的安全技術解決方案遭遇成本考驗後的“退步與博弈”

架構師互聯網解決方案防火墻高可用寫在前面，出於保護客戶隱私和堅守網工的職業道德素養，本文不得出現的所有完整ip、客戶名稱、信息、以及詳細的業務模型闡述。最近確實走心的在分享案例，2017年5月21日在家裏寫了近四小時，女票已經暴走，請大家掩護我！！！！！

MySQL主從復制原理深入解析與練習

數據庫記錄 sql語句 change master MySQL主從復制原理深入解析與練習MySQL主從復制畫圖描述：MySQL主從復制原理上圖詳解：①　用戶做crud操作，寫入數據庫，更新結果記錄到binlog中；②　主從同步是主找從的，從庫IO發起請求，主庫的主進程看從庫的master

java架構師課程、性能調優、高並發、tomcat負載均衡、大型電商項目實戰、高可用、高可擴展、數據庫架構設計、Solr集群與應用、分布式實戰、主從復制、高可用集群、大數據

慢查詢主從復制難題 jms 整合大數數據庫設計企業級 nginx網站 15套Java架構師詳情 * { font-family: "Microsoft YaHei" !important } h1 { background-color: #006; color:

MySQL主從復制（一）

mysql mysql主從 web一般是拒絕用戶上傳的，webdav可以實現數據上傳MySQL的擴展方式：scale up：scale out：一、MySQL的擴展：復制：每個node都有相同的數據集從node請求主node的二進制日誌，在本地進行重放實現復制的作用：數據分布：負載均衡：//讀均衡，寫

MySQL主從復制與讀寫分離

$0 get 登錄 nice ica oca kcon 過程 ads 主從復制(Master-Slave)與讀寫分離(Mysql作為目前世界上使用最廣泛的免費數據庫，相信所有從事系統運維的工程師都一定接觸過。但在實際的生產環境中，由單臺主從復制（Master-Slave）

使用多實例進行主從復制實踐案例（一主一從）

主從復制案列環境:多實例10.0.0.52 330610.0.0.52 33073306---->3307復制---->3309 ---->3008復制3306<---->3307 架構實踐:3306---->33071開啟主庫binlog,配置server-id[

MySQL主從復制技術與讀寫分離技術amoeba應用

buffer chan lns -a query rep 下載高可用性 tab MySQL主從復制技術與讀寫分離技術amoeba應用前言：眼下在搭建一個人才站點，估計流量會非常大，須要用到分布式數據庫技術，MySQL的主從復制+讀寫分

mysql5.7.18的安裝與主從復制

state lec pos 存在 mysql主從 dir hub 我們 .com CentOS6.7安裝mysql5.7.18 　　　　1、解壓到/usr/local目錄　　　　# tar -zxvf mysql-5.7.18-linux-glibc2.5-i686

記一次VS Code崩潰的解決（Win10掃描自動回復系統文件）

jpg 所有 dwr 查看系統查看表示 reg 存在信息早上修改Vue.js框架搭建的項目，正高興著，突然電腦崩潰，重啟後VS code打不開，報錯如下： DWrite.dll丟失然後查看了一下 C:\windows\system32\下 DWrite.dl

MongoDB建立主從復制小案例(一主一從)

blog mongo info 服務端 -- 成功 .... 是否 host 花了兩天學習了mongoDB, 今天接觸到了mongo的主從配置, 把它記下來 1. 　　開啟兩個mongo服務器(用於一主一從, 沒有加安全驗證相關參數 : 可以使用mongd-help查看)

MySQL的主從復制與讀寫分離原理

訂單中繼運維提交磁盤 com 引擎庫服務器文件前言：我們前面搭建過LAMP和LNMP，做過了web服務器群集和熱備，web服務器壞了我們是不怕了，但是我們要知道，網站的數據有很多是存儲在數據庫裏面的，例如註冊的會員，發的文章，購物的訂單等信息。當然我們可以給數

一條SQL引起的MySQL主從復制報錯1205

MySQL主從復制 Error_code: 1205 鎖表 SQL優化大家都知道DBA就像是消（背）防（鍋）員（俠），因為前端應用還有開發上線的新版本都會影響到位於最底層的數據庫，前方稍微有些風吹草動，就能反應在數據庫的性能上。但是有的時候SQL不僅能決定數據庫的性能，還能決定數據庫的生死，

MySQL主從復制與讀寫分離的工作原理

MySQL 主從復制讀寫分離一、mysql主從復制的工作原理1、mysq支持的復制類型1）基於語句的復制。在服務器上執行sql語句，在從服務器上執行同樣的語句，mysql默認采用基於語句的復制，執行效率高。2）基於行的復制。把改變的內容復制過去，而不是把命令在從服務器上執行一遍。3）混合類型的

一次主從復制出錯解決與pt-slave-restart工具使用

相關推薦