PIKA異常01-生產主從關係不能建立及主從斷連問題

阿新 • • 發佈：2020-12-17

技術標籤：pika

整篇文章包含三種主從關係不能建立問題的解決方案

1.rename問題引起主從關係不能建立

起因: db目錄掛載到了磁碟上,而dbsync目錄掛載到本地,等價於兩個目錄掛載到兩塊盤

日誌: 檢視從節點的PIKA.WARRNING日誌如下,可以看到提示rename問題.

解釋: 因為slave接受的master全同步資料是硬連結到db目錄的。需要在同一個檔案系統上。

解決方案: 將db與dbsync都掛載到磁碟上,rename問題解決

Log file created at: 2020/12/01 11:14:21
Running on machine: pika-test-20201128-001
Log line format: [IWEF]mmdd hh:mm:ss.uuuuuu threadid file:line] msg
W1201 11:14:21.244900 67744 pika_partition.cc:304] Partition: db0, Failed to rename new db path when change db, error: Invalid cross-device link
W1201 11:14:21.244971 67744 pika_partition.cc:255] Partition: db0, Failed to change db
W1201 11:15:41.613822 67637 pika_repl_client_thread.cc:49] Master conn timeout : pika1:11221 try reconnect
W1201 11:20:19.930094 67744 pika_partition.cc:298] Partition: db0, Failed to rename db path when change db, error: No such file or directory
W1201 11:20:19.930109 67744 pika_partition.cc:255] Partition: db0, Failed to change db
W1201 11:21:38.866683 67637 pika_repl_client_thread.cc:49] Master conn timeout : pika1:11221 try reconnect

2.Timeout引起主從關係不能建立

起因: 主從關係掉了之後,進行全量同步過程中,主節點的dump＋傳輸時間過長,導致主從在不斷的全量同步

日誌: 如下主從節點的日誌,發生了超時,在不斷的重新進行全量同步

解釋: 理解為主節點dump＋傳輸時間過長

解決方法: slaveof pika1 9221 force(force操作,會讓從節點一直等待主節點dump完成並且傳輸到從節點建立主從)

注: 如果pika主從的建立是通過slaveof pika1 9221這種使用hostname建立的,還有可能日誌會提示使用容器id而不是hostname(pika1)

解決方法先使用容器id建立主從
    slaveof containerid 9221 force
當主從建立成功之後執行:
    slaveof no one
    slaveof pika1 9221 force
    config rewrite
這個原理暫時還不能解釋,親測有效

主節點日誌:

I1130 10:44:48.794337 29011 pika_partition.cc:379] db0 bgsave_info: path=/data1/pika/dump/20201130/db0,  filenum=2562, offset=13365700
I1130 10:48:02.246551 29011 pika_partition.cc:385] db0 create new backup finished.
I1130 10:48:02.246703 29011 pika_server.cc:1085] Partition: db0 Start Send files in /data1/pika/dump/20201130/db0 to 127.0.0.1
I1130 10:58:55.963577 29011 pika_server.cc:1186] Partition: db0 RSync Send Files Success
I1130 11:00:15.398463 26013 pika_repl_server_thread.cc:29] ServerThread Close Slave Conn, fd: 201, ip_port: 127.0.0.1:37504
I1130 11:00:15.398608 26013 pika_server.cc:740] Delete Slave Success, ip_port: 127.0.0.1:9221
I1130 11:00:15.398638 26013 pika_rm.cc:90] Remove Slave Node, Partition: (db0:0), ip_port: 127.0.0.1:9221
I1130 11:00:25.094928 26016 pika_repl_server_conn.cc:42] Receive MetaSync, Slave ip: 127.0.0.1, Slave port:9221
I1130 11:00:25.095026 26016 pika_server.cc:843] Add New Slave, 127.0.0.1:9221
I1130 11:00:25.233932 26014 pika_repl_server_conn.cc:108] Receive Trysync, Slave ip: 10.20.134.1, Slave port:9221, Partition: db0, filenum: 0, pro_offset: 0
I1130 11:00:25.233992 26014 pika_repl_server_conn.cc:263] Partition: db0 binlog has been purged, may need full sync
I1130 11:00:40.320998 26015 pika_repl_server_conn.cc:324] Handle partition DBSync Request
I1130 11:00:40.321120 26015 pika_rm.cc:79] Add Slave Node, partition: (db0:0), ip_port: 127.0.0.1:9221
I1130 11:00:40.322064 26015 pika_repl_server_conn.cc:347] Partition: db0_0 Handle DBSync Request Success, Session: 183
I1130 11:00:52.044495 29011 pika_partition.cc:376] db0 after prepare bgsave
I1130 11:00:52.044572 29011 pika_partition.cc:379] db0 bgsave_info: path=/data1/pika/dump/20201130/db0,  filenum=2562, offset=13365700
I1130 11:04:03.152256 29011 pika_partition.cc:385] db0 create new backup finished.
I1130 11:04:03.152402 29011 pika_server.cc:1085] Partition: db0 Start Send files in /data1/pika/dump/20201130/db0 to 127.0.0.1

從節點日誌:

I1130 10:44:35.124609 53402 pika_repl_client_conn.cc:182] Partition: db0 Need Wait To Sync
I1130 10:58:55.921267 53506 pika_partition.cc:236] Partition: db0 Information from dbsync info,  master_ip: 127.0.0.1, master_port: 9221, filenum: 2562, offset: 13365700, term: 0, index: 0
I1130 10:58:55.921336 53506 pika_partition.cc:293] Partition: db0, Prepare change db from: /data2/pika/db/db0_bak
I1130 11:00:15.392289 53399 pika_repl_client_thread.cc:38] ReplClient Timeout conn, fd=95, ip_port=127.0.0.1:11221
I1130 11:00:25.087127 53506 pika_repl_client.cc:146] Try Send Meta Sync Request to Master (127.0.0.1:9221)
I1130 11:00:25.088173 53403 pika_server.cc:618] Mark try connect finish
I1130 11:00:25.088215 53403 pika_repl_client_conn.cc:146] Finish to handle meta sync response
I1130 11:00:25.226863 53404 pika_repl_client_conn.cc:261] Partition: db0 Need To Try DBSync
I1130 11:00:40.315070 53405 pika_repl_client_conn.cc:182] Partition: db0 Need Wait To Sync
I1130 11:15:53.390866 53506 pika_partition.cc:236] Partition: db0 Information from dbsync info,  master_ip: 127.0.0.1, master_port: 9221, filenum: 2562, offset: 13365700, term: 0, index: 0
I1130 11:15:53.392174 53506 pika_partition.cc:293] Partition: db0, Prepare change db from: /data2/pika/db/db0_bak
I1130 11:17:12.993613 53399 pika_repl_client_thread.cc:38] ReplClient Timeout conn, fd=70, ip_port=127.0.0.1:11221
I1130 11:17:22.057538 53506 pika_repl_client.cc:146] Try Send Meta Sync Request to Master (127.0.0.1:9221)

3.主節點上已經存在從節點資訊並且不能更新引起主從關係不能建立

起因: 由於網路情況或是其他情況主從斷開,重新建立連線時提示主從關係已經存在

日誌: 如下為從節點的日誌,提示Slave AlreadyExist

解決方案: 將pika版本升級為3.3.6,這個版本已經修復了Slave AlreadyExist 這個問題,可以看一下github上的版本更新

pika_repl_client.cc:145] Try Send Meta Sync Request to Master (pika1:9221)
pika_repl_client_conn.cc:100] Meta Sync Failed: Slave AlreadyExist
Sync error, set repl_state to PIKA_REPL_ERROR
pika_repl_client_thread.cc:21] ReplClient Close conn, fd=364, ip_port=pika1:11221

4.總結

1.Slave AlreadyExist問題更新版本到3.3.6
2.rename問題將db與dbsync掛載到同一目錄下
3.ReplClient Timeout conn問題建立主從的時候需要執行force建立
4.建議將dump db與dbsync一起掛載到磁碟目錄上,這樣也會減少dump的時間

PIKA異常01-生產主從關係不能建立及主從斷連問題

技術標籤：pika 整篇文章包含三種主從關係不能建立問題的解決方案 1.rename問題引起主從關係不能建立

Redis&Pika單機及主從資料遷移方案

前言:如果同步過程中發現數據量不一致,先不要斷開主從,分析一下每日進redis的資料量是否很大,以及鍵的過期時間

14DjangoORM一對一關係對映的模型類建立及資料建立和查詢

1一對一模型類Models的建立： #作者class Author(models.Model): name = models.CharField(\'姓名\',max_length=11,default=\'\')

Mysql主從複製原理及同步延遲問題

主從複製解決的問題資料分佈：通過複製將資料分佈到不同地理位置負載均衡：讀寫分離以及將讀負載到多臺從庫

Mysql主從複製原理及搭建

Mysql主從複製原理主從複製是指一臺伺服器充當主資料庫伺服器，另一臺或多臺伺服器充當從資料庫伺服器，主伺服器中的資料自動複製到從伺服器之中。對於多級複製，資料庫伺服器即可充當主機，也可充當從機。MySQL主從

MySQL主從延遲現象及原理分析詳解

一、現象凌晨對線上一張表新增索引，表資料量太大(1億+資料，資料量50G以上)，造成主從延遲幾個小時，各個依賴從庫的系統無法查詢資料，最終影響業務。

python程序的狀態、建立及使用方法詳解

本文例項講述了python程序的狀態、建立及使用方法。分享給大家供大家參考，具體如下：

PHP檢查檔案是否存在，不存在自動建立及讀取檔案內容操作示例

本文例項講述了PHP檢查檔案是否存在，不存在自動建立及讀取檔案內容操作。分享給大家供大家參考，具體如下：

使用python-Jenkins批量建立及修改jobs操作

1.使用jobsName.ini檔案儲存要建立job的名字 jobs1 jobs2 jobs3 2.使用Jenkins建立job時自動生成的config.xml檔案為模板進行批量建立jobs或修改jobs，一般生成的job會在你安裝的Jenkins目錄下找到

Python多執行緒threading建立及使用方法解析

一、執行緒建立方法 1. 普通建立 import threading def run(name): for i in range(3): 　　print(name)

SpringBoot使用Maven打包異常-引入外部jar的問題及解決方案

由於專案需要，在需要打包的時候，由於引入的外部jar在本地是可以使用的，但是當打包後啟動時報錯，找不到對應的類。

徹底搞懂Redis主從複製原理及實戰

歡迎關注公眾號：「碼農富哥」，致力於分享後端技術 (高併發架構，分散式集群系統，訊息佇列中介軟體，網路，微服務，Linux, TCP/IP, HTTP, MySQL, Redis), Python 等原創乾貨和面試指南！

01 . Shell詳細入門介紹及簡單應用

Shell簡介 Shell 是一個 C 語言編寫的指令碼語言，它是使用者與 Linux 的橋樑，使用者輸入命令交給 Shell 解釋處理Shell 將相應的操作傳遞給核心（Kernel），核心把處理的結果輸出顯示到螢幕給使用者.

Buffer的建立及使用原始碼分析——ByteBuffer為例

目錄 Buffer概述 Buffer的建立 Buffer的使用總結參考資料 Buffer概述注：全文以ByteBuffer類為例說明

從0開始，手把手教你用Vue開發一個答題App01之專案建立及答題設定頁面開發

專案演示專案演示專案原始碼專案原始碼教程說明本教程適合對Vue基礎知識有一點瞭解，但不懂得綜合運用，還未曾使用Vue從頭開發過一個小型App的讀者。本教程不對所有的Vue知識點進行講解，而是手把手一步步從0到

Spring Boot定時器建立及使用解析

建立定時器因為專案需要定時在後端執行任務重新整理資料，不需要從前端呼叫介面，所以需要使用定時器。基於註解方式@Scheduled預設為單執行緒。

20200725_0.0.1_專案建立及log4j配置

0. 摘要　　0.1 新增log4j依賴 <dependency> <groupId>org.slf4j</groupId> <artifactId>slf4j-log4j12</artifactId>

小根堆的建立及siftDown與siftUp演算法

//最大堆的構建、結點的插入和刪除與此完全類似 #include<iostream> using namespace std;

Windows服務/Linux守護建立及安裝

前言說明在微軟技術棧中，眾所周知有一類專案是用於支援WindowService，並且目前只支援Windows系列的系統。而專案的建立、除錯、安裝都相對新接觸的朋友而言還是比較複雜。

生產環境臨時性忽略MySQL主從複製模擬故障實驗

1、主伺服器(192.168.43.100) （1）安裝資料庫 # yum install -y mariadb-server # systemctl restart mariadb

PIKA異常01-生產主從關係不能建立及主從斷連問題

整篇文章包含三種主從關係不能建立問題的解決方案

1.rename問題引起主從關係不能建立

2.Timeout引起主從關係不能建立

3.主節點上已經存在從節點資訊並且不能更新引起主從關係不能建立

4.總結

相關推薦