Pacemaker+Corosync搭建PostgreSQL集群

阿新 • • 發佈：2017-09-14

bash regex sid inux hba clone running threshold using

https://my.oschina.net/aven92/blog/518928

· PostgreSQL中國社區： http://postgres.cn/index.php/home

· PostgreSQL專業1群： 3336901（已滿）

· PostgreSQL專業2群： 100910388

· PostgreSQL專業3群： 150657323

一、環境

$ cat /etc/redhat-release 
CentOS Linux release 7.0.1406 (Core) 
$ uname -a
Linux zhaopin-5-90 3.10.0-123.el7.x86_64 #1 SMP Mon Jun 30 12:09:22 UTC 2014 x86_64 x86_64 x86_64 GNU/Linux
node1: 172.17.5.90
node2: 172.17.5.91
node3: 172.17.5.92
vip-master: 172.17.5.99
vip-slave:  172.17.5.98

二、配置Linux集群環境

1. 安裝Pacemaker和Corosync包

在所有節點執行：

$ sudo yum install -y pacemaker pcs psmisc policycoreutils-python postgresql-server

2. 禁用防火墻

在所有節點執行：

$ sudo setenforce 0
$ sudo sed -i.bak "s/SELINUX=enforcing/SELINUX=permissive/g" /etc/selinux/config
$ sudo systemctl disable firewalld.service
$ sudo systemctl stop firewalld.service
$ sudo iptables --flush

3. 啟用pcs

在所有節點執行：

$ sudo systemctl start pcsd.service
$ sudo systemctl enable pcsd.service
ln -s ‘/usr/lib/systemd/system/pcsd.service‘ ‘/etc/systemd/system/multi-user.target.wants/pcsd.service‘
$ echo hacluster | sudo passwd hacluster --stdin
Changing password for user hacluster.
Changing password for user hacluster.
passwd: all authentication tokens updated successfully.

4. 集群認證

在任何一個節點上執行，這裏選擇node1：

$ sudo pcs cluster auth -u hacluster -p hacluster 172.17.5.90 172.17.5.91 172.17.5.92
172.17.5.90: Authorized
172.17.5.91: Authorized
172.17.5.92: Authorized

5. 同步配置

在node1上執行：

$ sudo pcs cluster setup --last_man_standing=1 --name pgcluster 172.17.5.90 172.17.5.91 172.17.5.92
Shutting down pacemaker/corosync services...
Redirecting to /bin/systemctl stop  pacemaker.service
Redirecting to /bin/systemctl stop  corosync.service
Killing any remaining services...
Removing all cluster configuration files...
172.17.5.90: Succeeded
172.17.5.91: Succeeded
172.17.5.92: Succeeded

6. 啟動集群

在node1上執行：

$ sudo pcs cluster start --all
172.17.5.90: Starting Cluster...
172.17.5.91: Starting Cluster...
172.17.5.92: Starting Cluster...

7. 檢驗

1）檢驗corosync

在node1上執行：

$ sudo pcs status corosync
Membership information
----------------------
    Nodeid      Votes Name
         1          1 172.17.5.90 (local)
         2          1 172.17.5.91
         3          1 172.17.5.92

2）檢驗pacemaker

$ sudo pcs status
Cluster name: pgcluster
WARNING: no stonith devices and stonith-enabled is not false
WARNING: corosync and pacemaker node names do not match (IPs used in setup?)
Last updated: Mon Oct 19 15:08:06 2015          Last change:
Stack: unknown
Current DC: NONE
0 nodes and 0 resources configured
Full list of resources:
PCSD Status:
  zhaopin-5-90 (172.17.5.90): Online
  zhaopin-5-91 (172.17.5.91): Online
  zhaopin-5-92 (172.17.5.92): Online
Daemon Status:
  corosync: active/disabled
  pacemaker: active/disabled
  pcsd: active/disabled

三、安裝和配置PostgreSQL

1. 創建目錄

在所有節點上執行：

$ sudo mkdir -p /data/postgresql/{data,xlog_archive}
$ sudo chown -R postgres:postgres /data/postgresql/
$ sudo chmod 0700 /data/postgresql/data

2. 初始化db

在node1上執行：

$ sudo su - postgres
$ initdb -D /data/postgresql/data/
The files belonging to this database system will be owned by user "postgres".
This user must also own the server process.
The database cluster will be initialized with locale "en_US.UTF-8".
The default database encoding has accordingly been set to "UTF8".
The default text search configuration will be set to "english".
fixing permissions on existing directory /data/postgresql/data ... ok
creating subdirectories ... ok
selecting default max_connections ... 100
selecting default shared_buffers ... 32MB
creating configuration files ... ok
creating template1 database in /data/postgresql/data/base/1 ... ok
initializing pg_authid ... ok
initializing dependencies ... ok
creating system views ... ok
loading system objects‘ descriptions ... ok
creating collations ... ok
creating conversions ... ok
creating dictionaries ... ok
setting privileges on built-in objects ... ok
creating information schema ... ok
loading PL/pgSQL server-side language ... ok
vacuuming database template1 ... ok
copying template1 to template0 ... ok
copying template1 to postgres ... ok
WARNING: enabling "trust" authentication for local connections
You can change this by editing pg_hba.conf or using the option -A, or
--auth-local and --auth-host, the next time you run initdb.
Success. You can now start the database server using:
    postgres -D /data/postgresql/data
or
    pg_ctl -D /data/postgresql/data -l logfile start

3. 修改配置文件

在node1上執行：

$ vim /data/postgresql/data/postgresql.conf
listen_addresses = ‘*‘
wal_level = hot_standby
synchronous_commit = on
archive_mode = on
archive_command = ‘cp %p /data/postgresql/xlog_archive/%f‘
max_wal_senders=5
wal_keep_segments = 32
hot_standby = on
restart_after_crash = off
replication_timeout = 5000
wal_receiver_status_interval = 2
max_standby_streaming_delay = -1
max_standby_archive_delay = -1
synchronous_commit = on
restart_after_crash = off
hot_standby_feedback = on
$ vim /data/postgresql/data/pg_hba.conf
local   all                 all                              trust
host    all                 all     172.17.0.0/16            md5
host    replication         all     172.17.0.0/16            md5

4. 啟動

在node1上執行：

$ pg_ctl -D /data/postgresql/data/ start
server starting
[    2015-10-16 08:51:31.451 UTC 53158 5620ba93.cfa6 1 0]LOG:  redirecting log output to logging collector process
[    2015-10-16 08:51:31.451 UTC 53158 5620ba93.cfa6 2 0]HINT:  Future log output will appear in directory "pg_log".
$ psql -U postgres
psql (9.2.13)
Type "help" for help.
postgres=# create role replicator with login replication password ‘8d5e9531-3817-460d-a851-659d2e51ca99‘;
CREATE ROLE
postgres=# \q

5. 制作slave

在node2和node3上執行：

$ sudo su - postgres
$ pg_basebackup -h 172.17.5.90 -U postgres -D /data/postgresql/data/ -X stream -P
could not change directory to "/home/wenhang.pan"
20127/20127 kB (100%), 1/1 tablespace
node2:
$ vim /data/postgresql/data/recovery.conf
standby_mode = ‘on‘
primary_conninfo = ‘host=172.17.5.90 port=5432 user=replicator password=8d5e9531-3817-460d-a851-659d2e51ca99 application_name=node2‘
restore_command = ‘‘
recovery_target_timeline = ‘latest‘
node3:
$ vim /data/postgresql/data/recovery.conf
standby_mode = ‘on‘
primary_conninfo = ‘host=172.17.5.90 port=5432 user=replicator password=8d5e9531-3817-460d-a851-659d2e51ca99 application_name=node3‘
restore_command = ‘‘
recovery_target_timeline = ‘latest‘

6. 啟動slave

在node2和node3上執行：

$ pg_ctl -D /data/postgresql/data/ start
pg_ctl: another server might be running; trying to start server anyway
server starting
-bash-4.2$ LOG:  database system was interrupted while in recovery at log time 2015-10-16 08:19:07 GMT
HINT:  If this has occurred more than once some data might be corrupted and you might need to choose an earlier recovery target.
LOG:  entering standby mode
LOG:  redo starts at 0/3000020
LOG:  consistent recovery state reached at 0/30000E0
LOG:  database system is ready to accept read only connections
LOG:  streaming replication successfully connected to primary

7. 查看集群狀態

在node1上執行：

$ psql -U postgres
psql (9.2.13)
Type "help" for help.
postgres=# select * from pg_stat_replication ;
  pid  | usesysid |  usename   | application_name | client_addr  | client_hostname | client_port |         backend_start         | backend_xmin |   state   | sent_location | write_location | flush_location | replay_location | sync_priority | sync_state
-------+----------+------------+------------------+--------------+-----------------+-------------+-------------------------------+--------------+-----------+---------------+----------------+----------------+-----------------+---------------+------------
 10745 |    16384 | postgres   | node2            | 172.17.5.91 |                 |       43013 | 2015-10-16 02:54:02.279384+00 |         1911 | streaming | 39/7B000060   | 39/7B000060    | 39/7B000060    | 39/7B000000     |             0 | async
 50361 |    16384 | postgres   | node3            | 172.17.5.92 |                 |       52073 | 2015-10-15 10:13:15.436745+00 |         1911 | streaming | 39/7B000060   | 39/7B000060    | 39/7B000060    | 39/7B000000     |             0 | async
(2 rows)
postgres=# \q
8. 停止PostgreSQL服務
在node1、node2和node3上執行：
$ pg_ctl -D /data/postgresql/data/ -mi stop
waiting for server to shut down.... done
server stopped

四、配置自動切換

1. 配置

在node1執行：

1）將配置步驟先寫到腳本

$ vim cluster_setup.sh
# 將cib配置保存到文件
pcs cluster cib pgsql_cfg                                                                   
# 在pacemaker級別忽略quorum
pcs -f pgsql_cfg property set no-quorum-policy="ignore"        
# 禁用STONITH           
pcs -f pgsql_cfg property set stonith-enabled="false"                    
# 設置資源粘性，防止節點在故障恢復後發生遷移     
pcs -f pgsql_cfg resource defaults resource-stickiness="INFINITY"       
# 設置多少次失敗後遷移
pcs -f pgsql_cfg resource defaults migration-threshold="3"                 
# 設置master節點虛ip
pcs -f pgsql_cfg resource create vip-master IPaddr2 ip="172.17.5.99" cidr_netmask="24"    op start   timeout="60s" interval="0s"  on-fail="restart"    op monitor timeout="60s" interval="10s" on-fail="restart"    op stop    timeout="60s" interval="0s"  on-fail="block"                             
# 設置slave節點虛ip                       
pcs -f pgsql_cfg resource create vip-slave IPaddr2 ip="172.17.5.98" cidr_netmask="24"    op start   timeout="60s" interval="0s"  on-fail="restart"    op monitor timeout="60s" interval="10s" on-fail="restart"    op stop    timeout="60s" interval="0s"  on-fail="block"                                                        
# 設置pgsql集群資源
# pgctl、psql、pgdata和config等配置根據自己的環境修改
pcs -f pgsql_cfg resource create pgsql pgsql pgctl="/opt/pgsql/bin/pg_ctl" psql="/opt/pgsql/bin/psql" pgdata="/data/postgresql/data/" config="/data/postgresql/data/postgresql.conf" rep_mode="sync" node_list="zhaopin-5-90 zhaopin-5-91 zhaopin-5-92" master_ip="172.17.5.98"  repuser="replicator" primary_conninfo_opt="password=8d5e9531-3817-460d-a851-659d2e51ca99 keepalives_idle=60 keepalives_interval=5 keepalives_count=5" restore_command="cp /data/postgresql/xlog_archive/%f %p" restart_on_promote=‘true‘ op start   timeout="60s" interval="0s"  on-fail="restart" op monitor timeout="60s" interval="4s" on-fail="restart" op monitor timeout="60s" interval="3s"  on-fail="restart" role="Master" op promote timeout="60s" interval="0s"  on-fail="restart" op demote  timeout="60s" interval="0s"  on-fail="stop" op stop    timeout="60s" interval="0s"  on-fail="block"       
 # 設置master/slave模式
pcs -f pgsql_cfg resource master pgsql-cluster pgsql master-max=1 master-node-max=1 clone-max=3 clone-node-max=1 notify=true                                                                       
# 配置master ip組
pcs -f pgsql_cfg resource group add master-group vip-master        
# 配置slave ip組     
pcs -f pgsql_cfg resource group add slave-group vip-slave                 
# 配置master ip組綁定master節點
pcs -f pgsql_cfg constraint colocation add master-group with master pgsql-cluster INFINITY    
# 配置啟動master節點
pcs -f pgsql_cfg constraint order promote pgsql-cluster then start master-group symmetrical=false score=INFINITY                                 
# 配置停止master節點                                                                   
pcs -f pgsql_cfg constraint order demote  pgsql-cluster then stop  master-group symmetrical=false score=0                                                                                                                
# 配置slave ip組綁定slave節點
pcs -f pgsql_cfg constraint colocation add slave-group with slave pgsql-cluster INFINITY         
# 配置啟動slave節點
pcs -f pgsql_cfg constraint order promote pgsql-cluster then start slave-group symmetrical=false score=INFINITY                               
# 配置停止slave節點                                                                         
pcs -f pgsql_cfg constraint order demote  pgsql-cluster then stop  slave-group symmetrical=false score=0                                                                                                                  
# 把配置文件push到cib
pcs cluster cib-push pgsql_cfg

2）執行操作文件

$ sudo sh cluster_setup.sh

2. 查看狀態

1）查看cluster狀態

在node1上執行：

$ sudo pcs status
Cluster name: pgcluster
WARNING: corosync and pacemaker node names do not match (IPs used in setup?)
Last updated: Mon Oct 19 15:10:52 2015          Last change: Mon Oct 19 15:10:12 2015 by root via crm_attribute on zhaopin-5-92
Stack: corosync
Current DC: zhaopin-5-90 (version 1.1.13-a14efad) - partition with quorum
3 nodes and 5 resources configured
Online: [ zhaopin-5-90 zhaopin-5-91 zhaopin-5-92 ]
Full list of resources:
 Master/Slave Set: pgsql-cluster [pgsql]
     Masters: [ zhaopin-5-92 ]
     Slaves: [ zhaopin-5-90 zhaopin-5-91 ]
 Resource Group: master-group
     vip-master (ocf::heartbeat:IPaddr2):       Started zhaopin-5-92
 Resource Group: slave-group
     vip-slave  (ocf::heartbeat:IPaddr2):       Started zhaopin-5-90
PCSD Status:
  zhaopin-5-90 (172.17.5.90): Online
  zhaopin-5-91 (172.17.5.91): Online
  zhaopin-5-92 (172.17.5.92): Online
Daemon Status:
  corosync: active/disabled
  pacemaker: active/disabled
  pcsd: active/disabled

2）查看PostgreSQL集群狀態

在node3上執行：

$ psql -U postgres
psql (9.2.13)
Type "help" for help.
postgres=# select * from pg_stat_replication ;
  pid  | usesysid |  usename   | application_name |  client_addr  | client_hostname | client_port |         backend_start         | backend_xmin |   state   | sent_location | write_location | flush_location | replay_location | sync_priority | sync_state
-------+----------+------------+------------------+---------------+-----------------+-------------+-------------------------------+--------------+-----------+---------------+----------------+----------------+-----------------+---------------+------------
 11522 |    16384 | replicator | zhaopin-5-91     | 172.17.5.91   |                 |       41356 | 2015-10-19 07:10:01.898257+00 |         1915 | streaming | 81/D9000000   | 81/D9000000    | 81/D9000000    | 81/D9000000     |             2 | potential
 11532 |    16384 | replicator | zhaopin-5-90     | 172.17.5.99   |                 |       41786 | 2015-10-19 07:10:01.945532+00 |         1915 | streaming | 81/D9000000   | 81/D9000000    | 81/D9000000    | 81/D9000000     |             1 | sync
(2 rows)

五、參考

從頭開始搭建集群：

http://clusterlabs.org/doc/zh-CN/Pacemaker/1.1-pcs/html-single/Clusters_from_Scratch/index.html#_verify_corosync_installation

PgSQL Replicated Cluster：

http://clusterlabs.org/wiki/PgSQL_Replicated_Cluster

Pacemaker+Corosync搭建PostgreSQL集群

bash regex sid inux hba clone running threshold using https://my.oschina.net/aven92/blog/518928 · PostgreSQL中國社區： http://postgres.cn/inde

pacemaker搭建HTTP集群

集群 pacemaker ha #以node01為例修改主機名#node02需要同樣的配置[[email protected] ~]# cat /etc/hosts 127.0.0.1 localhost localhost.localdomain localhost4 localh

corosync+pacemaker配置高可用集群

corosync 高可用 crm 一、環境介紹：Node1： CentOS6 192.168.9.168 192-168-9-168CentOS6 192.168.9.176 192-168-9-176VIP： 192.168.9.144corosync和pacemak

corosync+pacemaker配置高可用集群（需要額外安裝crm工具）

自用借鑒了網上不少博客定義：（來源於百度百科）Corosync：是集群管理套件的一部分，它在傳遞信息的時候可以通過一個簡單的配置文件來定義信息傳遞的方式和協議等。Pacemaker：是一個集群資源管理器。它利用集群基礎構件（OpenAIS 、heartbeat或corosync）提供的消息和成員管理能力來探測

2-18-搭建mysql集群實現高可用

random see 客戶 red manual 安裝mysql har 區分後臺運行 1 環境清理以及安裝 1.1 mysql舊版本清除準備5臺虛擬機，分配如下 mysql管理結點：xuegod1.cn IP：192.168.10.31 (安裝

centos下搭建redis集群

div nec dump ont wait bin 1-1 實例設置必備的工具： redis-3.0.0.tar redis-3.0.0.gem（ruby和redis接口）分析：首先，集群數需要基數，這裏搭建一個簡單的redis集群（6個redis實例進行集

用redis-trib.rb搭建redis集群

redis集群用redis-trib.rb搭建集群【常用方法】redis-trib.rb 是采用Ruby實現的redis集群管理工具；內部通過Cluster相關命令進行簡化集群創建、檢查、槽喬伊和均衡等常見運維操作；使用之前需要安裝Ruby依賴環境1、Ruby環境準備https://cache.ruby-la

windows環境下搭建redis集群

官方 replicas .com hub con https 環境變量啟動 conf Redis、Ruby語言運行環境、Redis的Ruby驅動redis-xxxx.gem、創建Redis集群的工具redis-trib.rb（註意：Redis集群需要至少3個以上節點，低於

kubernetes docker 搭建rabbitmq集群

manage aml status gin start ber 集群 gem join kubectl delete pod rabbitmq-node1 rabbitmq-node2 rabbitmq-node3 kubectl create -f pod-rabbitm

搭建zookeeper集群

style class pat stat 創建 sync cas 權限 zkserver 三臺服務器：先設置hosts 10.0.0.231 node1 10.0.0.232 node2 10.0.0.233 node3 1：解壓 zookeepe

vmware搭建hadoop集群完整過程筆記

器）修改文件權限配置環境 chmod 出現問題 2.6.0 img key文件無權限搭建hadoop集群完整過程筆記一、虛擬機和操作系統　　環境：ubuntu14+hadoop2.6+jdk1.8 　　虛擬機：vmware12 二、安裝步驟：先在一臺機器上

ubuntu16.04搭建hadoop集群環境

address hadoop 集群所有 ipv ret 加載文件 keygen -- manager 1. 系統環境Oracle VM VirtualBoxUbuntu 16.04Hadoop 2.7.4Java 1.8.0_111master：192.168.19.12

Dcoker 搭建ZooKeeper集群

sent per 並運行告訴終端 -s 我們內容分別是原來學習 ZK 時, 我是在本地搭建的偽集群, 雖然說使用起來沒有什麽問題, 但是總感覺部署起來有點麻煩. 剛好我發現了 ZK 已經有了 Docker 的鏡像了, 於是就嘗試了一下, 發現真是爽爆了, 幾個命令

MongoDB 搭建分片集群

保存數據 img name 重要過程 enables 範圍 cti eight 在MongoDB（版本 3.2.9）中，分片是指將collection分散存儲到不同的Server中，每個Server只存儲collection的一部分，服務分片的所有服務器組成分片集群。分片

基於 CentOS 7 搭建kubernetes集群

kubernetes docker 基於Centos7構建Kubernetes平臺一、實驗環境3臺centos7的主機：master 192.168.111.131部署etcd,kube-apiserver,kube-controller-manager,kube-scheduler 4個應用。no

centos7搭建kafka集群-第一篇

均衡大量 lin 事件偏移量集群 script target 產生 Kafka初識 1、Kafka使用背景在我們大量使用分布式數據庫、分布式計算集群的時候，是否會遇到這樣的一些問題：我們想分析下用戶行為（pageviews），以便我們設計出更好的廣告位我想

Amabari搭建Hadoop集群(一)

hdp ambari 一、系統環境1.系統版本[root@manager ~]# cat /etc/centos-release CentOS Linux release 7.4.1708 (Core)2.主機規劃主機名IP地址角色manager192.168.10.131ambari-serverv

Amabari搭建Hadoop集群(二)

amabr hdp 一、進入登陸頁面1.在瀏覽器中輸入ambari-server端地址，初始賬戶和密碼都是admin2.登陸後進入向導界面，點擊Launch Install Wizard3.設置集群名稱二、安裝相關組件1.選擇HDP版本，註意選擇使用本地源2.輸入其他節點的主機名或IP，並選擇SSH配

Windows下搭建Redis集群

files 兩個 oci 配置文件 create cas eas ont 線程 Windows下搭建Redis集群 Redis集群：　如果部署到多臺電腦，就跟普通的集群一樣；因為Redis是單線程處理的，多核CPU也只能使用一個核，所以部署在同一臺電腦上，通

Docker：搭建RabbitMQ集群

n) png 介紹 let tcp nod comm pytho data- RabbitMQ原理介紹（一） RabbitMQ安裝使用（二） RabbitMQ添加新用戶並支持遠程訪問（三） RabbitMQ管理命令rabbitmqctl詳解（四） RabbitMQ兩種集群模

Pacemaker+Corosync搭建PostgreSQL集群

一、環境

二、配置Linux集群環境

1. 安裝Pacemaker和Corosync包

2. 禁用防火墻

3. 啟用pcs

4. 集群認證

5. 同步配置

6. 啟動集群

7. 檢驗

三、安裝和配置PostgreSQL

1. 創建目錄

2. 初始化db

3. 修改配置文件

4. 啟動

5. 制作slave

6. 啟動slave

7. 查看集群狀態

四、配置自動切換

1. 配置

2. 查看狀態

五、參考

相關推薦