基於Pacemaker的PostgreSQL高可用叢集

阿新 • • 發佈：2020-12-17

一、作業系統配置(pg01 && pg02 && pg03)

1.禁用防火牆、selinux
2.同步系統時間
3.修改hosts檔案

# more /etc/hosts
127.0.0.1   localhost 
192.168.43.83    pg01
192.168.43.123   pg02
192.168.43.246   pg03
### vip ####
192.168.43.10    vip-master
192.168.43.20    vip-slave

4.配置系統引數

# vim /etc/security/limits.conf
*  soft   stack    10240
*  hard   stack    10240
*  soft    nofile  131072  
*  hard    nofile  131072  
*  soft    nproc   131072  
*  hard    nproc   131072  
*  soft    core    unlimited  
*  hard    core    unlimited 
# vim /etc/sysctl.conf
kernel.sem = 50100 64128000 50100 1280
# sysctl -p

二、安裝高可用叢集包(pg01 && pg02 && pg03)

1,安裝叢集包
# yum install -y pacemaker corosync pcs ipvsadm
2.啟用pcsd服務
# systemctl start pcsd
# systemctl enable pcsd
# systemctl enable corosync
# systemctl enable pacemaker

[root@pg02 ~]# systemctl is-enabled corosync
disabled
[root@pg02 ~]# systemctl is-enabled pcsd
enabled
[root@pg02 ~]# systemctl is-enabled pacemaker
disabled
[root@pg02 ~]# 
# 

3.設定hacluster使用者密碼
# echo hacluster|passwd hacluster --stdin
4.叢集認證
在任何一個節點上執行:
# pcs cluster auth -u hacluster -p hacluster pg01 pg02 pg03
pg03: Authorized
pg02: Authorized
pg01: Authorized
#
5.同步配置
在任何一個節點上執行:
# pcs cluster setup --last_man_standing=1 --name pgcluster pg01 pg02 pg03
Destroying cluster on nodes: pg01, pg02, pg03...
pg01: Stopping Cluster (pacemaker)...
pg03: Stopping Cluster (pacemaker)...
pg02: Stopping Cluster (pacemaker)...
pg02: Successfully destroyed cluster
pg01: Successfully destroyed cluster
pg03: Successfully destroyed cluster
Sending 'pacemaker_remote authkey' to 'pg01', 'pg02', 'pg03'
pg02: successful distribution of the file 'pacemaker_remote authkey'
pg01: successful distribution of the file 'pacemaker_remote authkey'
pg03: successful distribution of the file 'pacemaker_remote authkey'
Sending cluster config files to the nodes...
pg01: Succeeded
pg02: Succeeded
pg03: Succeeded
Synchronizing pcsd certificates on nodes pg01, pg02, pg03...
pg03: Success
pg02: Success
pg01: Success
Restarting pcsd on the nodes in order to reload the certificates...
pg03: Success
pg02: Success
pg01: Success
# 
6、啟動叢集
在任何一個節點上執行:
# pcs cluster start --all
pg01: Starting Cluster (corosync)...
pg02: Starting Cluster (corosync)...
pg03: Starting Cluster (corosync)...
pg01: Starting Cluster (pacemaker)...
pg03: Starting Cluster (pacemaker)...
pg02: Starting Cluster (pacemaker)...
#

三、install postgresql(pg01 && pg02 && pg03)

1.安裝PG
資料庫版本：pg 11.x以下版本
# yum install gcc-c++ readline-devel zlib-devel
# tar zxvf postgresql-11.10.tar.gz
# cd postgresql-11.10
# ./configure --prefix=/opt/pgsql/11.10
# make -j 2
# make install
2.配置使用者、資料目錄(pg01 && pg02 && pg03)
# useradd postgres
# passwd postgres
# vim /home/postgres/.bash_profile
新增：
export PGDATA=/pgdata
export PATH=/opt/pgsql/11.10/bin:$PATH
# mkdir /pgdata
# chown postgres.postgres /pgdata/
# chmod 700 /pgdata/
3.主節點(pg01)
[root@pg01 ~]# su - postgres
[postgres@pg01 ~]$ initdb -D /pgdata/
[postgres@pg01 ~]$ cd /pgdata/
4.配置資料庫引數
postgresql.conf
listen_addresses = '*'
wal_level = logical
wal_log_hints = on
max_wal_size = 10GB
min_wal_size = 80MB
checkpoint_completion_target = 0.9 
archive_mode = on
archive_command = '/bin/true'
wal_keep_segments = 1000
synchronous_standby_names = ''
hot_standby_feedback = on 
logging_collector = on
log_filename = 'postgresql-%a.log'
log_truncate_on_rotation = on
log_rotation_size = 0
log_min_duration_statement = 0
log_checkpoints = on
log_connections = on
log_disconnections = on
log_line_prefix = '%t [%p]: db=%d,user=%u,app=%a,client=%h '
log_lock_waits = on
log_temp_files = 0
log_autovacuum_min_duration = 0
lc_messages = 'en_US.UTF-8'
pg_hba.conf
# TYPE  DATABASE        USER            ADDRESS                 METHOD
# "local" is for Unix domain socket connections only
local   all             all                                     trust
# IPv4 local connections:
host    all             all             127.0.0.1/32            md5
host    all             all             0.0.0.0/0               md5
# IPv6 local connections:
#host    all             all             ::1/128                 trust
# Allow replication connections from localhost, by a user with the
# replication privilege.
local   replication     all                                     trust
host    replication     all             127.0.0.1/32            md5
host    replication     repluser        192.168.43.0/24         md5
5.啟動master資料庫
[root@pg01 ~]# su - postgres
Last login: Mon Dec 14 11:26:05 CST 2020 on pts/0
[postgres@pg01 ~]$ 
[postgres@pg01 ~]$ pg_ctl start -D /pgdata/
6.建立複製使用者
postgres=# create user repluser with replication password 'repluser';
CREATE ROLE
postgres=# \du
                                   List of roles
 Role name |                         Attributes                         | Member of 
-----------+------------------------------------------------------------+-----------
 postgres  | Superuser, Create role, Create DB, Replication, Bypass RLS | {}
 repluser  | Replication                                                | {}
postgres=# 
6.建立slave(pg02 && pg03)
# su - postgres
$ pg_basebackup -h pg01 -U repluser -p 5432 -D /pgdata --wal-method=stream --checkpoint=fast --progress --verbose
7.停止master(pg01)
[postgres@pg01 pgdata]$ pg_ctl stop -D /pgdata/
waiting for server to shut down.... done
server stopped
[postgres@pg01 pgdata]$ pg_ctl status -D /pgdata/
pg_ctl: no server running
[postgres@pg01 pgdata]$

注意事項：
資料庫無需配置自啟動，由叢集軟體自動拉起

四、配置叢集

# cat cluster_setup.sh
pcs cluster cib pgsql_cfg
pcs -f pgsql_cfg property set no-quorum-policy="ignore"           
pcs -f pgsql_cfg property set stonith-enabled="false"                      
pcs -f pgsql_cfg resource defaults resource-stickiness="INFINITY"      
pcs -f pgsql_cfg resource defaults migration-threshold="3"                         
#### vip-master ###               
pcs -f pgsql_cfg resource create vip-master IPaddr2 ip="192.168.43.10" cidr_netmask="24" \
op start  timeout="60s" interval="0s"  on-fail="restart"    \
op monitor timeout="60s" interval="10s" on-fail="restart"    \
op stop    timeout="60s" interval="0s"  on-fail="block"  
#### vip-slave ###                                         
pcs -f pgsql_cfg resource create vip-slave IPaddr2 ip="192.168.43.20" cidr_netmask="24" \
op start   timeout="60s" interval="0s"  on-fail="restart"    \
op monitor timeout="60s" interval="10s" on-fail="restart"    \
op stop    timeout="60s" interval="0s"  on-fail="block" 
#### pgsql resource ####                            
pcs -f pgsql_cfg resource create pgsql pgsql \
pgctl="/opt/pgsql/11.10/bin/pg_ctl" \
psql="/opt/pgsql/11.10/bin/psql" \
pgdata="/pgdata/" \
config="/pgdata/postgresql.conf" \
rep_mode="sync" node_list="pg01 pg02 pg03" master_ip="192.168.43.10"  \
repuser="repluser" \
primary_conninfo_opt="password=repluser \
keepalives_idle=60 keepalives_interval=5 keepalives_count=5" \
restart_on_promote='true' \
op start   timeout="60s" interval="0s"  on-fail="restart" \
op monitor timeout="60s" interval="4s" on-fail="restart" \
op monitor timeout="60s" interval="3s" on-fail="restart" role="Master" \
op promote timeout="60s" interval="0s"  on-fail="restart" \
op demote  timeout="60s" interval="0s"  on-fail="stop" \
op stop    timeout="60s" interval="0s"  on-fail="block"  
#### setting master #####
pcs -f pgsql_cfg resource master pgsql-cluster pgsql master-max=1 master-node-max=1 clone-max=3 clone-node-max=1 notify=true
#### master group #####
pcs -f pgsql_cfg resource group add master-group vip-master 
#### slave group #####      
pcs -f pgsql_cfg resource group add slave-group vip-slave 
#### master group setting #####             
pcs -f pgsql_cfg constraint colocation add master-group with master pgsql-cluster INFINITY  
pcs -f pgsql_cfg constraint order promote pgsql-cluster then start master-group symmetrical=false score=INFINITY                                                                                                 
pcs -f pgsql_cfg constraint order demote  pgsql-cluster then stop  master-group symmetrical=false score=0 
#### slave-group  setting  #####                                                                                              
pcs -f pgsql_cfg constraint colocation add slave-group with slave pgsql-cluster INFINITY        
pcs -f pgsql_cfg constraint order promote pgsql-cluster then start slave-group symmetrical=false score=INFINITY                                                                                                       
pcs -f pgsql_cfg constraint order demote  pgsql-cluster then stop  slave-group symmetrical=false score=0
#### push config ####
pcs cluster cib-push pgsql_cfg


修改叢集配置：

# cibadmin --query > tmp.xml
# vi tmp.xml
# cibadmin --replace --xml-file tmp.xml

五、叢集狀態檢查

[root@pg01 ~]# pcs status corosync

Membership information
----------------------
    Nodeid      Votes Name
         1          1 pg01 (local)
         2          1 pg02
         3          1 pg03
[root@pg01 ~]#

# pcs property list
Cluster Properties:
 cluster-infrastructure: corosync
 cluster-name: pgcluster
 dc-version: 1.1.23-1.el7-9acf116022
 have-watchdog: false
 no-quorum-policy: ignore
 stonith-enabled: false
Node Attributes:
 pg01: pgsql-data-status=LATEST
 pg02: pgsql-data-status=STREAMING|SYNC
 pg03: pgsql-data-status=STREAMING|ASYNC
[root@pg01 ~]# 

# pcs resource show
 Master/Slave Set: pgsql-cluster [pgsql]
     Masters: [ pg02 ]
     Slaves: [ pg01 pg03 ]
 Resource Group: master-group
     vip-master	(ocf::heartbeat:IPaddr2):	Started pg02
 Resource Group: slave-group
     vip-slave	(ocf::heartbeat:IPaddr2):	Started pg03
[root@pg02 ~]# 

pcs resource cleanup 
//xx表示虛擬資源名稱，當叢集有資源處於unmanaged的狀態時，
可以用這個命令清理掉失敗的資訊，然後重置資源狀態

[root@pg02 ~]# pcs resource cleanup
Cleaned up all resources on all nodes
[root@pg02 ~]# 


# pcs status
Cluster name: pgcluster
Stack: corosync
Current DC: pg02 (version 1.1.23-1.el7-9acf116022) - partition with quorum
Last updated: Mon Dec 14 13:26:08 2020
Last change: Mon Dec 14 13:19:49 2020 by root via crm_attribute on pg02

3 nodes configured
5 resource instances configured

Online: [ pg01 pg02 pg03 ]

Full list of resources:

 Master/Slave Set: pgsql-cluster [pgsql]
     Masters: [ pg02 ]
     Slaves: [ pg01 pg03 ]
 Resource Group: master-group
     vip-master	(ocf::heartbeat:IPaddr2):	Started pg02
 Resource Group: slave-group
     vip-slave	(ocf::heartbeat:IPaddr2):	Started pg03

Daemon Status:
  corosync: active/enabled
  pacemaker: active/enabled
  pcsd: active/enabled
[root@pg03 ~]# 

[root@pg01 ~]# crm_mon -Arf -1
Stack: corosync
Current DC: pg01 (version 1.1.23-1.el7-9acf116022) - partition with quorum
Last updated: Mon Dec 14 13:38:05 2020
Last change: Mon Dec 14 13:33:33 2020 by root via crm_attribute on pg01

3 nodes configured
5 resource instances configured

Online: [ pg01 pg02 pg03 ]

Full list of resources:

 Master/Slave Set: pgsql-cluster [pgsql]
     Masters: [ pg01 ]
     Slaves: [ pg02 pg03 ]
 Resource Group: master-group
     vip-master	(ocf::heartbeat:IPaddr2):	Started pg01
 Resource Group: slave-group
     vip-slave	(ocf::heartbeat:IPaddr2):	Started pg03

Node Attributes:
* Node pg01:
    + master-pgsql                    	: 1000      
    + pgsql-data-status               	: LATEST    
    + pgsql-master-baseline           	: 0000000008000098
    + pgsql-status                    	: PRI       
* Node pg02:
    + master-pgsql                    	: -INFINITY 
    + pgsql-data-status               	: STREAMING|ASYNC
    + pgsql-status                    	: HS:async  
* Node pg03:
    + master-pgsql                    	: 100       
    + pgsql-data-status               	: STREAMING|SYNC
    + pgsql-status                    	: HS:sync   

Migration Summary:
* Node pg01:
* Node pg02:
* Node pg03:
[root@pg01 ~]#

六、問題排查

master宕機啟動時，需要刪除臨時鎖檔案方可進行叢集角色轉換

1.檢視本機叢集狀態

[root@pg01 ~]# crm_mon -Arf -1
Stack: corosync
Current DC: pg03 (version 1.1.23-1.el7-9acf116022) - partition with quorum
Last updated: Mon Dec 14 13:39:58 2020
Last change: Mon Dec 14 13:39:02 2020 by root via crm_attribute on pg03

3 nodes configured
5 resource instances configured

Online: [ pg01 pg02 pg03 ]

Full list of resources:

 Master/Slave Set: pgsql-cluster [pgsql]
     Masters: [ pg03 ]
     Slaves: [ pg02 ]
     Stopped: [ pg01 ]
 Resource Group: master-group
     vip-master	(ocf::heartbeat:IPaddr2):	Started pg03
 Resource Group: slave-group
     vip-slave	(ocf::heartbeat:IPaddr2):	Started pg02

Node Attributes:
* Node pg01:
    + master-pgsql                    	: -INFINITY 
    + pgsql-data-status               	: DISCONNECT
    + pgsql-status                    	: STOP      
* Node pg02:
    + master-pgsql                    	: 100       
    + pgsql-data-status               	: STREAMING|SYNC
    + pgsql-status                    	: HS:sync   
* Node pg03:
    + master-pgsql                    	: 1000      
    + pgsql-data-status               	: LATEST    
    + pgsql-master-baseline           	: 0000000009000098
    + pgsql-status                    	: PRI       

Migration Summary:
* Node pg01:
   pgsql: migration-threshold=3 fail-count=1000000 last-failure='Mon Dec 14 13:39:47 2020'
* Node pg02:
* Node pg03:

Failed Resource Actions:
* pgsql_start_0 on pg01 'unknown error' (1): call=15, status=complete, exitreason='My data may be inconsistent. You have to remove /var/lib/pgsql/tmp/PGSQL.lock file to force start.',
    last-rc-change='Mon Dec 14 13:39:45 2020', queued=0ms, exec=120ms

2.刪除PGSQL.lock檔案
[root@pg01 ~]# cd /var/lib/pgsql/tmp/
[root@pg01 tmp]# ls
PGSQL.lock  rep_mode.conf
[root@pg01 tmp]# rm -rf PGSQL.lock 
[root@pg01 tmp]# ll
total 4
-rw-r----- 1 postgres postgres 31 Dec 14 13:39 rep_mode.conf
[root@pg01 tmp]# 
[root@pg01 tmp]# 

3.檢查叢集狀態
[root@pg01 tmp]# crm_mon -Arf -1
Stack: corosync
Current DC: pg03 (version 1.1.23-1.el7-9acf116022) - partition with quorum
Last updated: Mon Dec 14 13:40:18 2020
Last change: Mon Dec 14 13:39:02 2020 by root via crm_attribute on pg03

3 nodes configured
5 resource instances configured

Online: [ pg01 pg02 pg03 ]

Full list of resources:

 Master/Slave Set: pgsql-cluster [pgsql]
     Masters: [ pg03 ]
     Slaves: [ pg02 ]
     Stopped: [ pg01 ]
 Resource Group: master-group
     vip-master	(ocf::heartbeat:IPaddr2):	Started pg03
 Resource Group: slave-group
     vip-slave	(ocf::heartbeat:IPaddr2):	Started pg02

Node Attributes:
* Node pg01:
    + master-pgsql                    	: -INFINITY 
    + pgsql-data-status               	: DISCONNECT
    + pgsql-status                    	: STOP      
* Node pg02:
    + master-pgsql                    	: 100       
    + pgsql-data-status               	: STREAMING|SYNC
    + pgsql-status                    	: HS:sync   
* Node pg03:
    + master-pgsql                    	: 1000      
    + pgsql-data-status               	: LATEST    
    + pgsql-master-baseline           	: 0000000009000098
    + pgsql-status                    	: PRI       

Migration Summary:
* Node pg01:
   pgsql: migration-threshold=3 fail-count=1000000 last-failure='Mon Dec 14 13:39:47 2020'
* Node pg02:
* Node pg03:

Failed Resource Actions:
* pgsql_start_0 on pg01 'unknown error' (1): call=15, status=complete, exitreason='My data may be inconsistent. You have to remove /var/lib/pgsql/tmp/PGSQL.lock file to force start.',
    last-rc-change='Mon Dec 14 13:39:45 2020', queued=0ms, exec=120ms

3.重置並重新整理叢集狀態
[root@pg01 tmp]# crm_resource --cleanup
Cleaned up all resources on all nodes
Waiting for 1 reply from the CRMd. OK

4.檢查叢集狀態

[root@pg01 tmp]# crm_mon -Arf -1
Stack: corosync
Current DC: pg03 (version 1.1.23-1.el7-9acf116022) - partition with quorum
Last updated: Mon Dec 14 13:40:40 2020
Last change: Mon Dec 14 13:40:38 2020 by root via crm_attribute on pg03

3 nodes configured
5 resource instances configured

Online: [ pg01 pg02 pg03 ]

Full list of resources:

 Master/Slave Set: pgsql-cluster [pgsql]
     Masters: [ pg03 ]
     Slaves: [ pg01 pg02 ]
 Resource Group: master-group
     vip-master	(ocf::heartbeat:IPaddr2):	Started pg03
 Resource Group: slave-group
     vip-slave	(ocf::heartbeat:IPaddr2):	Started pg02

Node Attributes:
* Node pg01:
    + master-pgsql                    	: -INFINITY 
    + pgsql-data-status               	: STREAMING|ASYNC
    + pgsql-status                    	: HS:async  
* Node pg02:
    + master-pgsql                    	: 100       
    + pgsql-data-status               	: STREAMING|SYNC
    + pgsql-status                    	: HS:sync   
* Node pg03:
    + master-pgsql                    	: 1000      
    + pgsql-data-status               	: LATEST    
    + pgsql-master-baseline           	: 0000000009000098
    + pgsql-status                    	: PRI       

Migration Summary:
* Node pg01:
* Node pg02:
* Node pg03:
[root@pg01 tmp]# 


常用管理命令

臨時維護，只用到了以下幾個命令
pcs status //檢視叢集狀態
pcs resource show //檢視資源
pcs resource create ClusterIP IPaddr2 ip=192.168.0.120 cidr_netmask=32 //建立一個虛擬IP資源
pcs resource cleanup //xx表示虛擬資源名稱，當叢集有資源處於unmanaged的狀態時，可以用這個命令清理掉失敗的資訊，然後重置資源狀態
pcs resource list //檢視資源列表
pcs resource restart //重啟資源
pcs resource enable //啟動資源
pcs resource disable //關閉資源
pcs resource delete //刪除資源

Kafka 系列（二）—— 基於 ZooKeeper 搭建 Kafka 高可用叢集

一、Zookeeper叢集搭建為保證叢集高可用，Zookeeper 叢集的節點數最好是奇數，最少有三個節點，所以這裡搭建一個三個節點的叢集。

Hadoop 系列（八）—— 基於 ZooKeeper 搭建 Hadoop 高可用叢集

一、高可用簡介 Hadoop 高可用 (High Availability) 分為 HDFS 高可用和 YARN 高可用，兩者的實現基本類似，但 HDFS NameNode 對資料儲存及其一致性的要求比 YARN ResourceManger 高得多，所以它的實現也更加複雜，故

Spark 系列（七）—— 基於 ZooKeeper 搭建 Spark 高可用叢集

一、叢集規劃這裡搭建一個 3 節點的 Spark 叢集，其中三臺主機上均部署 Worker 服務。同時為了保證高可用，除了在 hadoop001 上部署主 Master 服務外，還在 hadoop002 和 hadoop003 上分別部署備用的 Master 服務，

基於mysql+mycat搭建穩定高可用叢集負載均衡主備複製讀寫分離操作

資料庫效能優化普遍採用叢集方式，oracle叢集軟硬體投入昂貴，今天花了一天時間搭建基於mysql的叢集環境。

基於Centos 7.8 和Kubeadm部署k8s高可用叢集

原文作者：Zhangguanzhang 原文連結：http://zhangguanzhang.github.io/2019/11/24/kubeadm-base-use/

heatbeat-gui實現基於nfs的mysql高可用叢集

一、簡述HA高可用叢集高可用叢集就是當叢集中的一個節點發生各種軟硬體及人為故障時，叢集中的其他節點能夠自動接管故障節點的資源並向外提供服務。以實現減少業務中斷時間，為使用者提供更可靠，更高效的

基於CentOS 8伺服器來搭建FastDFS高可用叢集環境

伺服器版本我們在伺服器的命令列輸入如下命令來檢視伺服器的核心版本。 [root@localhost lib]# cat /etc/redhat-release

基於Pacemaker的PostgreSQL高可用叢集

一、作業系統配置(pg01 && pg02 && pg03) 1.禁用防火牆、selinux 2.同步系統時間

七、Hadoop3.3.1 HA 高可用叢集QJM （基於Zookeeper，NameNode高可用+Yarn高可用）

目錄前文pom.xml檔案增加依賴新建java檔案：ZookeeperTestGitHub檔案下載前文一、CentOS7 hadoop3.3.1安裝(單機分散式、偽分散式、分散式

Keepalived+Nginx高可用叢集搭建筆記

前言 Keepalived是以VRRP（Virtual Router Redundancy Protocol，虛擬路由冗餘協議）協議為實現基礎的，這個協議可以認為是實現了路由器高可用的協議，將多臺提供相同功能的路由器組成一個路由器組。

Harbor1.9+Nginx高可用叢集倉庫搭建筆記

Harbor簡介 Harbor是一個用於儲存和分發Docker映象的企業級Registry伺服器，通過新增一些企業必需的功能特性，例如安全、標識和管理等，擴充套件了開源Docker Distribution。作為一個企業級私有Registry伺服器，Harb

寫給後端的Nginx初級入門教程:配置高可用叢集

在上一篇寫給後端的Nginx初級入門教程:實戰篇文章中我們從實際的程式碼出發，比較粗略地講解了Nginx配置檔案的結構，以及常用的功能比如複雜均衡，反向代理，動靜分離的簡單配置，事情到這裡就結束了嗎，當然沒有，就

CentOS 7.2搭建FastDFS 分散式檔案系統，實現高可用叢集

title: CentOS 7.2搭建FastDFS 分散式檔案系統，實現高可用叢集分散式叢集搭建結構

MongoDB搭建高可用叢集的完整步驟（3個分片+3個副本）

配置指令碼以及目錄下載：點我下載一、規劃好埠ip 架構圖如下，任意抽取每個副本集中的一個分片（非仲裁節點）可以組成一份完整的資料。

Springcloud eureka搭建高可用叢集過程圖解

一前言 eureka作為註冊中心，其充當著服務註冊與發現功能，載入負載均衡；若在專案執行中eureka掛了，那麼整個服務整體都會暫停，所以為服務執行的安全性，有必要搭建eureka叢集；當其中一個eureka節點掛了，我們還

02 . 分散式儲存之FastDFS 高可用叢集部署

單節點部署和原理請看上一篇文章 https://www.cnblogs.com/you-men/p/12863555.html 環境 [Fastdfs-Server]

Kubernetes 1.18.0 二進位制高可用叢集搭建

本文出自劉騰飛視訊教程：http://video.jessetalk.cn/ 主要步驟準備虛擬機器環境，部署好centos，做好初始準備

部署一套完整的Kubernetes高可用叢集（二進位制，v1.18版）

一、前置知識點 1.1 生產環境可部署Kubernetes叢集的兩種方式目前生產部署Kubernetes叢集主要有兩種方式：

HadoopHA(高可用叢集)

一、介紹：　　1、所謂HA（High Available），即高可用（7*24小時不中斷服務）　　2、實現高可用的關鍵是消除單點故障，即HDFS的nameNode和YARN的resourceManager，所以HA機制就是HDFS的HA和YARN的HA。　

【大資料】Hadoop的高可用叢集(HA)部署

這裡基於之前的博文，即在全分散式安裝的基礎上增量部署高可用叢集。叢集部署表如下：

基於Pacemaker的PostgreSQL高可用叢集

一、作業系統配置(pg01 && pg02 && pg03)

二、安裝高可用叢集包(pg01 && pg02 && pg03)

三、install postgresql(pg01 && pg02 && pg03)

四、配置叢集

五、叢集狀態檢查

六、問題排查

相關推薦