HadoopHA(高可用叢集)

阿新 • • 發佈：2020-07-26

一、介紹：

　　1、所謂HA（High Available），即高可用（7*24小時不中斷服務）

　　2、實現高可用的關鍵是消除單點故障，即HDFS的nameNode和YARN的resourceManager，所以HA機制就是HDFS的HA和YARN的HA。　

　　　　由於一個HDFS叢集由一個NameNode節點和多個DataNode節點組成，一旦NameNode節點宕機，那麼HDFS將不能進行檔案的上傳與下載。

　　　　由於一個Yarn叢集由一個ResourceManager節點和多個NodeManager節點組成，一旦ResourceManager節點宕機，那麼YARN叢集將不能進行資源的排程。

　　3、HDFS-HA工作要點：

　　　　(1)、雙nameNode來消除單點故障

　　　　(2)、元資料管理方式需要改變

　　　　　　記憶體中各自儲存一份元資料；

　　　　　　Edits日誌只有Active狀態的NameNode節點可以做寫操作；兩個NameNode都可以讀取Edits；

　　　　　　共享的Edits放在一個共享儲存中管理（qjournal和NFS兩個主流實現）；

　　　　(3)、需要一個狀態管理功能模組

　　　　　　實現了一個zkfailover，常駐在每一個namenode所在的節點，每一個zkfailover負責監控自己所在NameNode節點，

　　　　　　利用zooKeeper進行狀態標識，當需要進行狀態切換時，由zkfailover來負責切換，切換時需要防止brain splitnaolie

腦裂現象的發生。

　　　　(4)、必須保證兩個NameNode之間能夠ssh無密碼登入

　　　　(5)、隔離（Fence），即同一時刻僅僅有一個NameNode對外提供服務

　　4、HDFS-HA故障轉移機制圖解：

　　5、YARN-HA工作機制圖解：

二、HA叢集配置

1、在完全分散式叢集的基礎下

2、配置zooKeeper叢集

　　（1）將zooKeeper壓縮包放到 /opt/software/目錄下

　　（2）解壓Zookeeper安裝包到/opt/module/目錄下

　　　　[jinghang@Hadoop03 software]$ tar -zxvf zookeeper-3.4.10.tar.gz -C /opt/module/

　　（3）重新命名/opt/module/zookeeper-3.4.10/conf這個目錄下的zoo_sample.cfg為zoo.cfg

　　　　[jinghang@Hadoop03 conf]$mvzoo_sample.cfgzoo.cfg

　　（4）配置zoo.cfg檔案

　　　　修改儲存節點資料

　　　　　　dataDir=/opt/module/zookeeper-3.4.10/zkData

　　　　增加zooKeeper叢集配置

　　　　　　#######################cluster##########################

　　　　　　　　server.1=Hadoop03:2888:3888

　　　　　　server.2=Hadoop04:2888:3888

　　　　　　server.3=Hadoop05:2888:3888

　　（5）在/opt/module/zookeeper-3.4.10/這個目錄下建立zkData目錄

　　　　[jinghang@Hadoop03 zookeeper-3.4.14]$ mkdir zkData

　　（6）在/opt/module/zookeeper-3.4.10/zkData目錄下建立一個myid的檔案

　　　　[jinghang@Hadoop03 zkData]$ touch myid

　　（7）編輯myid檔案，在裡面新增伺服器ID，比如新增1

　　（8）分發配置好的zookeeper到其他機器上，並修改分發過去的伺服器的myid檔案，修改伺服器ID

　　（9）分別啟動zookeeper

　　　　　　[jinghang@Hadoop03 zookeeper-3.4.14]$bin/zkServer.sh start

　　（10）檢視狀態

　　　　[jinghang@Hadoop03 zookeeper-3.4.14]$bin/zkServer.sh status

3、配置HDFS-HA叢集

　　（1）在/opt/module/目錄下建立一個ha資料夾

　　（2）將/opt/module/下的hadoop-2.7.2拷貝到/opt/module/ha目錄下

　　（3）配置hadoop-env.sh

　　　　export JAVA_HOME=/opt/module/jdk1.8.0_144

　　（4）配置core-site.xml　　

 1 <configuration>
 2 <!-- 把兩個NameNode）的地址組裝成一個叢集mycluster -->
 3         <property>
 4             <name>fs.defaultFS</name>
 5             <value>hdfs://mycluster</value>
 6         </property>
 7 
 8         <!-- 指定hadoop執行時產生檔案的儲存目錄 -->
 9         <property>
10             <name>hadoop.tmp.dir</name>
11             <value>/opt/ha/hadoop-2.7.2/data/tmp</value>
12         </property>
13 <property>
14     <name>ha.zookeeper.quorum</name>
15     <value>hadoop102:2181,hadoop103:2181,hadoop104:2181</value>
16 </property>
17 </configuration>

core-site.xml

　　（5）配置hdfs-site.xml

 1 <configuration>
 2     <!-- 完全分散式叢集名稱 -->
 3     <property>
 4         <name>dfs.nameservices</name>
 5         <value>mycluster</value>
 6     </property>
 7 
 8     <!-- 叢集中NameNode節點都有哪些 -->
 9     <property>
10         <name>dfs.ha.namenodes.mycluster</name>
11         <value>nn1,nn2</value>
12     </property>
13 
14     <!-- nn1的RPC通訊地址 -->
15     <property>
16         <name>dfs.namenode.rpc-address.mycluster.nn1</name>
17         <value>hadoop102:9000</value>
18     </property>
19 
20     <!-- nn2的RPC通訊地址 -->
21     <property>
22         <name>dfs.namenode.rpc-address.mycluster.nn2</name>
23         <value>hadoop103:9000</value>
24     </property>
25 
26     <!-- nn1的http通訊地址 -->
27     <property>
28         <name>dfs.namenode.http-address.mycluster.nn1</name>
29         <value>hadoop102:50070</value>
30     </property>
31 
32     <!-- nn2的http通訊地址 -->
33     <property>
34         <name>dfs.namenode.http-address.mycluster.nn2</name>
35         <value>hadoop103:50070</value>
36     </property>
37 
38     <!-- 指定NameNode元資料在JournalNode上的存放位置 -->
39     <property>
40         <name>dfs.namenode.shared.edits.dir</name>
41     <value>qjournal://hadoop102:8485;hadoop103:8485;hadoop104:8485/mycluster</value>
42     </property>
43 
44     <!-- 配置隔離機制，即同一時刻只能有一臺伺服器對外響應 -->
45     <property>
46         <name>dfs.ha.fencing.methods</name>
47         <value>sshfence</value>
48     </property>
49 
50     <!-- 使用隔離機制時需要ssh無祕鑰登入-->
51     <property>
52         <name>dfs.ha.fencing.ssh.private-key-files</name>
53         <value>/home/jinghang/.ssh/id_rsa</value>
54     </property>
55 
56     <!-- 宣告journalnode伺服器儲存目錄-->
57     <property>
58         <name>dfs.journalnode.edits.dir</name>
59         <value>/opt/ha/hadoop-2.7.2/data/jn</value>
60     </property>
61 
62     <!-- 關閉許可權檢查-->
63     <property>
64         <name>dfs.permissions.enable</name>
65         <value>false</value>
66     </property>
67 
68     <!-- 訪問代理類：client，mycluster，active配置失敗自動切換實現方式-->
69     <property>
70           <name>dfs.client.failover.proxy.provider.mycluster</name>
71     <value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>
72     </property>
73 <property>
74     <name>dfs.ha.automatic-failover.enabled</name>
75     <value>true</value>
76 </property>
77 </configuration>

hdfs-site.xml

　（6）分發到其他伺服器

4、配置YARN-HA叢集
　　（1）配置yarn-site.xml

 1 <configuration>
 2 
 3     <property>
 4         <name>yarn.nodemanager.aux-services</name>
 5         <value>mapreduce_shuffle</value>
 6     </property>
 7 
 8     <!--啟用resourcemanager ha-->
 9     <property>
10         <name>yarn.resourcemanager.ha.enabled</name>
11         <value>true</value>
12     </property>
13  
14     <!--宣告兩臺resourcemanager的地址-->
15     <property>
16         <name>yarn.resourcemanager.cluster-id</name>
17         <value>cluster-yarn1</value>
18     </property>
19 
20     <property>
21         <name>yarn.resourcemanager.ha.rm-ids</name>
22         <value>rm1,rm2</value>
23     </property>
24 
25     <property>
26         <name>yarn.resourcemanager.hostname.rm1</name>
27         <value>hadoop102</value>
28     </property>
29 
30     <property>
31         <name>yarn.resourcemanager.hostname.rm2</name>
32         <value>hadoop103</value>
33     </property>
34  
35     <!--指定zookeeper叢集的地址--> 
36     <property>
37         <name>yarn.resourcemanager.zk-address</name>
38         <value>hadoop102:2181,hadoop103:2181,hadoop104:2181</value>
39     </property>
40 
41     <!--啟用自動恢復--> 
42     <property>
43         <name>yarn.resourcemanager.recovery.enabled</name>
44         <value>true</value>
45     </property>
46  
47     <!--指定resourcemanager的狀態資訊儲存在zookeeper叢集--> 
48     <property>
49         <name>yarn.resourcemanager.store.class</name>     <value>org.apache.hadoop.yarn.server.resourcemanager.recovery.ZKRMStateStore</value>
50 </property>
51 </configuration>

yarn-site.xml

　　　（2）分發到其他伺服器

5、啟動

　　（1）在各個JournalNode節點上，輸入以下命令啟動journalnode服務：

　　　　sbin/hadoop-daemon.sh start journalnode

　　（2）在[nn1]上，對其進行格式化，並啟動：

　　　　bin/hdfs namenode -format

　　　　sbin/hadoop-daemon.sh start namenode

　　（3）在[nn2]上，同步nn1的元資料資訊：

　　　　bin/hdfs namenode -bootstrapStandby

　　（4）啟動[nn2]：

　　　　sbin/hadoop-daemon.sh start namenode

　　（5）啟動所有DataNode

　　　　sbin/hadoop-daemons.sh start datanode

　　（6）再啟動各臺伺服器中的Zookeeper叢集：

　　　　bin/zkServer.sh start

　　（7）在任意伺服器初始化HA在Zookeeper中狀態：

　　　　bin/hdfs zkfc -formatZK

　　（8）在namenode所在的節點啟動HDFS服務：

　　　　sbin/start-dfs.sh

　　（9）在resourcemanager所在的伺服器執行：

　　　　sbin/start-yarn.sh

　　（10）確保兩個resourcemanager都啟動了，如果沒有啟動手動開啟：

　　　　sbin/yarn-daemon.sh start resourcemanager

　　（11）檢視服務狀態，如圖3-24所示

　　　　bin/yarn rmadmin -getServiceState rm1

　　　　bin/hdfs haadmin -getServiceState nn1

HadoopHA(高可用叢集)

一、介紹：　　1、所謂HA（High Available），即高可用（7*24小時不中斷服務）　　2、實現高可用的關鍵是消除單點故障，即HDFS的nameNode和YARN的resourceManager，所以HA機制就是HDFS的HA和YARN的HA。　

Kafka 系列（二）—— 基於 ZooKeeper 搭建 Kafka 高可用叢集

一、Zookeeper叢集搭建為保證叢集高可用，Zookeeper 叢集的節點數最好是奇數，最少有三個節點，所以這裡搭建一個三個節點的叢集。

Hadoop 系列（八）—— 基於 ZooKeeper 搭建 Hadoop 高可用叢集

一、高可用簡介 Hadoop 高可用 (High Availability) 分為 HDFS 高可用和 YARN 高可用，兩者的實現基本類似，但 HDFS NameNode 對資料儲存及其一致性的要求比 YARN ResourceManger 高得多，所以它的實現也更加複雜，故

Spark 系列（七）—— 基於 ZooKeeper 搭建 Spark 高可用叢集

一、叢集規劃這裡搭建一個 3 節點的 Spark 叢集，其中三臺主機上均部署 Worker 服務。同時為了保證高可用，除了在 hadoop001 上部署主 Master 服務外，還在 hadoop002 和 hadoop003 上分別部署備用的 Master 服務，

Keepalived+Nginx高可用叢集搭建筆記

前言 Keepalived是以VRRP（Virtual Router Redundancy Protocol，虛擬路由冗餘協議）協議為實現基礎的，這個協議可以認為是實現了路由器高可用的協議，將多臺提供相同功能的路由器組成一個路由器組。

Harbor1.9+Nginx高可用叢集倉庫搭建筆記

Harbor簡介 Harbor是一個用於儲存和分發Docker映象的企業級Registry伺服器，通過新增一些企業必需的功能特性，例如安全、標識和管理等，擴充套件了開源Docker Distribution。作為一個企業級私有Registry伺服器，Harb

寫給後端的Nginx初級入門教程:配置高可用叢集

在上一篇寫給後端的Nginx初級入門教程:實戰篇文章中我們從實際的程式碼出發，比較粗略地講解了Nginx配置檔案的結構，以及常用的功能比如複雜均衡，反向代理，動靜分離的簡單配置，事情到這裡就結束了嗎，當然沒有，就

CentOS 7.2搭建FastDFS 分散式檔案系統，實現高可用叢集

title: CentOS 7.2搭建FastDFS 分散式檔案系統，實現高可用叢集分散式叢集搭建結構

MongoDB搭建高可用叢集的完整步驟（3個分片+3個副本）

配置指令碼以及目錄下載：點我下載一、規劃好埠ip 架構圖如下，任意抽取每個副本集中的一個分片（非仲裁節點）可以組成一份完整的資料。

基於mysql+mycat搭建穩定高可用叢集負載均衡主備複製讀寫分離操作

資料庫效能優化普遍採用叢集方式，oracle叢集軟硬體投入昂貴，今天花了一天時間搭建基於mysql的叢集環境。

Springcloud eureka搭建高可用叢集過程圖解

一前言 eureka作為註冊中心，其充當著服務註冊與發現功能，載入負載均衡；若在專案執行中eureka掛了，那麼整個服務整體都會暫停，所以為服務執行的安全性，有必要搭建eureka叢集；當其中一個eureka節點掛了，我們還

02 . 分散式儲存之FastDFS 高可用叢集部署

單節點部署和原理請看上一篇文章 https://www.cnblogs.com/you-men/p/12863555.html 環境 [Fastdfs-Server]

基於Centos 7.8 和Kubeadm部署k8s高可用叢集

原文作者：Zhangguanzhang 原文連結：http://zhangguanzhang.github.io/2019/11/24/kubeadm-base-use/

Kubernetes 1.18.0 二進位制高可用叢集搭建

本文出自劉騰飛視訊教程：http://video.jessetalk.cn/ 主要步驟準備虛擬機器環境，部署好centos，做好初始準備

部署一套完整的Kubernetes高可用叢集（二進位制，v1.18版）

一、前置知識點 1.1 生產環境可部署Kubernetes叢集的兩種方式目前生產部署Kubernetes叢集主要有兩種方式：

【大資料】Hadoop的高可用叢集(HA)部署

這裡基於之前的博文，即在全分散式安裝的基礎上增量部署高可用叢集。叢集部署表如下：

使用 Sealos 在 3 分鐘內快速部署一個生產級別的 Kubernetes 高可用叢集

前提條件：安裝並啟動docker, 高版本離線包自帶docker，如沒安裝docker會自動安裝

MySQL高可用叢集

1、理論部分 1.1、技術架構 1.1.1、實現元件 1）DRBD（像跨網路的Raid1裝置）可以在網路中做塊複製的技術解決方案，可以把實際的儲存裝置，在物理裝置之上做一個邏輯裝置。然後無論你對這個裝置做任何操

centos07安裝高可用叢集實戰從零開始

從centos06過來的人喜歡使用命令列性質的黑視窗。顯然cnetos7中的inittab中已經無法修改，但還是可以看到修改方法介紹。命令列中：cat /etc/inittab獲取當前模式 systemctl get-default 修改啟動模式為命令

heatbeat-gui實現基於nfs的mysql高可用叢集

一、簡述HA高可用叢集高可用叢集就是當叢集中的一個節點發生各種軟硬體及人為故障時，叢集中的其他節點能夠自動接管故障節點的資源並向外提供服務。以實現減少業務中斷時間，為使用者提供更可靠，更高效的

HadoopHA(高可用叢集)

相關推薦