Hadoop高可用叢集

阿新 • • 發佈：2018-12-06

若HDFS叢集中只配置了一個NameNode，那麼當該NameNode所在的節點宕機，則整個HDFS就不能進行檔案的上傳和下載。

若YARN叢集中只配置了一個ResourceManager，那麼當該ResourceManager所在的節點宕機，則整個YARN就不能進行任務的計算。

*Hadoop依賴Zookeeper進行各個模組的HA配置，其中狀態為Active的節點對外提供服務，而狀態為StandBy的節點則只負責資料的同步，在必要時提供快速故障轉移。

2.HDFS HA叢集

2.1 模型

當有兩個NameNode時，提供哪個NameNode地址給客戶端？

1.Hadoop提供了NameService程序，其是NameNode的代理，維護NameNode列表並存儲NameNode的狀態，客戶端直接訪問的是NameService，NameService會將請求轉發給當前狀態為Active的NameNode。

2.當啟動HDFS時，DataNode將同時向兩個NameNode進行註冊。

怎樣發現NameNode無法提供服務以及如何進行NameNode間狀態的切換？

1.Hadoop提供了FailoverControllerActive和FailoverControllerStandBy兩個程序用於NameNode的生命監控。

2.FailoverControllerActive和FailoverControllerStandBy會分別監控對應狀態的NameNode，若NameNode無異常則定期向Zookeeper叢集傳送心跳，若在一定時間內Zookeeper叢集沒收到FailoverControllerActive傳送的心跳，則認為此時狀態為Active的NameNode已經無法對外提供服務，因此將狀態為StandBy的NameNode切換為Active狀態。

NameNode之間的資料如何進行同步和共享？

1.Hadoop提供了JournalNode用於存放NameNode中的編輯日誌。

2.當啟用的NameNode執行任何名稱空間上的修改時，它將修改的記錄儲存到JournalNode叢集中，備用的NameNode能夠實時監控JournalNode叢集中日誌的變化，當監控到日誌發生改變時會將其同步到本地。

*當狀態為Active的NameNode無法對外提供服務時，Zookeeper將會自動的將處於StandBy狀態的NameNode切換成Active。

2.2 HDFS HA高可用叢集搭建

1.配置HDFS（hdfs-site.xml）

<configuration>

<property>

<name>dfs.nameservices</name>

<value>mycluster</value>

</property>

<property>

<name>dfs.ha.namenodes.mycluster</name>

<value>nn1,nn2</value>

</property>

<property>

<name>dfs.namenode.rpc-address.mycluster.nn1</name>

<value>192.168.1.80:8020</value>

</property>

<property>

<name>dfs.namenode.rpc-address.mycluster.nn2</name>

<value>192.168.1.81:8020</value>

</property>

<property>

<name>dfs.namenode.http-address.mycluster.nn1</name>

<value>192.168.1.80:50070</value>

</property>

<property>

<name>dfs.namenode.http-address.mycluster.nn2</name>

<value>192.168.1.81:50070</value>

</property>

<property>

<name>dfs.namenode.shared.edits.dir</name>

<value>qjournal://192.168.1.80:8485;192.168.1.81:8485;192.168.1.82:8485/mycluster</value>

</property>

<property>

<name>dfs.journalnode.edits.dir</name>

<value>/usr/hadoop/hadoop-2.9.0/journalnode</value>

</property>

<property>

<name>dfs.client.failover.proxy.provider.mycluster</name>

<value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>

</property>

<property>

<name>dfs.ha.fencing.methods</name>

<value>sshfence</value>

</property>

<property>

<name>dfs.ha.fencing.ssh.private-key-files</name>

<value>/root/.ssh/id_rsa</value>

</property>

<property>

<name>dfs.ha.automatic-failover.enabled</name>

<value>true</value>

</property>

<property>

<name>ha.zookeeper.quorum</name>

<value>192.168.1.80:2181,192.168.1.81:2181,192.168.1.82:2181</value>

</property>

<property>

<name>dfs.replication</name>

<value>3</value>

</property>

<property>

<name>dfs.permissions.enabled</name>

<value>false</value>

</property>

<property>

<name>dfs.hosts.exclude</name>

<value>/usr/hadoop/hadoop-2.9.0/etc/hadoop/hdfs.exclude</value>

</property>

</configuration>

*指定NameNode的RPC通訊地址是為了接收FailoverControllerActive和FailoverControllerStandBy以及DataNode傳送的心跳。

2.配置Hadoop公共屬性（core-site.xml）

<configuration>

<property>

<name>hadoop.tmp.dir</name>

<value>/usr/hadoop/hadoop-2.9.0/data</value>

</property>

<property>

<name>fs.defaultFS</name>

<value>hdfs://mycluster</value>

</property>

<property>

<name>fs.trash.interval</name>

<value>1440</value>

</property>

</configuration>

*在HDFS HA叢集中，StandBy的NameNode會對namespace進行checkpoint操作，因此就不需要在HA叢集中執行SecondaryNameNode、CheckpintNode、BackupNode。

2.啟動HDFS HA高可用叢集

1.分別啟動JournalNode

2.格式化第一個NameNode並啟動

3.第二個NameNode同步第一個NameNode的資訊

4.啟動第二個NameNode

5.啟動Zookeeper叢集

6.格式化Zookeeper

*當格式化ZK後，ZK中將會多了hadoop-ha節點。

7.重啟HDFS叢集

當HDFS HA叢集啟動完畢後，可以分別訪問NameNode管理頁面檢視當前NameNode的狀態

*可以檢視到主機名為hadoop1的NamNode其狀態為StandBy，而主機名為hadoop2的NameNode其狀態為Active。

8.模擬NameNode宕機，手動殺死程序。

此時訪問NameNode管理頁面，可見主機名為hadoop1的NameNode其狀態從原本的StandBy切換成Active。

2.3 JAVA操作HDFS HA叢集

*由於在HDFS HA叢集中存在兩個NameNode，且服務端暴露的是NameService，因此在通過JAVA連線HDFS HA叢集時需要使用Configuration例項進行相關的配置。

/**

* @Auther: ZHUANGHAOTANG

* @Date: 2018/11/6 11:49

* @Description:

*/

public class HDFSUtils {

/**

* HDFS NamenNode URL

*/

private static final String NAMENODE_URL = "hdfs://mycluster:8020";

/**

* 配置項

*/

private static Configuration conf = null;

static {

conf = new Configuration();

//指定預設連線的NameNode,使用NameService的名稱

conf.set("fs.defaultFS", "hdfs://mycluster");

//指定NameService的名稱

conf.set("dfs.nameservices", "mycluster");

//指定NameService下的NameNode列表

conf.set("dfs.ha.namenodes.mycluster", "nn1,nn2");

//分別指定NameNode的RPC通訊地址

conf.set("dfs.namenode.rpc-address.mycluster.nn1", "hadoop1:8020");

conf.set("dfs.namenode.rpc-address.mycluster.nn2", "hadoop2:8020");

//配置NameNode失敗自動切換的方式

conf.set("dfs.client.failover.proxy.provider.mycluster", "org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider");

}

/**

* 建立目錄

*/

public static void mkdir(String dir) throws Exception {

if (StringUtils.isBlank(dir)) {

throw new Exception("Parameter Is NULL");

}

dir = NAMENODE_URL + dir;

FileSystem fs = FileSystem.get(URI.create(NAMENODE_URL), conf);

if (!fs.exists(new Path(dir))) {

fs.mkdirs(new Path(dir));

}

fs.close();

}

/**

* 刪除目錄或檔案

*/

public static void delete(String dir) throws Exception {

if (StringUtils.isBlank(dir)) {

throw new Exception("Parameter Is NULL");

}

dir = NAMENODE_URL + dir;

FileSystem fs = FileSystem.get(URI.create(NAMENODE_URL), conf);

fs.delete(new Path(dir), true);

fs.close();

}

/**

* 遍歷指定路徑下的目錄和檔案

*/

public static List<String> listAll(String dir) throws Exception {

List<String> names = new ArrayList<>();

if (StringUtils.isBlank(dir)) {

throw new Exception("Parameter Is NULL");

}

dir = NAMENODE_URL + dir;

FileSystem fs = FileSystem.get(URI.create(dir), conf);

FileStatus[] files = fs.listStatus(new Path(dir));

for (int i = 0, len = files.length; i < len; i++) {

if (files[i].isFile()) { //檔案

names.add(files[i].getPath().toString());

} else if (files[i].isDirectory()) { //目錄

names.add(files[i].getPath().toString());

} else if (files[i].isSymlink()) { //軟或硬連結

names.add(files[i].getPath().toString());

}

}

fs.close();

return names;

}

/**

* 上傳當前伺服器的檔案到HDFS中

*/

public static void uploadLocalFileToHDFS(String localFile, String hdfsFile) throws Exception {

if (StringUtils.isBlank(localFile) || StringUtils.isBlank(hdfsFile)) {

throw new Exception("Parameter Is NULL");

}

hdfsFile = NAMENODE_URL + hdfsFile;

FileSystem fs = FileSystem.get(URI.create(NAMENODE_URL), conf);

Path src = new Path(localFile);

Path dst = new Path(hdfsFile);

fs.copyFromLocalFile(src, dst);

fs.close();

}

/**

* 通過流上傳檔案

*/

public static void uploadFile(String hdfsPath, InputStream inputStream) throws Exception {

if (StringUtils.isBlank(hdfsPath)) {

throw new Exception("Parameter Is NULL");

}

hdfsPath = NAMENODE_URL + hdfsPath;

FileSystem fs = FileSystem.get(URI.create(NAMENODE_URL), conf);

FSDataOutputStream os = fs.create(new Path(hdfsPath));

BufferedInputStream bufferedInputStream = new BufferedInputStream(inputStream);

byte[] data = new byte[1024];

while (bufferedInputStream.read(data) != -1) {

os.write(data);

}

os.close();

fs.close();

}

/**

* 從HDFS中下載檔案

*/

public static byte[] readFile(String hdfsFile) throws Exception {

if (StringUtils.isBlank(hdfsFile)) {

throw new Exception("Parameter Is NULL");

}

hdfsFile = NAMENODE_URL + hdfsFile;

FileSystem fs = FileSystem.get(URI.create(NAMENODE_URL), conf);

Path path = new Path(hdfsFile);

if (fs.exists(path)) {

FSDataInputStream is = fs.open(path);

FileStatus stat = fs.getFileStatus(path);

byte[] data = new byte[(int) stat.getLen()];

is.readFully(0, data);

is.close();

fs.close();

return data;

} else {

throw new Exception("File Not Found In HDFS");

}

}

}

2.YARN HA叢集

2.1 模型

*啟動兩個ResourceManager後分別向Zookeeper註冊，通過Zookeeper管理他們的狀態，一旦狀態為Active的ResourceManager無法正常提供服務，Zookeeper將會立即將狀態為StandBy的ResourceManager切換為Active。

2.2 YARN HA高可用叢集搭建

1.配置YARN（yarn-site.xml）

<configuration>



<property>

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>



<property>

<name>yarn.log-aggregation-enable</name>

<value>true</value>

</property>



<property>

<name>yarn.log-aggregation。retain-seconds</name>

<value>864000</value>

</property>



<property>

<name>yarn.nodemanager.resource.memory-mb</name>

<value>8192</value>

</property>



<property>

<name>yarn.nodemanager.resource.cpu-vcores</name>

<value>8</value>

</property>





<property>

<name>yarn.resourcemanager.ha.enabled</name>

<value>true</value>

</property>



<property>

<name>yarn.resourcemanager.cluster-id</name>

<value>cluster1</value>

</property>



<property>

<name>yarn.resourcemanager.ha.rm-ids</name>

<value>rm1,rm2</value>

</property>



<property>

<name>yarn.resourcemanager.hostname.rm1</name>

<value>192.168.1.80</value>

</property>

<property>

<name>yarn.resourcemanager.hostname.rm2</name>

<value>192.168.1.81</value>

</property>



<property>

<name>yarn.resourcemanager.webapp.address.rm1</name>

<value>192.168.1.80:8088</value>

</property>

<property>

<name>yarn.resourcemanager.webapp.address.rm2</name>

<value>192.168.1.81:8088</value>

</property>



<property>

<name>yarn.resourcemanager.zk-address</name>

<value>192.168.1.80:2181,192.168.1.81:2181,192.168.1.82:2181</value>

</property>





<property>

<name>yarn.resourcemanager.recovery.enabled</name>

<value>true</value>

</property>



<property>

<name>yarn.resourcemanager.store.class</name>

<value>org.apache.hadoop.yarn.server.resourcemanager.recovery.ZKRMStateStore</value>

</property>



<property>

<name>yarn.resourcemanager.zk-state-store.parent-path</name>

<value>/rmstore</value>

</property>





<property>

<name>yarn.nodemanager.recovery.enabled</name>

<value>true</value>

</property>



<property>

<name>yarn.nodemanager.recovery.dir</name>

<value>/usr/hadoop/hadoop-2.9.0/data/rsnodemanager</value>

</property>



<property>

<name>yarn.nodemanager.address</name>

<value>0.0.0.0:45454</value>

</property>

</configuration>

ResourceManager Restart使用的儲存方式(實現類)

1.ResourceManager執行時的資料儲存在ZK中：org.apache.hadoop.yarn.server.resourcemanager.recovery.ZKRMStateStore

2.ResourceManager執行時的資料儲存在HDFS中：org.apache.hadoop.yarn.server.resourcemanager.recovery.FileSystemRMStateStore

3.ResourceManager執行時的資料儲存在本地：org.apache.hadoop.yarn.server.resourcemanager.recovery.LeveldbRMStateStore

*使用不同的儲存方式將需要額外的配置項，可參考官網，http://hadoop.apache.org/docs/current/hadoop-yarn/hadoop-yarn-site/ResourceManagerRestart.html

2.啟動YARN HA高可用叢集

1.在ResourceManager所在節點中啟動YARN叢集

2.手動啟動另一個ResourceManager

*當啟動YARN HA集群后，可以分別訪問ResourceManager管理頁面，http://192.168.1.80:8088、http://192.168.1.81:8088。

訪問狀態為StandBy的ResourceManager時，會將請求重定向到狀態為Active的ResourceManager的管理頁面。

3.模擬ResourceManager宕機，手動殺死程序

*Zookeeper在一定時間內無法接收到狀態為Active的ResourceManager傳送的心跳時，將會立即將狀態為StandBy的ResourceManager切換為Active。

Hadoop高可用叢集

若HDFS叢集中只配置了一個NameNode，那麼當該NameNode所在的節點宕機，則整個HDFS就不能進行檔案的上傳和下載。若YARN叢集中只配置了一個ResourceManager，那麼當該ResourceManager所在的節點宕機，則整個YARN就不能進行任務的計算。 *Hado

從零搭建hadoop高可用叢集，hbase

一，叢集規劃 PC01 PC02 PC03 NameNode NameNode hive ZKFC ZKFC ntpd ResourceManager ResourceManager DataNode DataNode DataN

hadoop 高可用叢集搭建

#關閉防火牆 systemctl disable firewalld systemctl stop firewalld #關閉selinux /etc/selinux/config 將SELINUX=enforcing 改為SELINUX=disabled sed -i

搭建hadoop高可用叢集時的錯誤 ERROR namenode.NameNode: Failed to start namenode.

在執行name node格式化（hdfs namenode -format）的時候，出現了以下無法啟動NameNode的錯誤，研究了很久，請教了本班的大神後，終於知道原因是core-site的檔案配置中 tmp 的目錄路徑寫錯了 17/07/19 01:32:48 ERR

一次性搭建Hadoop高可用叢集

前期準備： 1.修改Linux主機名 2.修改IP 3.修改主機名和IP的對映關係 /etc/hosts 注意：如果你們公司是租用的伺服器或是使用的雲主機（如華為用主機、阿里雲主機等） /etc/hosts裡面要配置的是內網IP地址和主機名的對映關係 4.關閉

Hadoop高可用叢集出現兩個standby,如何解決

如果出現兩個standby: 1.先在一個節點上先關閉zkfc: 執行 hadoop-daemon.sh stop zkfc 2.檢視狀態,另一個節點會變為active; 3.重新開啟zkfc:執行 hadoop-daemon.sh start zkfc

基於 ZooKeeper 搭建 Hadoop 高可用叢集

一、高可用簡介二、叢集規劃三、前置條件四、叢集配置五、啟動叢集六、檢視叢集七、叢集的二次啟動一、高可用簡介 Hadoop 高可用 (High Availability) 分為 HDFS 高可用和 YARN 高可用，兩者的實現基本類似，但 HDFS NameNode 對資料儲存及其一致性的要求

Hadoop 系列（八）—— 基於 ZooKeeper 搭建 Hadoop 高可用叢集

一、高可用簡介 Hadoop 高可用 (High Availability) 分為 HDFS 高可用和 YARN 高可用，兩者的實現基本類似，但 HDFS NameNode 對資料儲存及其一致性的要求比 YARN ResourceManger 高得多，所以它的實現也更加複雜，故下面先進行講解： 1.1 高可用

CentOS 7部署Hadoop叢集（HA高可用叢集）

目錄測試環境 Hadoop 組織框架 HDFS架構 YARN架構 HA叢集部署規劃自動故障轉移關於叢集主機時間 Linux環境搭建配置Java環境安裝單機版Hadoop Zookeeper叢集安裝配置環境變數關閉防火牆修

三節點高可用叢集搭建——Hadoop-HA+zookeeper

目錄 HDFS -HA模式的工作機制示意圖叢集規劃——三節點高可用 Hadoop HA叢集搭建前期準備建立新的虛擬機器配置虛擬機器克隆虛擬機器配置環境變數，重新整理（master、slave1、slave2都配置一下環境變數）安裝zookeeper叢集配置檔案拷貝檔案拷貝

zookeeper叢集、kafka叢集、Hadoop高可用

一、zookeeper叢集 1.1 zookeeper概述 1.1.1 什麼是zookeeper ZooKeeper是一個分散式的協調服務 1.1.2 ZooKeeper能幹什麼 ZooKeeper是用來保

centos7搭建hadoop高可用(ha)叢集

hadoop高可用(ha)叢集實現目標： s101和s105設定為名稱節點，可以互相切換為active狀態； s102~104設定為資料節點和journalnode節點。準備工作： 1.建立hadoop ha版本 1）進入ha建立目錄 cd /soft/ha

Hadoop高可用原理及叢集的搭建

Hadoop High Availability HA(High Available), 高可用，是保證業務連續性的有效解決方案, 通常通過設定備用節點的方式實現; 一般分為執行業務的稱為活動節點(Active)，和作為活動節點的一個備份的備用節點(Standb

Hadoop部署（六）——CentOS 7部署Hadoop叢集（HA高可用叢集）

目錄測試環境關閉防火牆測試環境 Linux系統版本：CentOS 7 64位 Hadoop 組織框架 Hadoop主要包括兩部分：一部分是HDFS（Hadoop Distr

Hadoop(25)-高可用叢集配置,HDFS-HA和YARN-HA

一. HA概述 1. 所謂HA（High Available），即高可用（7*24小時不中斷服務）。 2. 實現高可用最關鍵的策略是消除單點故障。HA嚴格來說應該分成各個元件的HA機制：HDFS的HA和YARN的HA。 3. Hadoop2.0之前，在HDFS叢集中NameNode存在單點故障（SPOF

centos7 hadoop HA高可用叢集搭建（ hadoop2.7 zookeeper3.4 ）

目錄七、總結上篇文章寫了如何用ssh免密登入，當然這些操作都是在hadoop賬號上的操作，包括這篇文章也是一樣三臺主機一、伺服器環境主機名 IP 使用者名稱密碼安裝目錄 node1 192.168.31.

8節點(hadoop+yarn+hbase+storm+kafka+spark+zookeeper)高可用叢集詳細配置

配置 hadoop+yarn+hbase+storm+kafka+spark+zookeeper 高可用叢集，同時安裝相關組建：JDK，MySQL，Hive，Flume 環境介紹節點介紹虛擬機器數量：8 臺作業系統版本：CentOS-7-x8

大資料系列（hadoop） Hadoop+Zookeeper 3節點高可用叢集搭建

原文地址：https://www.cnblogs.com/YellowstonePark/p/7750213.html一、叢集規劃主機名ipNameNodeDataNodeYarnZooKeeperJournalNodenode01192.168.1.201是是否是是node

hadoop 2.7.2 + zookeeper 高可用叢集部署

一．環境說明虛擬機器：vmware 11 作業系統：Ubuntu 16.04 Hadoop版本：2.7.2 Zookeeper版本：3.4.9 二．節點部署說明三．Hosts增加配置 sudo gedit /etc/hosts wxzz-pc、wxzz-pc0、

Hadoop-2.7.6雙namenode配置搭建（HA）高可用叢集部署教程

配置雙namenode的目的就是為了防錯，防止一個namenode掛掉資料丟失，具體原理本文不詳細講解，這裡只說明具體的安裝過程。Hadoop HA的搭建是基於Zookeeper的，關於Zookeeper的搭建可以檢視這裡 hadoop、zookeeper、hbase、spa