hadoop namenode HA 高可用概念及配置說明

阿新 • • 發佈：2018-12-09

可以看到之前配置的完全分散式中只有一個nn節點，不能高可用。在1x版本中存在這些問題： hdfs：nn單點故障，壓力過大，記憶體受限，擴充套件受阻。 MapReduce（MR）:jboTracker訪問壓力大，擴充套件受阻；難以支援MR以外的計算框架，如spark,storm等。

1.HA 高可用

hdfs ha ：主備切換方式解決單點故障 hdfs Federation聯邦：解決鴨梨過大。支援水平擴充套件，每個nn分管一部分目錄，所有nn共享dn資源。

這裡寫圖片描述上圖，NN實現高可用，nn副本資料得和nn主節點保持一致。 dn可以同時向兩個NN彙報資料儲存情況。而客戶端則只能訪問nn主節點，資料的一致性就需要nn主節點向nn副本同步資料了。存在常見的問題：強一致性，若一致性。強一致性：nn主節點必須等到nn副本返回成功後，才能向客戶端返回成功。主和副本之間可能會有如網路延遲、阻塞等問題，就造成了nn的不可用，違背了HA初衷。弱一致性：採用非同步方式，nn主無需等待nn副本返回成功，則會有nn副本資料同步失敗，造成兩個nn資料不一致。

這裡寫圖片描述上圖，加入nfs系統，如圖中的jn叢集。當Active節點執行任何名稱空間修改時，它會將修改記錄持久地記錄到大多數這些JN中。待機節點能夠從JN讀取編輯，並且不斷觀察它們對編輯日誌的更改。當備用節點看到編輯時，它會將它們應用到自己的名稱空間。這可確保在發生故障轉移之前完全同步名稱空間狀態，保證兩個nn資料最終的一致性。這裡nn主節點掛掉後，nn副本不能自動升級為主節點，還需人為干涉。 nn高可用上圖，加入zookeper叢集，當nn主節點掛掉，通過zk自動將nn副本升級為主節點。為了提供快速故障轉移，備用節點還必須具有關於群集中塊的位置的最新資訊。為了實現這一點，DataNode配置了所有NameNode的位置，並向NN傳送塊位置資訊和心跳 1）如何確定哪個nn是主節點圖中還新增了一個zkfc角色，是一個jvm程序，用於監控nn狀態。當nn啟動後，zkfc檢測到各自nn都已啟動正常執行後，zkfc向zk傳送建立鎖（建立在某個節點上）的訊息，誰的鎖建立成功，則對應的nn標識為主節點，其它的zkfc則會對該節點進行watch，即監控，並註冊回撥方法。 2）nn主節點掛掉後，nn副本如何升級為主節點當nn主節點掛掉後，對應的zkfc檢測到nn狀態，向zk傳送刪除鎖的訊息，鎖刪除成功後，則觸發一個事件，該事件回撥副本對應的zkfc,zkfc得到訊息後先取zk爭奪建立鎖，完成後檢測nn主節點是否掛掉，掛掉則升級副本為主節點，沒掛掉則將主節點降級為副本，將自己對應的nn升級為主節點。 3）主節點zkfc掛掉，主節點沒掛 zkfc在zk建立的鎖屬於臨時節點，該節點屬於對應的回話session。 zkfc掛掉，zkfc和zk之間tcp連結會隨之斷開，session隨之消失，鎖被刪除，觸發一個事件回撥副本的zkfc，zkfc得到訊息後先取zk爭奪建立鎖，完成後檢測nn主節點是否掛掉，掛掉則升級副本為主節點，沒掛掉則將主節點降級為副本，將自己對應的nn升級為主節點。

2. hdfs Federation 聯邦

通過多個namenode/namespace把元資料的儲存和管理分散到多個節點，以使能通過增加伺服器進行水平擴充套件。將單個nn的負載分散到多個節點中，保證了對大規模資料的處理能力。通過多個namespace隔離不同型別的應用，將不同型別應用的hdfs元資料的儲存和管理分派到不同的namenode中。

HA with QJM搭建

這裡寫圖片描述

Configuration details

配置的先後順序不重要，但其中某些配置之間存在依耐。例如： dfs.ha.namenodes.[nameservice ID] 依耐 dfs.nameservices 即如果dfs.nameservices配置value為a那麼dfs.ha.namenodes.[nameservice ID]則寫成dfs.ha.namenodes.a

hdfs-site.xml

dfs.nameservices hdfs-site.xml名稱可自定義，建議取個合理的名字。該配置影響到其它配置，也會影響到hdfs檔案系統儲存的絕對路徑。如果您還在使用HDFS Federation，則此配置設定還應包括其他名稱服務列表，HA或其他，用逗號作為分隔列表。

<property>
  <name>dfs.nameservices</name>
  <value>mycluster</value>
</property>

dfs.ha.namenodes.[nameservice ID] 讓dn確定叢集中有多少個nn。nn至少兩個，推薦3個，不建議超過5個。

<property>
  <name>dfs.ha.namenodes.mycluster</name>
  <value>nn1,nn2, nn3</value>
</property>

dfs.namenode.rpc-address.[nameservice ID].[name node ID] 偵聽的每個NameNode的完全限定的RPC地址。

<property>
  <name>dfs.namenode.rpc-address.mycluster.nn1</name>
  <value>machine1.example.com:8020</value>
</property>
<property>
  <name>dfs.namenode.rpc-address.mycluster.nn2</name>
  <value>machine2.example.com:8020</value>
</property>
<property>
  <name>dfs.namenode.rpc-address.mycluster.nn3</name>
  <value>machine3.example.com:8020</value>
</property>

dfs.namenode.http-address.[nameservice ID].[name node ID] 偵聽的每個NameNode的完全限定HTTP地址。注意：如果啟用了Hadoop的安全功能，則還應為每個NameNode設定https-address。

<property>
  <name>dfs.namenode.http-address.mycluster.nn1</name>
  <value>machine1.example.com:9870</value>
</property>
<property>
  <name>dfs.namenode.http-address.mycluster.nn2</name>
  <value>machine2.example.com:9870</value>
</property>
<property>
  <name>dfs.namenode.http-address.mycluster.nn3</name>
  <value>machine3.example.com:9870</value>
</property>

dfs.namenode.shared.edits.dir 配置JournalNodes （jn）地址。如果是管理指令碼，則會根據改地址啟動jn，如果是active nn，則會通過該地址傳輸名稱空間變更資訊。備用的nn則會通過該配置地址拉取變更資料。配置值最後的/mycluster作為儲存的根路徑，多個HA可公用伺服器進行資料儲存，節約伺服器成本。因此每個HA服務的根路徑不能一樣，便於區分。

<property>
  <name>dfs.namenode.shared.edits.dir</name>
  <value>qjournal://node1.example.com:8485;node2.example.com:8485;node3.example.com:8485/mycluster</value>
</property>

dfs.client.failover.proxy.provider.[nameservice ID] 便於客戶端確定哪個nn是主節點。對於第一次呼叫，它同時呼叫所有名稱節點以確定活動的名稱節點,之後便直接呼叫主節點（active nn ） ConfiguredFailoverProxyProvider 和RequestHedgingProxyProvider 選其一即可。

<property>
  <name>dfs.client.failover.proxy.provider.mycluster</name>
  <value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>
</property>

dfs.ha.fencing.methods 當發生故障轉移時，以前的Active NameNode仍可能向客戶端提供讀取請求，這可能已過期，直到NameNode在嘗試寫入JournalNode時關閉。因此，即使使用Quorum Journal Manager，仍然需要配置一些防護方法。但是，為了在防護機制失敗的情況下提高系統的可用性，建議配置防護方法，能確保不會發生此類情況。請注意，如果您選擇不使用實際的防護方法，則仍必須為此設定配置某些內容，例如“shell（/ bin / true）”。故障轉移期間使用的防護方法配置為回車分隔列表，將按順序嘗試，直到指示防護成功為止。 Hadoop有兩種方法：shell和sshfence。有關實現自定義防護方法的資訊，請參閱org.apache.hadoop.ha.NodeFencer類。 0.1) sshfence sshfence選項通過SSH連線到目標節點，並使用fuser來終止偵聽服務TCP埠的程序。為了使此防護選項起作用，它必須能夠在不提供密碼的情況下SSH到目標節點。因此，還必須配置dfs.ha.fencing.ssh.private-key-files選項，該選項是以逗號分隔的SSH私鑰檔案列表。如果使用ssh免密的方式，那麼兩個nn需要互相免密登陸，因為涉及到zkfc需要登陸另一臺nn將其降序的操作。

  <property>
      <name>dfs.ha.fencing.methods</name>
      <value>sshfence</value>
    </property>

    <property>
      <name>dfs.ha.fencing.ssh.private-key-files</name>
      <value>/home/exampleuser/.ssh/id_rsa</value>
    </property>

可選項，可以配置非標準使用者名稱或埠以執行SSH。也可以為SSH配置超時（以毫秒為單位），之後將認為此防護方法已失敗。

    <property>
      <name>dfs.ha.fencing.methods</name>
      <value>sshfence([[username][:port]])</value>
    </property>
    <property>
      <name>dfs.ha.fencing.ssh.connect-timeout</name>
      <value>30000</value>
    </property>

0.2) shell

通過指令碼終止active nn

   <property>
      <name>dfs.ha.fencing.methods</name>
      <value>shell(/path/to/my/script.sh arg1 arg2 ...)</value>
    </property>

core-site.xml

fs.defaultFS 配置和nameservice ID值一樣。將通過mycluster結合hdfs配置中的dfs.nameservices和dfs.ha.namenodes.mycluster找到該服務下的所有nn，確認主節點。

<property>
  <name>fs.defaultFS</name>
  <value>hdfs://mycluster</value>
</property>

dfs.journalnode.edits.dir 這是JournalNode本地儲存絕對路徑。

<property>
  <name>dfs.journalnode.edits.dir</name>
  <value>/path/to/journal/node/local/data</value>
</property>

hadoop namenode HA 高可用概念及配置說明

1.HA 高可用

2. hdfs Federation 聯邦

HA with QJM搭建

Configuration details

hdfs-site.xml

core-site.xml

hadoop namenode HA 高可用概念及配置說明

Hadoop叢集的Namenode HA高可用配置

【完全分散式Hadoop】（二）HDFS、YARN以及HA高可用概念介紹

配置Hadoop的HA(高可用)

Exchange2010高可用部署及配置

大資料之四 hadoop HDFS HA 高可用的完全分散式

MySQL-Cluster三機叢集+HA高可用+負載均衡配置手冊

Hadoop之HA高可用性

hadoop 叢集HA高可用搭建以及問題解決方案

Hadoop叢集的ResourceManager HA高可用配置

超詳細Hadoop HA高可用叢集搭建及常見問題處理

SpringCloud系列四：Eureka 服務發現框架（定義 Eureka 服務端、Eureka 服務信息、Eureka 發現管理、Eureka 安全配置、Eureka-HA(高可用) 機制、Eureka 服務打包部署）

CentOS 7部署Hadoop叢集（HA高可用叢集）

Hadoop-2.7.3 HA高可用搭建

Hadoop叢集的高可用-HA

Hadoop高可用原理及叢集的搭建

Hadoop部署（六）——CentOS 7部署Hadoop叢集（HA高可用叢集）

Hadoop叢集高可用搭建的配置檔案

centos7 hadoop HA高可用叢集搭建（ hadoop2.7 zookeeper3.4 ）

8節點(hadoop+yarn+hbase+storm+kafka+spark+zookeeper)高可用叢集詳細配置

hadoop namenode HA 高可用概念及配置說明

1.HA 高可用

2. hdfs Federation 聯邦

HA with QJM搭建

Configuration details

hdfs-site.xml

core-site.xml

相關推薦