HDFS（NameNode）聯盟的搭建及原理的淺析

阿新 • • 發佈：2018-12-30

一、搭建HDFS聯盟

1、為什麼引入HDFS（NameNode）聯盟？

引入Federation的最主要原因是簡單，其簡單性是與真正的分散式Namenode相比而言的。Federation能夠快速的解決了大部分單Namenode HDFS的問題。

Federation是簡單魯棒的設計，由於聯盟中各個Namenode之間是相互獨立的。Federation整個核心設計實現大概用了3.5個月。大部分改變是在Datanode、Config和Tools，而Namenode本身的改動非常少，這樣Namenode原先的魯棒性不會受到影響。比分散式的Namenode簡單，雖然這種實現的擴充套件性比起真正的分散式的Namenode要小些，但是可以迅速滿足需求。另外一個原因是Federation良好的向後相容性，已有的單Namenode的部署配置不需要任何改變就可以繼續工作。

2、什麼是HDFS聯盟

HDFS Federation使用了多個獨立的Namenode/namespace來使得HDFS的命名服務能夠水平擴充套件。在HDFS Federation中的Namenode之間是聯盟關係，他們之間相互獨立且不需要相互協調。HDFS Federation中的Namenode提供了提供了名稱空間和塊管理功能。HDFS Federation中的datanode被所有的Namenode用作公共儲存塊的地方。每一個datanode都會向所在叢集中所有的Namenode註冊，並且會週期性的傳送心跳和塊資訊報告，同時處理來自Namenode的指令。

作用：（1）實現Load Balance：根據路由規則

（2）快取更多的元資訊（預設情況是儲存1000M，可以修改配置檔案增加），引入聯盟可以儲存無窮大的元資訊。

3、搭建HDFS的聯盟

（*）規劃

NameNode： bigdata12 bigdata13

DataNode: bigdata14 bigdata15

（*）準備工作：清除之前的環境

（*）在bigdata12上進行配置

hadoop-env.sh JAVA_HOME /root/training/jdk1.8.0_144

core-site.xml

<name>hadoop.tmp.dir</name>

<value>/root/training/hadoop-2.7.3/tmp</value>

</property>

mapred-site.xml

<name>mapreduce.framework.name</name>

</property>

yarn-site.xml

<name>yarn.resourcemanager.hostname</name>

<value>bigdata12</value>

</property>

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>

slaves

bigdata14

bigdata15

hdfs-site.xml

<name>dfs.nameservices</name>

</property>

<name>dfs.namenode.rpc-address.ns1</name>

</property>

<name>dfs.namenode.http-address.ns1</name>

</property>

<name>dfs.namenode.secondaryhttp-address.ns1</name>

</property>

<name>dfs.namenode.rpc-address.ns2</name>

</property>

<name>dfs.namenode.http-address.ns2</name>

</property>

<name>dfs.namenode.secondaryhttp-address.ns2</name>

</property>

<name>dfs.replication</name>

</property>

<name>dfs.permissions</name>

<value>false</value>

</property>

增加路由規則-----> core-site.xml中

<name>fs.viewfs.mounttable.abc.homedir</name>

</property>

<name>fs.viewfs.mounttable.abc.link./hahaha</name>

<value>hdfs://192.168.100.12:9000/hahaha</value>

</property>

<name>fs.viewfs.mounttable.abc.link./logs</name>

</property>

<name>fs.default.name</name>

<value>viewfs://abc</value>

</property>

注意：如果路由規則太多了，不方便維護 ----> 單獨建立一個xml檔案（mountTable.xml）

參考官方的文件：http://hadoop.apache.org/docs/r2.7.6/hadoop-project-dist/hadoop-hdfs/Federation.html

http://hadoop.apache.org/docs/r2.7.6/hadoop-project-dist/hadoop-hdfs/ViewFs.html

複製到其他節點

scp -r /root/training/hadoop-2.7.3/ [email protected]:/root/training

對每個NameNode（bigdata12 bigdata13）進行格式化

注意ID號

hdfs namenode -format -clusterId abc

在啟動Hadoop之前，應該在對應的NameNode上，建立好目錄。

hadoop fs -mkdir hdfs://192.168.100.12:9000/hahaha

hadoop fs -mkdir hdfs://192.168.100.13:9000/logs

一定要注意

[[email protected] training]# hdfs dfs -ls / 檢視到的是路由規則，不是目錄

4、通過網頁驗證是否搭建成功

HDFS（NameNode）聯盟的搭建及原理的淺析

HDFS（NameNode）聯盟的搭建及原理的淺析

HDFS（NameNode）的聯盟：Federation

熱備份路由選擇協議（HSRP）配置命令及原理

訪問控制列表（一）配置命令及原理

Netty入門（一）環境搭建及使用

Linux下compatibility test suite（CTS）的搭建及測試

開發IDEA定位到.class檔案的外掛（二）專案配置及原理詳細記錄

Spark入門實戰系列--3.Spark程式設計模型（下）--IDEA搭建及實戰

SpringBoot基本操作（一）——環境搭建及專案建立（有demo）

自己實現Spring AOP（一）環境搭建及知識準備

gcc 編譯工具（上）--- 編譯過程和原理淺析

SpringMvc學習心得（二）spring註解配置原理淺析

Git版本管理之旅（一）—— Git簡介及架構淺析

集群搭建（三）Hadoop搭建HDFS（完全分布式）

Vue 進階系列（三）之Render函式原理及實現

搭建ELK日誌分析平臺（上）—— ELK介紹及搭建 Elasticsearch 分散式叢集

NFS筆記（一）NFS伺服器工作原理及詳細配置

flask框架系列教程（一） flask簡介及虛擬環境搭建

深度學習之PyTorch實戰（1）——基礎學習及搭建環境

希爾密碼（Hill Cipher）加密演算法及原理

HDFS（NameNode）聯盟的搭建及原理的淺析

相關推薦