HDFS機架感知

阿新 • • 發佈：2022-03-26

Hadoop版本：2.9.2

什麼是機架感知

通常大型 Hadoop 叢集是以機架的形式來組織的，同一個機架上的不同節點間的網路狀況比不同機架之間的更為理想，NameNode 設法將資料塊副本儲存在不同的機架上以提高容錯性。

HDFS 不能夠自動判斷叢集中各個 DataNode 的網路狀況情況，Hadoop 允許叢集的管理員通過配置 net.topology.script.file.name 引數來確定節點所處的機架，配置檔案提供了 ip 到 rackid 的翻譯。NameNode 通過這個配置知道叢集中各個 DataNode 機器的 rackid。如果 net.topology.script.file.name 沒有設定，則每個 ip 都會被翻譯成 /default-rack。機器感知如下圖所示：

圖中的 D 和 R 是交換機，H 是 DataNode，則 H1 的 rackid = /D1/R1/H1，有了 rackid 資訊（這些 rackid 資訊可以通過 net.topology.script.file.name 配置）就可以計算出任意兩臺 DataNode 之間的距離。

distance(/D1/R1/H1 , /D1/R1/H1) = 0 相同的 DataNode
distance(/D1/R1/H1 , /D1/R1/H2) = 2 同 rack 下的不同 DataNode
distance(/D1/R1/H1 , /D1/R2/H4) = 4 同 IDC 下的不同 DataNode
distance(/D1/R1/H1 , /D2/R3/H7) = 6 不同 IDC 下的 DataNode

說明：

當沒有配置機架資訊時，所有的機器 Hadoop 都在同一個預設的機架下，名為 "/defult-rack"，這種情況的任何一臺 DataNode 機器，bug物理上是否屬於同一個機架，都會被認為是在同一個機架下。
一旦配置 net.topology.script.file.name，就按照網路拓撲結構來尋找 DataNode：net.topology.script.file.name 這個配置選項的 value 指定為一個可執行程式，通常為一個指令碼。

Hadoop機架感知的作用

不開啟機架感知的缺點

預設情況下，hadoop 的機架感知是沒有被啟用的。所以，在通常情況下，hadoop 叢集的 HDFS 在選機器的時候，是隨機選擇的。
也就是說，如果實際節點不完全在相同的機架，但是又沒有配置機架感知很有可能在寫資料時：

hadoop 將第一塊資料 block1 寫到了 rack1 上，然後隨機的選擇下將 block2 寫入到了 rack2 下，此時兩個 rack 之間產生了資料傳輸的流量，再接下來，在隨機的情況下，又將 block3 重新又寫回了 rack1，此時，兩個 rack 之間又產生了一次資料流量。在 job 處理的資料量非常的大，或者往 hadoop 推送的資料量非常大的時候，這種情況會造成 rack 之間的網路流量成倍的上升，成為效能的瓶頸，進而影響作業的效能以至於整個叢集的服務。

開啟機架感知的優勢

不同節點之間的通訊能夠儘量發生在同一個機架之內，而不是跨機架；

為了提高容錯能力，DataNode 會盡可能把資料塊的副本放到多個機架上。

機架感知的配置

檢查當前叢集機架配置情況

執行hdfs dfsadmin -printTopology列印當前機架資訊，可以看到預設所有節點都是一個機架 default-rack，此時沒有配置機架感知。

hdfs dfsadmin -printTopology

自定義機器機架位置

新建機架配置檔案topology.data

vim $HADOOP_HOME/topology.data

由於官方配置檔案沒有確切的說明到底是主機名還是 ip 地址會被傳入到指令碼，所以在指令碼中最好相容主機名和 ip 地址。

192.168.166.121   hadoop1       /switch1/rack1
192.168.166.122   hadoop2       /switch1/rack1
192.168.166.123   hadoop3       /switch1/rack2

自定義機架感知指令碼

在Hadoop的安裝目錄下新建指令碼topology.sh

vim $HADOOP_HOME/topology.sh

編寫指令碼內容

#!/bin/bash
# 此處是你的機架配置檔案topology.sh所在目錄
HADOOP_CONF=/opt/servers/hadoop
while [ $# -gt 0 ] ;
do
        #指令碼第一個引數節點ip或者主機名稱賦值給nodeArg
        nodeArg=$1
        #以只讀的方式開啟機架配置檔案
        exec<${HADOOP_CONF}/topology.data
        #宣告返回值臨時變數
        result=""
        #開始逐行讀取
        while read line
        do
                #賦值行內容給ar，通過這種 變數=（ 值 ）的方式賦值，下面可以通過陣列的方式取出每個詞
                ar=( $line )
                #判斷輸入的主機名或者ip是否和該行匹配
                if [ "${ar[0]}" = "$nodeArg" ]||[ "${ar[1]}" = "$nodeArg" ]
                then
                        #將機架資訊賦值給result
                        result="${ar[2]}"
                fi
        done
        shift
        #-z判斷字串長度是否為0，不為0輸出實際機架，為0返回預設機架資訊
        if [ -z "$result" ]
        then
                echo -n "/default-rack"
        else
                echo -n "$result"
        fi
done

配置core-site.xml檔案機架感知

指令碼必須新增可執行許可權

chmod 777 topology.sh

修改 core-site.xml 檔案。

<!-- 配置機架感知配置指令碼  -->
<property>
    <name>net.topology.script.file.name</name>
    <!-- 注意這裡是你指令碼的實際位置 -->
    <value>/opt/servers/hadoop/topology.sh</value>
</property>

分發配置檔案和指令碼

rsync-script etc/hadoop/core-site.xml

rsync-script topology.*

驗證機架感知配置

重啟叢集，執行 hdfs dfsadmin -printTopology 印表機架資訊，可以看到叢集已經按照配置感應到節點機架位置。

hdfs dfsadmin -printTopology

測試上傳檔案，因為只搭建了三個節點，因此設定副本數為2，檢視兩個副本是否存在不同的機架rack1和rack2上的節點。

在 hadoop2.8 版本之前的版本上述的結論可能不同，主要跟 Hadoop 的副本策略有關，詳細的副本策略請看 https://weixiaodyanlei.xyz/archives/hdfs-fu-ben-ji-zhi

hdfs dfs -D dfs.replication=2 -put LICENSE.txt /

可以通過如下命令檢視 HDFS 中的檔案所在機架

hdfs fsck /LICENSE.txt -blocks -files -locations -racks

參考部落格：https://blog.csdn.net/qq_31454379/article/details/105497503

HDFS機架感知

什麼是機架感知

Hadoop機架感知的作用

不開啟機架感知的缺點

開啟機架感知的優勢

機架感知的配置

檢查當前叢集機架配置情況

自定義機器機架位置

自定義機架感知指令碼

配置core-site.xml檔案機架感知

分發配置檔案和指令碼

驗證機架感知配置

HDFS 機架感知與副本放置策略

HDFS機架感知

HDFS學習：HDFS機架感知與副本放置策略

拓撲距離和機架感知+_Mvn回顧+_NN和2N之間的關係+DN原理和校驗原理

Hadoop基礎之機架感知

NN,DN,機架感知

巧用符號連結遷移 HDFS 資料，業務完全無感知！

帶你入坑大資料（一） --- HDFS基礎概念篇

HDFS的讀寫機制

HDFS的基本概念和體系結構

HDFS單點故障和線性擴充套件問題

帶你入坑大資料（二） --- HDFS的讀寫流程和一些重要策略

Hadoop 系列（一）—— 分散式檔案系統 HDFS

Hadoop 系列（七）—— HDFS Java API

Hadoop 系列（六）—— HDFS 常用 Shell 命令

Storm 系列（八）—— Storm 整合 HDFS 和 HBase

HDFS（二）高可用架構

MySQL故障切換筆記之應用無感知設計詳解

感知器基礎原理及python實現過程詳解

Sqoop從關係型資料庫往HDFS上匯入及匯出檔案

HDFS機架感知

什麼是機架感知

Hadoop機架感知的作用

不開啟機架感知的缺點

開啟機架感知的優勢

機架感知的配置

檢查當前叢集機架配置情況

自定義機器機架位置

自定義機架感知指令碼

配置core-site.xml檔案機架感知

分發配置檔案和指令碼

驗證機架感知配置

相關推薦