Hadoop節點新增下線和磁碟擴容操作

阿新 • • 發佈：2019-01-13

1.增加節點

當磁碟滿了或節點不夠處理速度慢了都需要對節點或者通過增加節點的方式進行磁碟擴容,這個時候就需要用到Hadoop擴容機制了

通過如下命令可以檢視各節點情況磁碟容量等

> hadoop dfsadmin -report

筆者現在有兩個節點兩還剩下大約 33GB的容量,我們先向HDFS中寫入一些資料(筆者這裡寫入了9.1GB的資料)

> hdfs dfs -mkdir input
> hdfs dfs -put /app/install/* input

可以看到已經寫入了很多大檔案這個時候查詢叢集狀態會發現兩個節點從原本的33GB剩餘已經縮減到了23GB,因為現在我們只有兩個節點選擇的備份數量也是2個所以每份檔案都會在兩個節點中進行儲存

首先先進行節點擴容我們的hadoop-1現在只是作為了NameNode現在要把hadoop-1加入DataNode中然後把現在有的資料進行平均負載讓hadoop-1也承擔一部分檔案儲存工作

在master節點上修改slaves增加hadoop-1

> vim /usr/local/hadoop-2.7.3/etc/hadoop/slaves
hadoop-1

在需要增加到叢集的節點中指向如下命令

> hadoop-daemon.sh start datanode #啟動datanode
> yarn-daemons.sh start nodemanager #啟動yarn

在master節點上執行

hadoop dfsadmin -refreshNodes #重新整理識別新增加的節點
yarn rmadmin -refreshNodes    #重新整理yarn識別新節點

這個時候在通過 hadoop dfsadmin -report 檢視叢集狀況就可以看到增加了一個節點,但是這個節點暫時沒有儲存任何的檔案需要指向如下命令將檔案進行負載均衡

如果不balance，那麼cluster會把新的資料都存放在新的node上，但是這樣會降低mapred的工作效率設定平衡閾值，預設是10%，值越低各節點越平衡，但消耗時間也更長

start-balancer.sh -threshold 5

如果拷貝時間非常慢可以通過修改hdfs-site.xml設定balance的頻寬，預設只有1M/s

> vim /usr/local/hadoop-2.7.3/etc/hadoop/hdfs-site.xml
<property>
　　<name>dfs.balance.bandwidthPerSec</name> 
　　<value>10485760</value> 
　　<description> 
　　　　Specifies the maximum amount of bandwidth that each datanode  
　　　　can utilize for the balancing purpose in term of  
　　　　the number of bytes per second.  
　　</description>
</property>

2.下線節點

當我們不需要節點或者是需要對節點進維護(比如增加磁碟等操作需要重啟)希望能夠平滑下線Hadoop提供對應的方式

在NameNode節點中新增（或修改）如下配置項到hdfs-site.xml

> vim /usr/local/hadoop-2.7.3/etc/hadoop/hdfs-site.xml
<property>  
         <name>dfs.hosts.exclude</name>  
         <value>/usr/local/hadoop-2.7.3/etc/hadoop/dfshosts.exclude</value>   
</property>

編輯dfshosts.exclude 增加需要下線的節點名稱

> vim /usr/local/hadoop-2.7.3/etc/hadoop/dfshosts.exclude
hadoop-2

在執行下線命令

hdfs dfsadmin -refreshNodes

在通過檢視節點就會發現有一個 Decommissioning datanodes 此時任何資料都不會寫入到下線的datanode中(下線的節點中有資料的話hadoop複製該datanode block至其他datanode需要一定的下線時間)此時下線的是hadoop-2 , hadoop-2中的塊將會被遷移到 hadoop-1中,前已完成之後Decommissioning datanodes將會消失然後就可以關閉hadoop-2中的服務了,如果需要在加入到叢集中只需要去除dfshosts.exclude在重新重新整理

下線nodemanager也是一樣修改l增加如下配置

> vim /usr/local/hadoop-2.7.3/etc/hadoop/yarn-site.xml
<property>  
         <name>mapred.hosts.exclude</name>  
         <value>/usr/local/hadoop-2.7.3/etc/hadoop/dfshosts.exclude</value>   
</property>

執行下線命令

yarn rmadmin -refreshNodes

在已經下線的節點就可以正常的關閉 datanode程序

hadoop-daemon.sh stop datanode

通過 hadoop dfsadmin -report 檢視會發現hadoop-2的狀態是 Decommissioned 退役狀況這個時候檔案不會再寫入到hadoop2節點中

3.磁碟擴容

當整個叢集存入的資料量慢慢增加磁碟總會不夠,此時此刻就需要增加磁碟來解決此類問題

現在我們有3個節點可以檢視到如下資訊

> hdfs dfsadmin -report
Configured Capacity: 126421499904 (117.74 GB)
Present Capacity: 107068563456 (99.72 GB)
DFS Remaining: 81215922176 (75.64 GB)
DFS Used: 25852641280 (24.08 GB)
DFS Used%: 24.15%

此時我們給節點2進行磁碟擴容,這裡使用的阿里雲伺服器增加了一塊100GB的磁碟掛載到了hadoop-2伺服器上步驟 4：Linux 格式化和掛載資料盤_快速入門_雲伺服器 ECS-阿里雲

> df
Filesystem     1K-blocks     Used Available Use% Mounted on
/dev/vda1       41152832 13745964  25293384  36% /
/dev/vdb1      103080224    61176  97776220   1% /mnt

多出了一個 /mut 賦予許可權

> sudo chown -R hadoop:hadoop /mnt

首先現需要下線hadoop-2節點,下線之後在hadoop-2

> su hadoop
> hadoop-daemon.sh stop datanode

修改hadoop-2配置檔案vim hdfs-site.xml

> vim /usr/local/hadoop-2.7.3/etc/hadoop/hdfs-site.xml
        <property>
                <name>dfs.datanode.data.dir</name>
                <value>file:/usr/local/hadoop-2.7.3/tmp/dfs/data,file:/mnt/dfs/data</value>
        </property>

然後在啟動datanode

> hadoop-daemon.sh start datanode

在hadoop-1通過NameNode中檢視叢集狀態

> hadoop dfsadmin -report
Name: 192.168.1.102:50010 (sunmi-hadoop-2)
Hostname: sunmi-hadoop-2
Decommission Status : Decommissioned
Configured Capacity: 147694649344 (137.55 GB)
DFS Used: 9414242304 (8.77 GB)
Non DFS Used: 12258566144 (11.42 GB)
DFS Remaining: 126021840896 (117.37 GB)
DFS Used%: 6.37%
DFS Remaining%: 85.33%
Configured Cache Capacity: 0 (0 B)
Cache Used: 0 (0 B)
Cache Remaining: 0 (0 B)
Cache Used%: 100.00%
Cache Remaining%: 0.00%
Xceivers: 1
Last contact: Thu Jul 20 11:30:42 CST 2017

hadoop-2的容量就增加了然後重新讓節點上線

vim /usr/local/hadoop-2.7.3/etc/hadoop/dfshosts.exclude
# 清除
hadoop-2
# 更新節點
> hdfs dfsadmin -refreshNodes
> yarn rmadmin -refreshNodes

然後在檢視叢集狀況就增加了100GB的DFS的空間

> hadoop dfsadmin -report
Configured Capacity: 231975649280 (216.04 GB)
Present Capacity: 207191623885 (192.96 GB)
DFS Remaining: 176628416512 (164.50 GB)
DFS Used: 30563207373 (28.46 GB)
DFS Used%: 14.75%

4 總結

關於Hadoop相關的配置到這篇就已經結束了,關於Hadoop如果希望深入瞭解可以讀閱**<Hadoop權威指南>**這本書,在本次實踐中Hadoop主要起到的作用是對原資料的儲存以及提供的任務處理排程能力.後續的博文將介紹圍繞Hadoop生態展開的各項應用元件,最後多謝大家的關注我們下節再見.

尊重原創，本文為轉載摘錄，原文地址：https://my.oschina.net/wenzhenxi/blog/1591760

Hadoop節點新增下線和磁碟擴容操作

1.增加節點

2.下線節點

3.磁碟擴容

4 總結

Hadoop節點新增下線和磁碟擴容操作

修改學生資訊系統--實現新增選單和選擇選單操作功能

hadoop和hbase節點新增和單獨重啟

javascript學習筆記：DOM節點關系和操作

Linux磁碟擴容和防火牆使用_學習記錄

Openshift 節點新增和刪除

Linux磁碟掛載、分割槽、擴容操作

Worktation和Virtualbox的虛擬機器磁碟擴容方式.

Hadoop權威指南---HDFS簡介和java API操作

Kubernetes探祕-etcd節點和例項擴容

Js操作新增class和移除class

Hadoop節點的磁碟RAID

Redis學習筆記七——向叢集節點新增、刪除和分配slot

Redis叢集新增和刪除節點（主和從）

Redis主從複製和叢集配置系列之六(redis叢集節點新增、刪除、重新分配slot實戰)

Redis叢集：主從節點新增和刪除

hadoop集群配置和在windows系統上運用java操作hdfs

使用mybatis實現新增資料和idea的debug操作

Bootstrap-table的使用及如何給單元格新增功能按鈕和事件等操作！

Qt總結之三：磁碟檔案操作、遍歷資料夾和檔案目錄，並過濾和獲取檔案資訊、字尾名、字首名（三）

Hadoop節點新增下線和磁碟擴容操作

1.增加節點

2.下線節點

3.磁碟擴容

4 總結

相關推薦