HDFS 叢集環境搭建

阿新 • • 發佈：2021-11-22

HDFS 叢集由一個主/從架構組成，單個執行 NameNode 程序的伺服器為主節點伺服器，多個執行 DataNode 程序的伺服器為從節點伺服器

安裝準備

主機名	IP地址	伺服器
node-01	192.168.229.21	NameNode伺服器、DataNode伺服器
node-02	192.168.229.22	DataNode伺服器
node-03	192.168.229.23	DataNode伺服器

安裝步驟

1. 上傳 hadoop 安裝包到虛擬機器 node-01

安裝包存放路徑：/root/apps

複製程式碼

[root@node-01 apps]# ll
總用量 350780
-rw-r--r--. 1 root root 359196911 11月 12 16:45 hadoop-3.2.1.tar.gz

2. 解壓 hadoop 安裝包

複製程式碼

[root@node-01 apps]# tar -zxvf hadoop-3.2.1.tar.gz

3. 解壓完畢後刪除 hadoop 安裝包（太大）

複製程式碼

[root@node-01 apps]# rm -rf hadoop-3.2.1.tar.gz

4. 刪除 hadoop 文件（太大）

複製程式碼

[root@node-01 hadoop]# cd /root/apps/hadoop-3.2.1/share/
[root@node-01 share]# rm -rf doc

5. 配置 hadoop

hadoop 核心配置如下：

設定 hadoop 的預設檔案系統為：hdfs

設定 hdfs 的 namenode 節點所在虛擬機器

設定 namenode 軟體儲存元資料的本地目錄

設定 datanode 軟體存放檔案塊的本地目錄

修改 hadoop-env.sh 環境變數

vim 命令開啟 hadoop-env.sh 檔案取消 54 行 “#JAVA_HOME” 的註釋，並設定為 Java 安裝路徑

複製程式碼

[root@node-01 hadoop]# cd /root/apps/hadoop-3.2.1/etc/hadoop
[root@node-01 hadoop]# vim hadoop-env.sh
export JAVA_HOME=/root/apps/jdk1.8.0_141/

修改 core-site.xml 配置檔案

vim 命令開啟 core-site.xml 檔案，在之間新增配置項，配置 HDFS 的訪問 URL 和埠號

複製程式碼

[root@node-01 hadoop]# cd /root/apps/hadoop-3.2.1/etc/hadoop
[root@node-01 hadoop]# vim core-site.xml 
<configuration
    <!-- 指定 hdfs 的 nameservice 為 node-01 -->          
	<property>
		<name>fs.defaultFS</name>
		<value>hdfs://node-01:9000/</value>
	</property>	
</configuration>

修改 hdfs-site.xml 配置檔案

vim 命令開啟 hdfs-site.xml 檔案，在之間新增配置項，配置訪問 NameNode 和 DataNode 的元資料儲存路徑，以及 SecondaryNameNode 的訪問埠

複製程式碼

[root@node-01 hadoop]# cd /root/apps/hadoop-3.2.1/etc/hadoop
[root@node-01 hadoop]# vi hdfs-site.xml 

<configuration>
<property>
	<name>dfs.namenode.name.dir</name>
	<value>/root/apps/hadoop-3.2.1/data/namenode</value>
</property>

<property>
	<name>dfs.datanode.data.dir</name>
	<value>/root/apps/hadoop-3.2.1/data/datanode</value>
</property>
    
<property>
	<name>dfs.namenode.secondary.http-address</name>
	<value>node-02:9868</value>
</property>

</configuration>

修改 yarn-site.xml 配置檔案

vim 命令開啟 yarn-site.xml 檔案，在之間新增配置項，配置 nodemanager 和 resourcemanager 的訪問埠等資訊

複製程式碼

[root@node-01 hadoop]# cd /root/apps/hadoop-3.2.1/etc/hadoop
[root@node-01 hadoop]# vim yarn-site.xml
<configuration>
     <property>
  	 	<name>yarn.nodemanager.aux-services</name> 
         <value>mapreduce_shuffle</value>
  	</property>
    
  	<property>
  		<name>yarn.nodemanager.aux-services.mapreduce_shuffle.class</name>
  		<value>org.apache.hadoop.mapred.ShuffleHandler</value>
  	</property>
  
    <property>
   		<name>yarn.resourcemanager.resource-tracker.address</name>
  		<value>node-01:8025</value>
    </property>
  	
    <property>
   		<name>yarn.resourcemanager.scheduler.address</name> 
        <value>node-01:8030</value>
  	</property>
  
    <property>
  		<name>yarn.resourcemanager.address</name> 
         <value>node-01:8050</value>
  	</property>
</configuration>

配置 hadoop 環境變數，同時將 Hadoop 各程序的使用者設定為 root

複製程式碼

[root@node-01 hadoop-3.2.1]# cd /etc
[root@node-01 etc]# vi profile

export JAVA_HOME=/root/apps/jdk1.8.0_141/
export HADOOP_HOME=/root/apps/hadoop-3.2.1
export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

export HDFS_NAMENODE_USER=root
export HDFS_DATANODE_USER=root
export HDFS_SECONDARYNAMENODE_USER=root
export YARN_RESOURCEMANAGER_USER=root
export YARN_NODEMANAGER_USER=root

使配置的環境變數生效
複製程式碼
```
[root@node-01 etc]# source /etc/profile
```

6. 將虛擬機器 node-01 上已配置好的 hadoop 安裝目錄拷貝給其他虛擬機器

複製程式碼

# 拷貝hadoop目錄到 node-02 和 node-03
root@node-01 etc]# cd /root/apps/
[root@node-01 apps]# scp -r hadoop-3.2.1 node-02:$PWD
[root@node-01 apps]# scp -r hadoop-3.2.1 node-03:$PWD

#拷貝配置到 node-02 和 node-03
[root@node-01 hadoop-3.2.1]# cd /etc
[root@node-01 etc]# scp profile node-02:$PWD
[root@node-01 etc]# scp profile node-03:$PWD
#執行配置生效
[root@node-02 etc]# source /etc/profile
[root@node-03 etc]# source /etc/profile

7. 啟動 HDFS 的 NameNode 程序

格式化

在啟動 Hadoop 之前先要格式化，啟動後可以通過程序檢視、瀏覽檔案以及瀏覽器方式驗證 Hadoop 是否正常執行

複製程式碼

[root@node-01 etc]# hadoop namenode -format
WARNING: Use of this script to execute namenode is deprecated.
WARNING: Attempting to execute replacement "hdfs namenode" instead.

WARNING: /root/apps/hadoop-3.2.1/logs does not exist. Creating.
2020-11-13 02:08:39,891 INFO namenode.NameNode: STARTUP_MSG: 
/************************************************************
STARTUP_MSG: Starting NameNode
STARTUP_MSG:   host = node-01/192.168.229.21
STARTUP_MSG:   args = [-format]
STARTUP_MSG:   version = 3.2.1
...
2020-11-13 02:08:41,969 INFO common.Storage: Storage directory /root/hdpdata/name has been successfully formatted. #表示格式化成功

注意：如果在使用 Hadoop 的過程中出錯，或者 Hadoop 啟動不了，可能需要重新格式化。重新格式化可以參考停止 Hadoop、刪除 Hadoop 下的 data 和 logs 資料夾及進行格式化的步驟進行。

在虛擬機器 node-01 啟動 namenode 程序

複製程式碼

[root@node-01 hadoop]# hdfs --daemon start namenode
[root@node-01 hadoop]# jps 
2217 NameNode
2283 Jps

jps 命令專門用於檢視 Java 程序，可以通過 jps 命令檢視 namenode 程序是否存在，以確定啟動 namenode 程序是否成功

檢視 namenode 程序監聽的埠號

注：grep 後的 2217 是之前 jps 命令查詢到的當前 NameNode 程序號，每次啟動 NameNode 程序號是不同的

複製程式碼
```
[root@node-01 hadoop]# netstat -nltp | grep 2217
tcp        0      0 192.168.229.11:9000         0.0.0.0:*                   LISTEN      2217/java
tcp        0      0 0.0.0.0:9870                0.0.0.0:*                   LISTEN      2217/java 
```
- 9000 埠：用於客戶端與 hdfs 通訊埠
- 9870 埠：用於 hdfs 內建的 web 伺服器埠
在 windows 瀏覽器訪問 namenode 提供的 web UI 介面

url地址：http://192.168.229.21:9870（IP地址為虛擬機器 node-01 的地址）

8. 啟動 HDFS 的 DataNode

分別在虛擬機器 node-02、node-03 上啟動 DataNode 程序

第一次啟動提示 WARNING: /root/apps/hadoop-3.2.1/logs does not exist. Creating.，然後再重新啟動一次即可

複製程式碼

[root@node-02 ~]# hdfs --daemon start datanode
[root@node-02 ~]# jps
2341 DataNode
2421 Jps

[root@node-03 ~]# hdfs --daemon start datanode
[root@node-03 ~]# jps
2341 DataNode
2421 Jps

在 windows 瀏覽器訪問 datanode 提供的 web UI 介面

url地址：http://192.168.229.22:9864（ IP地址為虛擬機器 node-02 的地址）

9. 指令碼批量啟動 HDFS

單獨啟動 HDFS 叢集中的每臺虛擬機器太過繁瑣，可以通過指令碼批量啟動 HDFS

確認已配置虛擬機器 node-01 到叢集中所有虛擬機器（包含自己）的免密登陸
修改 hadoop 安裝目錄中 /etc/hadoop/workers 指令碼檔案（把需要啟動 datanode 程序的節點列入）

複製程式碼

[root@node-01 hadoop]# cd /root/apps/hadoop-3.2.1/etc/hadoop
[root@node-01 hadoop]# vi workers
node-01
node-02
node-03

在虛擬機器 node-01 上執行指令碼 start-dfs.sh 來自動啟動整個叢集 hdfs 程序
複製程式碼
```
[root@node-01 hadoop]# start-dfs.sh 
```
在虛擬機器 node-01 上執行指令碼 stop-dfs.sh 來自動停止整個叢集 hdfs 程序
複製程式碼
```
[root@node-01 hadoop]# stop-dfs.sh 
```

HDFS 叢集環境搭建

HDFS 叢集由一個主/從架構組成，單個執行 NameNode 程序的伺服器為主節點伺服器，多個執行 DataNode 程序的伺服器為從節點伺服器

Hadoop 系列（五）—— Hadoop 叢集環境搭建

一、叢集規劃這裡搭建一個 3 節點的 Hadoop 叢集，其中三臺主機均部署 DataNode 和 NodeManager 服務，但只有 hadoop001 上部署 NameNode 和 ResourceManager 服務。

Storm 系列（四）—— Storm 叢集環境搭建

一、叢集規劃這裡搭建一個 3 節點的 Storm 叢集：三臺主機上均部署 Supervisor 和 LogViewer 服務。同時為了保證高可用，除了在 hadoop001 上部署主 Nimbus 服務外，還在 hadoop002 上部署備用的 Nimbus 服務。Nimb

2.kafka叢集環境搭建

2.1.叢集主機規劃序號機器名稱ip/mac地址硬體資源安裝服務 1 cdh1 root/server123 192.168.80.100，00:50:56:2B:5B:EF

Hadoop叢集環境搭建第二步：防火牆關閉，hostname修改，免密訪問

1: 關閉防火牆(Centos6.5).叢集中每臺機器都要關閉 //臨時關閉 service iptables stop //禁止開機啟動

kubernetes叢集環境搭建

kubernetes叢集環境搭建 1.1 版本統一 Docker18.09.0 --- kubeadm-1.14.0-0 kubelet-1.14.0-0 kubectl-1.14.0-0

基於Docker的Redis叢集環境搭建【Centos7、Docker、Redis5.0.7】

1，拉取Redis最新的映象 docker pull redis:latest 2，在home目錄下新建資料夾 /docker/redisContainer/redis-cluster

Spring+Quartz叢集環境搭建

所需依賴 <dependencies>  <dependency> <groupId>org.quartz-scheduler</groupId>

win10+centos7+hadoop 叢集環境搭建

一. 前期準備 1. Vmware workstation pro 16 官網下載 :https://www.vmware.com/ 金鑰：ZF3R0-FHED2-M80TY-8QYGC-NPKYF （若失效請自行百度）

Redis叢集環境搭建

技術標籤：redis非關係型資料庫redis 環境配置只配置從庫，不用配置主庫！ 127.0.0.1:6379> info replication#檢視當前庫的資訊

（十三）Kubernetes叢集環境搭建 -- 安裝kubernetes元件

技術標籤：Kubernetes 由於kubernetes的映象在過載，速度比較慢，這裡切換成和國內的映象

k8s叢集環境搭建

環境規劃叢集型別一主多從一臺master節點和多臺node節點，搭建簡單，但是有單機故障風險，適合用於測試環境

kubernetes 叢集環境搭建

kubernetes元件一個kubernetes叢集主要是由控制節點(master)、工作節點(node)構成，每個節點上都會安裝不同的元件。

redis 叢集環境搭建

原理： 1，每個Redis群集的節點都需要開啟兩個TCP連線，由於這兩個連線就需要兩個埠，分別是用於為客戶端提供服務的常規Redis TCP命令埠（例如6379）以及通過將10000和命令埠相加（10000+6379）而獲得的埠，就是叢集

ZooKeeper 叢集環境搭建

由 node-01、node-02 和 node-03 三個節點組成 ZooKeeper 叢集環境，搭建步驟如下：步驟一：上傳 zookeeper-3.4.6.tar.gz 安裝包到 node-01 並解壓

Spark叢集環境搭建——伺服器環境初始化

Spark也是屬於Hadoop生態圈的一部分，需要用到Hadoop框架裡的HDFS儲存和YARN排程，可以用Spark來替換MR做分散式計算引擎。

K8s概述以及叢集環境搭建

　　之前學習了docker，想的成套的學習下K8S相關。　　參考：https://www.kubernetes.org.cn/k8s

TiDB本地叢集環境搭建

一、說明　　這篇文章主要為了想要體驗TiDB，又不想申請伺服器的小夥伴而作。首先你要有一臺電腦，安裝一下虛擬機器，準備一下Linux環境（最好是CentOS 7.6之後的版本）。

k8s叢集環境搭建，親測

1：機器準備這裡我們準備三臺虛擬機器，一臺master，二臺node 2：安裝前的環境確認

hadoop3.0 +hive3.x 叢集環境搭建

一、環境清單 hostname 說明已安裝軟體 hadoop235 mysql5.7 hadoop236 namenode hadoop3.0，hive-3.1.2

HDFS 叢集環境搭建

安裝準備

安裝步驟

1. 上傳 hadoop 安裝包到虛擬機器 node-01

2. 解壓 hadoop 安裝包

3. 解壓完畢後刪除 hadoop 安裝包（太大）

4. 刪除 hadoop 文件（太大）

5. 配置 hadoop

6. 將虛擬機器 node-01 上 已配置好的 hadoop 安裝目錄拷貝給其他虛擬機器

7. 啟動 HDFS 的 NameNode 程序

8. 啟動 HDFS 的 DataNode

9. 指令碼批量啟動 HDFS

相關推薦

6. 將虛擬機器 node-01 上已配置好的 hadoop 安裝目錄拷貝給其他虛擬機器