Hadoop完全分佈

阿新 • • 發佈：2021-11-09

完全分散式搭建

Hadoop下載地址：http://archive.apache.org/dist/hadoop/core/

這裡用的Hadoop版本是：hadoop-2.6.0.tar.gz

1. 虛擬網路編輯器

NAT模式：設定閘道器和IP

比如：
閘道器：192.168.1.2
子網：192.168.1.0	子網掩碼：255.255.255.0

2. 建立虛擬機器

2.1 建立新的虛擬機器

點選左上角檔案中的新建虛擬機器進行如下步驟：

2.2 選擇Linux的iso檔案

點選編輯虛擬機器設定

2.3 開始安裝虛擬機器

點選開始此虛擬機器

1.滑鼠點進去，用上下鍵選擇第一個回車。

2.語言選擇中文。

3.點選軟體選擇、安裝位置，點選網路和主機可以先把網路連線起。

4.然後點選開始安裝

5.設定root密碼後等待安裝完成，然後點選完成配置。

6.配置完成後點選重啟。

7.接受許可，然後點選完成配置

8.然後一直前進前進，到設定全名和密碼設定好後繼續前進，完成安裝

2.4 克隆另外兩臺虛擬機器

需先把master虛擬機器關機

然後點選下一步——》選虛擬機器中的當前狀態——》建立完整克隆——》設定名稱和位置——》完成

3. 配置三臺虛擬機器的網路

這些命令最好都進入root使用者執行

3.1 配置靜態IP

命令：

vi /etc/sysconfig/network-scripts/ifcfg-ens33

新增

BOOTPROTO="static"			//這句在檔案中已經存在，找到把他修改成static即可
IPADDR=192.168.1.110		//IP地址
GATEWAY=192.168.1.2			//閘道器
DNS1=192.168.1.2			//和閘道器保持一致即可

3.2 配置DNS

命令：

vi /etc/NetworkManager/NetworkManager.conf

新增一行內容：

dns=none

然後重啟網路管理：

systemctl restart NetworkManager.service

3.3 修改域名解析配置檔案

命令：

vi /etc/resolv.conf

新增內容：

  nameserver 192.168.1.2	//閘道器

最後重啟網路：

service network restart

ping www.baidu.com可ping通即配置成功。

3.4 設定主機名

命令：

vi /etc/sysconfig/network

新增如下內容：

#Created by anaconda
NETWORKING=yes
HOSTNAME=master      //新增

防止重啟又恢復回去：

vi /etc/hostname //修改為本機名字

例如：(設定時可把localhost刪除)

master

3.5 設定主機與ip對映

命令：

vi /etc/hosts

例如：

//ip地址       主機名
192.168.1.110 master
192.168.1.111 slave01
192.168.1.112 slave02

4. 防火牆關閉

三臺機器都需要

檢視防火牆狀態：

systemctl status firewalld.service

關閉防火牆：

systemctl stop firewalld.service

防止下次重啟防火牆自動啟動：

systemctl disable firewalld.service

5. 免金鑰登入配置

生成金鑰（三臺虛擬機器都需執行）

以master虛擬機器為例：

執行命令生成公鑰和私鑰：

ssh-keygen -t rsa		//這條命令一直回車

傳送到每臺伺服器（每臺都執行，一行一行的執行）

ssh-copy-id master
ssh-copy-id slave01
ssh-copy-id slave02

如圖所示：

測試是否成功

ssh master
ssh slave01
ssh slave02

成功如圖所示

檢視生成的檔案

ls ~/.ssh

6. 配置jdk(配置一臺其他兩臺複製過去即可)

使用Xftp軟體把檔案上傳到虛擬機器中

可在/opt中建立兩個目錄，一個放上傳的檔案，一個存放解壓後的檔案（可根據實際情況修改上傳檔案的目錄和解壓後的檔案的目錄）

cd /opt  		//進入/opt目錄
mkdir module  	//建立module目錄
mkdir software  //建立software目錄

6.1 上傳檔案

用xftp上傳jdk-8u281-linux-x64.tar.gz檔案到/opt/software中

6.2 解除安裝系統自帶jdk

檢視系統是否安裝了jdk

rpm -qa | grep jdk

解除安裝自帶的jdk

rpm -qa | grep jdk | xargs -n1 rpm -e --nodeps

6.3 解壓檔案

進入/opt/software中解壓jdk到/opt/module目錄

cd /opt/software									//進入/opt/software目錄
(tar -zxvf jdk包名 -C 指定的路徑)
tar -zxvf jdk-8u281-linux-x64.tar.gz -C /opt/module //把檔案加壓到/opt/module目錄中

6.4 設定環境變數

命令：

vi /root/.bash_profile

加入下面內容：

export JAVA_HOME=/opt/module/jdk1.8.0_281		//等號後面是jdk解壓後的路徑
export PATH=$PATH:$JAVA_HOME/bin

使設定立即生效：

source /root/.bash_profile

驗證是否成功：

java -version

7. Hadoop安裝（安裝一臺其他兩臺複製過去即可）

7.1 上傳檔案

用xftp上傳hadoop-2.6.0.tar.gz檔案到/opt/software中

7.2 解壓檔案

進入/opt/software中解壓Hadoop到/opt/module目錄

cd /opt/software								//進入/opt/software目錄
(tar -zxvf Hadoop包名 -C 指定的路徑)
tar -zxvf hadoop-2.6.0.tar.gz -C /opt/module 	//把檔案加壓到/opt/module目錄中

7.3 修改Hadoop名字

進入解壓後的Hadoop目錄進行修改

cd /opt/module
mv hadoop-2.6.0 hadoop			//修改hadoop-2.6.0為hadoop

7.4 設定環境變數

命令：

vi /root/.bash_profile

加入下面內容：

export HADOOP_HOME=/opt/module/hadoop				//等號後面是hadoop解壓後的路徑
export PATH=$PATH:$HADOOP_HOME/bin
export PATH=$PATH:$HADOOP_HOME/sbin

使設定立即生效

source /root/.bash_profile

驗證是否成功

hadoop version

這裡的環境變數配好後，可用scp複製到其他兩個節點

scp -r 存放的路徑 root@遠端登入名:複製到遠端登入名節點的路徑
slave01節點：
scp -r /root/.bash_profile root@slave01:/root/.bash_profile		//複製到slave01節點上
slave02節點：
scp -r /root/.bash_profile root@slave02:/root/.bash_profile		//複製到slave02節點上

7.5 複製jdk、Hadoop到其他兩個節點

命令：

scp -r 存放的路徑 root@遠端登入名:複製到遠端登入名節點的路徑
slave01節點：
scp -r /opt/module/ root@slave01:/opt/module	//複製到slave01節點上
slave02節點：
scp -r /opt/module/ root@slave02:/opt/module	//複製到slave02節點上

7.6 配置Hadoop

配置前進入hadoop中的/etc/hadoop

cd /opt/module/hadoop/etc/hadoop

7.6.1 修改hadoop-env.sh、yarn-env.sh、mapred-env.sh

找到JAVA_HOME修改他們的JAVA_HOME路徑

命令：

vi hadoop-env.sh		//進入hadoop-env.sh進行修改
vi yarn-env.sh			//進入yarn-env.sh進行修改
vi mapred-env.sh		//進入mapred-env.sh進行修改

配置其中的 JAVA_HOME 路徑(路徑根據自己虛擬機器上的配置來定)

export JAVA_HOME=/opt/module/jdk1.8.0_281

7.6.2 配置core-site.xml

命令：

vi core-site.xml

在中新增如下：

<!-- 指定 HDFS 中 NameNode 的地址 -->
<property>
	<name>fs.defaultFS</name>
	<value>hdfs://master:9000</value>
</property>
<!-- 指定 Hadoop 執行時產生檔案的儲存目錄 -->
<property>
	<name>hadoop.tmp.dir</name>
	<value>/hadoop安裝路徑/data</value>
</property>

7.6.3 配置hdfs-site.xml

命令：

vi hdfs-site.xml

在中新增如下：

<property>
<!--指定 HDFS 副本數量-->
	<name>dfs.replication</name>
	<value>3</value>
</property>
<!-- 指定 Hadoop 輔助名稱節點主機配置 -->
<property>
	<name>dfs.namenode.secondary.http-address</name>
	<value>master:50090</value>
</property>

7.6.4 配置yarn-site.xml

命令：

vi yarn-site.xml

在中新增如下：

<!-- Reducer 獲取資料的方式 -->
<property>
	<name>yarn.nodemanager.aux-services</name>
	<value>mapreduce_shuffle</value>
</property>
<!-- 指定 YARN 的 ResourceManager 的地址 -->
<property>
	<name>yarn.resourcemanager.hostname</name>
	<value>master</value>
</property>

7.6.5 配置mapred-site.xml

配置前先把mapred-site.xml.template名字改為mapred-site.xml

mv mapred-site.xml.template mapred-site.xml

進入mapred-site.xml進行修改

vi mapred-site.xml

在中新增如下：

<!-- 指定 MR 執行在 Yarn 上 -->
<property>
	<name>mapreduce.framework.name</name>
	<value>yarn</value>
</property>

7.6.6 配置 slavers(意為每次啟動那些叢集)

命令：

vi slaves

新增如下：

master
slave01
slave02

7.6.7 分發配置檔案

使用 rsync 命令，同步 {hadoop安裝路徑} / etc 下的配置檔案
rsync -av /Hadoop安裝路徑/etc/hadoop root@遠端登入名:/Hadoop安裝路徑/etc/hadoop
例如：
slave01節點：
rsync -av /opt/module/hadoop/etc/hadoop root@slave01:/opt/module/hadoop/etc
slave02節點：
rsync -av /opt/module/hadoop/etc/hadoop root@slave02:/opt/module/hadoop/etc

8 啟動叢集並測試

（1）第一次啟動要格式化

命令:

hdfs namenode -format

如果格式化報錯要刪除data和logs在進行修改之後在進行第二次格式化

（2）啟動叢集（需進入hadoop安裝目錄）

sbin/start-all.sh

（3）關閉叢集（需進入hadoop安裝目錄）

sbin/stop-all.sh

（4）驗證

jps

如圖所示：

（5）測試

Mapper測試能否跑通

建立資料夾：

hadoop fs -mkdir /input

上傳檔案到input資料夾：

hadoop fs -put 需要上傳的檔名 上傳到的檔案路徑
示例: hadoop fs -put job_list.json /input

輸出檔案：

hadoop jar MapReduceExer.jar 輸入路徑 輸出路徑(事先不能存在)
示例: hadoop jar MapReduceExer.jar /input/job_list.json /output

如圖所示：

瀏覽器檢視：

瀏覽器輸入：機器IP地址:50070-------例如：192.168.1.110:50070

如圖：

Hadoop完全分佈模式的搭建

Hadoop完全分佈模式的搭建目錄1.安裝前準備2.修改主機名3.對映IP地址及主機名4.免密登入設定5.安裝NTP服務6.安裝Hadoop7.設定Hadoop配置檔案8.格式化HDFS9.啟動Hadoop10.驗證Hadoop程序11.通過Web訪問Hadoop

Hadoop完全分佈

完全分散式搭建 Hadoop下載地址：http://archive.apache.org/dist/hadoop/core/ 這裡用的Hadoop版本是：hadoop-2.6.0.tar.gz

Hadoop完整搭建過程（三）：完全分佈模式（虛擬機器）

1 完全分佈模式完全分佈模式是比本地模式與偽分佈模式更加複雜的模式，真正利用多臺Linux主機來進行部署Hadoop，對叢集進行規劃，使得Hadoop各個模組分別部署在不同的多臺機器上，這篇文章介紹的是通過三臺虛擬機器

Hadoop完整搭建過程（四）：完全分佈模式（伺服器）

1 概述上一篇文章介紹瞭如何使用虛擬機器搭建叢集，到了這篇文章就是實戰了，使用真實的三臺不同伺服器進行Hadoop叢集的搭建。具體步驟其實與虛擬機器的差不多，但是由於安全組以及埠等等一些列的問題，會與虛擬機器

hadoop學習筆記之-hbase完全分佈模式安裝-5

http://blog.csdn.net/lichangzai/article/details/8441975 http://blog.csdn.net/jpiverson/article/details/9130447

Hadoop 完全分散式（Fully Distributed）安裝

原文地址：www.inlighting.org/2019/instal… 本篇文章主要介紹如何搭建完全分散式的 Hadoop 叢集，介於 Hadoop 配置複雜，特此寫下此篇文章記錄。

java大資料最全課程學習筆記(2)--Hadoop完全分散式執行模式

目前CSDN,部落格園,簡書同步發表中,更多精彩歡迎訪問我的gitee pages 目錄 Hadoop完全分散式執行模式

Hadoop完全分散式模式安裝(採用三臺虛擬主機模擬環境)

作業系統: CentOS6.7 jdk: jdk-8u221 hadoop: 2.7.3 一. 解除安裝系統自帶jdk並安裝準備好的jdk

Hadoop完全分散式叢集搭建步驟

技術標籤：筆記hadoop分散式hdfs大資料centos 一、網路配置器修改【編輯器】-【虛擬網路編輯器】-【vmnet8】勾選“使用本地DHCP服務……虛擬機器（D）”；子網改為192.168.121.0；DHCP設定為：起始IP地址：192

Hadoop偽分佈模式部署

技術標籤：hadoophdfsmapreduce大資料 Hadoop偽分佈模式部署一、配置環境閱讀下文之前，筆者預設Linux主機已安裝 java jdk

hadoop完全分散式叢集群起

hadoop完全分散式叢集群起 1.配置slaves2. 啟動叢集 1.配置slaves [xuzhenchao@hadoop102 hadoop-2.7.5]$ vim slaves

centos7安裝hadoop偽分佈叢集

1、獲取hadoop 使用國內映象下載速度很快，清華映象地址：Index of /apache (tsinghua.edu.cn)

Apache Hadoop 完全分散式叢集搭建

環境配置 Hadoop 框架是採用 Java 語言編寫，需要 Java 環境(jvm) JDK版本：JDK8 版本

Hadoop完全分散式安裝部署

Hadoop執行模式包括：本地模式、偽分散式模式以及完全分散式模式。我們本次主要完成搭建實際生產環境中比較常用的完全分散式模式，搭建完全分散式模式之前需要對叢集部署進行提前規劃，不要將過多的服務集中到一

hadoop完全分散式部署

軟體版本虛擬機器管理軟體：VMware WorkStation Pro 12.0 作業系統：CentOS 6.7 Hadoop：Hadoop 2.7.4

hadoop 全分佈配置

準備環境(省略) 上傳實驗所需的壓縮包配置網路資訊修改主機名配置域名解析

Hadoop完整搭建過程（二）：偽分佈模式

1 偽分佈模式偽分佈模式是執行在單個節點以及多個Java程序上的模式。相比起本地模式，需要進行更多配置檔案的設定以及ssh、YARN相關設定。

Hadoop基礎（五十四）：基於centos搭建Hadoop3.x完全分散式執行模式

0 簡介分析： 1）準備3臺客戶機（關閉防火牆、靜態ip、主機名稱） 2）安裝JDK 3）配置環境變數

最全面的CentOS下hadoop的完全分散式搭建

在開始搭建完全分散式之前，請先確保已經掌握hadoop偽分散式的安裝。因為hadoop完全分散式的安裝只需在偽分散式的基礎上配置三個結點即可，同時對一些配置檔案稍加改進。

Hadoop安裝（一）——偽分佈

接觸Hadoop也快兩年了，也一直沒自己總結過安裝教程，最近又要用hadoop，需要自己搭建一個叢集來進行試驗，所以就利用這個機會來寫個教程以備以後自己使用，也用來和大家一起探討。

Hadoop完全分佈

完全分散式搭建

1. 虛擬網路編輯器

2. 建立虛擬機器

2.1 建立新的虛擬機器

2.2 選擇Linux的iso檔案

2.3 開始安裝虛擬機器

2.4 克隆另外兩臺虛擬機器

3. 配置三臺虛擬機器的網路

3.1 配置靜態IP

3.2 配置DNS

3.3 修改域名解析配置檔案

3.4 設定主機名

3.5 設定主機與ip對映

4. 防火牆關閉

5. 免金鑰登入配置

6. 配置jdk(配置一臺其他兩臺複製過去即可)

6.1 上傳檔案

6.2 解除安裝系統自帶jdk

6.3 解壓檔案

6.4 設定環境變數

7. Hadoop安裝（安裝一臺其他兩臺複製過去即可）

7.1 上傳檔案

7.2 解壓檔案

7.3 修改Hadoop名字

7.4 設定環境變數

7.5 複製jdk、Hadoop到其他兩個節點

7.6 配置Hadoop

7.6.1 修改hadoop-env.sh、yarn-env.sh、mapred-env.sh

7.6.2 配置core-site.xml

7.6.3 配置hdfs-site.xml

7.6.4 配置yarn-site.xml

7.6.5 配置mapred-site.xml

7.6.6 配置 slavers(意為每次啟動那些叢集)

7.6.7 分發配置檔案

8 啟動叢集並測試

相關推薦