hadoop-2.7.6 完全分散式的安裝

阿新 • • 發佈：2018-11-05

準備環境

CentOS 7

jdk1.8 (這裡建議使用1.8版本的jdk 連結:https://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html)

hadoop-2.7.3.tar.gz （連結：http://mirrors.hust.edu.cn/apache/hadoop/）

機器環境

使用三臺機器搭建hadoop叢集，其中一臺為Master，兩臺為Slave1.Slave2; (搭建叢集的機器數量最好為奇數，包括master)

這裡我們準備三臺機器，來搭建一個小型hadoop分散式叢集，分別是 master(主節點)，slave1，slave2 。

三臺機器IP 如下：

192.168.1.106
192.168.1.105
192.168.1.104

　　　　三臺機器在叢集中的作用：

　　　　master 擔任 NameNode、DataNode、ResourceManager、NodeManager

　　　　slave1 擔任 DataNode、NodeManager

　　　　slave2 擔任 DataNode、NodeManager

hadoop環境準備

設定主機名

　　　　開啟後ins進入編輯模式輸入主機名 master；同理 slave步驟也一樣（我這裡已經設定好了）

　　　　Esc :wq! 儲存退出

　　　　這裡需要重啟主機名生效

　　設定IP與主機名對映

　　　　進入編輯IP與主機名對映

# 這裡三臺機器都要需要此操作

#這裡注意 IP與主機名之間應有一個空格

　　　　在之後新增叢集則需要在 /etc/hosts中新增對映關係並且分發個各個叢集

　　關閉防火牆

　　 systemctl stop firewalld.service

　　 systemctl disable firewalld.service

　　配置ssh免密登入

　　　　叢集之間的機器需要相互通訊，所以我們必須先配置免密碼登入。在三臺機器上都得配置免密。（每臺機器都需要配置）

　　　　以 rsa 演算法生成金鑰。連續按四個空格，有yes輸入yes

　　　　完成之後 ls -la 檢視當前隱藏檔案

　　　　看到一個 .ssh 的檔案這就是剛才生成的存放金鑰的資料夾

　　　　有.ssh 說明你金鑰已經生成成功了！！！

　　　　cd .ssh cd 進去之後可以看到有兩個檔案

　　　　id_rsa 為私鑰

　　　　id_rsa.pub 為公鑰

　　　　known_hosts 進行記錄連結到對方時，對方給的host key進行簡單的驗證 (首次建立免密且沒有任何連結的是沒有這個檔案)

　　　　給金鑰新增許可權：

　　　　chmod 600 ~/.ssh/authorized_keys

　　　　複製公鑰檔案給 authorized_keys

　　　　cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys （首次建立免密且沒有任何連結的是沒有這個檔案）

　　　　#注意檔案明必須是這個名稱！！！

　　　　按照以上步驟把slave1， slave2 ,的公鑰拷貝到 authorized_keys 檔案中。（這裡只有一個authorized_keys檔案，且內容包括 master，slave1，slave2，的公鑰）

　　　　把三臺機器的公鑰拷貝給 authorized_keys 後。分發給各個slave

　　　　scp ~/.ssh/authorized_keys [email protected]:~/ （同理分發給 slave1，slave2 ，）

　　　　驗證是否免密成功

　　　　以下操作在主節點master上

　　　　ssh master(此步驟是驗證master是否給master免密成功)

　　　　ssh slave1

　　　　ssh slave2

　　　　出現這種情況表明ssh免密成功

　　　　exit 退出當前使用者

　　安裝jdk

　　　上傳jdk安裝包到 Linux 上（參考軟體 Xshell 等）

　　　　解壓 jdk

　　　　tar -zxvf jdk-8u152-linux-x64.tar.gz (解壓到當前目錄下)

　 配置環境變數

　　　　vi /etc/profile 開啟後再最後加上一下幾句話：

　　　　export JAVA_HOME=/root/usr/java/jdk1.8.0_152

　　　　 export PATH=$JAVA_HOME/bin:$PATH

　　　使用source /etc/profile讓profile檔案立即生效。

　　　輸入　java 命令測試是否完成

　　　　如出現以下情況則完成環境的安裝：

　　　　輸入 java -version 來驗證，如出現以下則為成功：

　　　　輸入 jps

　　　　出現 jps則成功

　　hadoop安裝

　　　　下載hadoop-2.7.3.tar.gz 解壓

　　　　tar -zxvf hadoop-2.7.3.tar.gz (解壓到當前目錄)

　　　　cd 到Hadoop目錄下

　　　　cd hadoop-2.7.3/etc/hadoop/

　　配置環境變數 hadoop-env.sh

　　　　進入Hadoop目錄下

　　　　ls 檢視檔案

　　　　vi hadoop-env.sh

　　　　開啟後在檔案靠前的一部分找到

　　　　export JAVA_HOME=${JAVA_HOME}

　　　　修改為你本機 jdk安裝的路徑

　　　　這裡修改的是我本機 jdk 的路徑

　　　　儲存退出：wq!

　　 配置環境變數 yarn-env.sh

　　　　vi yarn-en.sh

　　　　在檔案靠前一部分找到以下程式碼：

　　　　# export JAVA_HOME=/home/y/libexec/jdk1.6.0/

　　　　將這行程式碼修改為下面的程式碼（將#號去掉）：

　　　　export JAVA_HOME=/root/usr/java/jdk1.8.0_152 （這裡是本機的 jdk 路徑）

　　配置核心元件 core-site.xml

　　　　vi core-site.xml

　　　　用下面的程式碼替換 <configuration> 中的內容:

　　　　<property>
　　　 <name>fs.defaultFS</name>
　　　　 <value>hdfs://master:8020</value>
　　　　</property>

　　配置檔案系統 hdfs-site.xml

　　　　vi hdfs-site.xml

　　　　用下面的程式碼替換 <configuration> 中的內容:

　　　　<property>
　　　　 <name>hadoop.tmp.dir</name>
　　　　 <value>/root/hadoop_tmp</value>
　　　　</property>

　　配置檔案系統 yarn-site.xml

　　　　vi yarn-site.xml　

　　　　用下面的程式碼替換 <configuration> 中的內容:

　　　　<property>
　　　　 <name>yarn.nodemanager.aux-services</name>
　　　　 <value>mapreduce_shuffle</value>
　　　　</property>
　　　　<property>
　　　　 <name>yarn.resourcemanager.hostname</name>
　　　　 <value>master</value>
　　　　</property>

　　配置計算框架 mapred-site.xml

　　　　先把mapred-site-template.xml更名為 mapred-site.xml

　　　　mv mapred-site-template.xml mapred-site.xml

　　　　vi mapred-site.xml

　　　　用下面的程式碼替換 <configuration> 中的內容:

　　　　<property>
　　　　 <name>mapreduce.framework.name</name>
　　　　 <value>yarn</value>
　　　　</property>

　　 在 master 節點配置 slaves 檔案

　　　　vi slaves

　　　　用下面的程式碼替換 slaves 中的內容：

　　　　slave1

　　　　slave2

　　　　以上配置是叢集的主機名（如需要新增叢集這裡配置需要新增）