[Hadoop] 在Ubuntu系統上一步步搭建Hadoop（單機模式）

阿新 • • 發佈：2019-01-13

1 Hadoop的三種建立模式

　　單機模式操作是Hadoop的預設操作模式，當首次解壓Hadoop的原始碼包時，Hadoop無法瞭解硬體安裝環境，會保守地選擇最小配置，即單機模式。該模式主要用於開發除錯MapReduce程式的應用邏輯，而不會和守護程序互動，避免增加額外的複雜性。

　　偽分佈模式操作是指在“單節點叢集”上執行Hadoop，其中所有的守護程序都執行在同一臺機器上。該模式在單機模式操作之上多了程式碼除錯功能，可以查閱記憶體的使用情況、HDFS的輸入輸出以及守護程序之間的互動。

　　全分佈模式操作是指一種實際意義上的Hadoop叢集，其規模可從幾個節點的小叢集到成百上千個節點的大叢集，甚至是成千上萬的超大叢集。

　　本文只限於介紹單機模式，偽分佈模式需要在自己的Ubuntu系統下額外建立虛擬的系統，而全分佈模式需要搭建叢集的硬體設施。

2 建立Hadoop使用者組和Hadoop使用者

　　Step1：建立Hadoop使用者組：

　　　　~$ sudo addgroup hadoop

　　Step2：建立Hadoop使用者：

　　　　~$ sudo adduser -ingroup hadoop hadoop

　　回車後會提示輸入密碼，這是新建Hadoop的密碼，輸入兩次密碼敲回車即可。如下圖所示：　

　　Step3：為Hadoop使用者新增許可權：

　　~$ sudo gedit /etc/sudoers

　　點選回車後，開啟sudoers檔案，在

　　root　　　　ALL=(ALL:ALL) ALL

　　後新增：

　　hadoop　　 ALL=(ALL:ALL) ALL

　　注意：“hadoop” 後為"\t"，而不是一個空格，一旦sudoers修改錯誤會引起很嚴重的後果（比如導致sudo命令無法正常使用，這時候只能通過root許可權進行復原）。修改後的sudoers檔案如下圖所示：

3 用新增hadoop使用者名稱登陸Ubuntu系統

　　~$ su - hadoop

　　輸入密碼即可。

4 安裝SSH

　　Step4：安裝Hadoop通訊需要的SSH：

　　　　~$ sudo apt-get install openssh-server

　　安裝完以後，啟動服務：

　　　　~$ sudo /etc/init.d/ssh start

　　啟動後，可以通過如下命令來確認服務是否正確啟動：

　　　　~$ ps -e | grep ss

　　如下圖所示：

　　作為一個安全通訊協議，使用時需要密碼，因此我們要設定成免密碼登入，生成私鑰和公鑰：

　　　　~$ ssh-keygen -t rsa -P ""

　　如下圖所示：

　　此時會在／home／hadoop/.ssh下生成兩個檔案：id_rsa和id_rsa.pub，前者為私鑰，後者為公鑰。現在我們將公鑰追加到authorized_keys中（authorized_keys用於儲存所有允許以當前使用者身份登入到ssh客戶端使用者的公鑰內容）：

　　　　~$ cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys

　　現在可以登入ssh確認以後登入時不用輸入密碼：

　　　　~$ ssh localhost

　　退出：

　　　　~$ exit

5 安裝Java

　　Step5：安裝Java：

~$ sudo apt-get install openjdk-6-jdk

　　安裝完後，可以輸入如下指令檢視Java的版本：　　

　　　　~$ java -version

6 安裝和配置Hadoop

　　Step6：安裝Hadoop：

　　1）下載：

　　　　目前最新版本為2.7.0，可以根據自己的需要，安裝不同版本的Hadoop，下載地址：請點選這裡

　　2）解壓：

　　　　~$ sudo tar xzf hadoop-2.7.0.tar.gz

　　3）將hadoop移動到 /usr/local/hadoop目錄下：

　　　　~$ sudo mv hadoop-1.0.2 /usr/local/hadoop

　　4）要確保所有的操作都是在使用者hadoop下完成的：

　　　　~$ sudo chown -R hadoop:hadoop /usr/local/hadoop

　　Step7：配置Hadoop：

　　1）配置.bashrc：

配置該檔案，需要知道Java的安裝路徑，可以通過下面的程式碼檢視：

　　　　~$ update-alternatives - -config java

執行結果如下：

　　完整的路徑為：/usr/lib/jvm/java-7-openjdk-amd64/jre/bin/java，我們只取前面的部分 /usr/lib/jvm/java-7-openjdk-amd64。

　修改.bashrc檔案:

　　　~$ sudo gedit ~/.bashrc

　　該命令會開啟該檔案的編輯視窗，在檔案末尾追加下面內容，然後儲存，關閉編輯視窗。

#HADOOP VARIABLES START

export JAVA_HOME=/usr/lib/jvm/java-7-openjdk-amd64

export HADOOP_INSTALL=/usr/local/hadoop

export PATH=$PATH:$HADOOP_INSTALL/bin

export PATH=$PATH:$HADOOP_INSTALL/sbin

export HADOOP_MAPRED_HOME=$HADOOP_INSTALL

export HADOOP_COMMON_HOME=$HADOOP_INSTALL

export HADOOP_HDFS_HOME=$HADOOP_INSTALL

export YARN_HOME=$HADOOP_INSTALL

export HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_INSTALL/lib/native

export HADOOP_OPTS="-Djava.library.path=$HADOOP_INSTALL/lib"

#HADOOP VARIABLES END

　　使新增的環境變數生效：

　　~$ source ~/.bashrc

　　2）配置hadoop-env.sh

　　開啟hadoop-env.sh檔案：

　　~$ sudo gedit /usr/local/hadoop/etc/hadoop/hadoop-env.sh

　　找到JAVA_HOME變數，按如下進行修改:

　　~$ export JAVA_HOME=/usr/lib/jvm/java-7-openjdk-amd64

修改後的hadoop-env.sh檔案如下所示：

　　使配置生效：

~$ source /usr/local/hadoop/conf/hadoop-env.sh

　　到這裡，單機模式的hadoop就全部安裝完畢了。

7 Hadoop測試

為了測試Hadoop安裝在正確性，我們可以用在帶的例子（比如WordCount）進行測試。

　　1）在/usr/local/hadoop路徑下建立input資料夾

　　　　~$ mkdir input

　　2）拷貝 README.txt 到 input 資料夾

　　　　~$ cp README.txt input

　　3）執行WordCount程式例項

　　　~$ bin/hadoop jar share/hadoop/mapreduce/sources/hadoop-mapreduce-examples-2.7.0-sources.jar org.apache.hadoop.examples.WordCount input output

　　如果看到這些內容，那麼恭喜你，這說明你的Hadoop已經安裝成功了。

8 結語

　　從Ubuntu上安裝Hadoop的過程上可以看出，以前你覺得很困難，一直不敢嘗試的東西，其實可能它很簡單。只要你自己想學，就一步步地來，問題總能找到辦法來解決，在此與大家共勉。

[Hadoop] 在Ubuntu系統上一步步搭建Hadoop（單機模式）

1 Hadoop的三種建立模式

2 建立Hadoop使用者組和Hadoop使用者

3 用新增hadoop使用者名稱登陸Ubuntu系統

4 安裝SSH

5 安裝Java

6 安裝和配置Hadoop

7 Hadoop測試

8 結語

9 參考內容

[Hadoop] 在Ubuntu系統上一步步搭建Hadoop（單機模式）

linux centos7 從零搭建Hadoop離線處理平臺（單機模式）詳細

Hadoop 和 Hbase 的安裝與配置（單機模式）

一步教你Docker安裝搭建redis（單機版）

linux系統上傳和下載檔案（命令列）

在阿里雲伺服器ECS上用Cloudera搭建叢集（隨記）

一、Ubuntu14.04下安裝Hadoop2.4.0 （單機模式）

Linux下使用Docker部署nacos-server:1.4.0（單機模式），喪心病狂的我在半夜給UCloud提交了一份工單

linux ubuntu系統下基於eclipse的hadoop開發環境搭建

在ubuntu上搭建hadoop服務（叢集模式）

區塊鏈探索一（在阿裏雲Ubuntu系統上搭建一個以太坊）

ASP.NET Core 一步步搭建個人網站（7）_Linux系統移植

用FastDFS一步步搭建文件管理系統

windows系統上執行spark、hadoop報錯Could not locate executable null\bin\winutils.exe in the Hadoop binaries

Ubuntu 18.04.1 LTS 搭建Hadoop環境

FastDfs從一步步搭建到開發應用的上傳，下載，刪除

（實用篇）一步步搭建 dubbo + zookeeper + SSM 系統

用FastDFS一步步搭建檔案管理系統

在ubuntu下搭建hadoop環境（單機配置）

FastDFS一步步搭建檔案管理系統

[Hadoop] 在Ubuntu系統上一步步搭建Hadoop（單機模式）

1 Hadoop的三種建立模式

2 建立Hadoop使用者組和Hadoop使用者

3 用新增hadoop使用者名稱登陸Ubuntu系統

4 安裝SSH

5 安裝Java

6 安裝和配置Hadoop

7 Hadoop測試

8 結語

9 參考內容

相關推薦