Ubuntu 18.04.1 LTS 搭建Hadoop環境

阿新 • • 發佈：2018-11-24

1.Ubuntu環境配置

本文使用Ubuntu 18.04.1 LTS，其他版本搭建過程基本一致。

建立hadoop使用者（可略）

1.建立新使用者

$ sudo useradd -m hadoop -s /bin/bash

2.設定密碼

$ sudo passwd hadoop

3.為 hadoop 使用者增加管理員許可權

$ sudo adduser hadoop sudo

4.登出當前使用者並切換到hadoop使用者

更新apt

$ sudo apt-get update

安裝Vim

$ sudo apt-get install 
 vim

安裝SSH、配置SSH無密碼登陸

叢集或單節點模式都需要用到 SSH 登陸。Ubuntu 預設安裝了 SSH client，此外還需要安裝 SSH server

$ sudo apt-get install openssh-server

使用ssh localhost登陸本機（需要輸入密碼）

為了避免每一次使用SSH都要輸入密碼，利用 ssh-keygen 生成金鑰，並將金鑰加入到授權中：

$ cd ~/.ssh/    # 如果不存在該資料夾，需要先登陸本機
$ ssh-keygen -t rsa   # 會出現多個提示，全部回車
$ cat ./id_rsa.pub >> 
 ./authorized_keys  # 加入授權

登陸本機

$ ssh localhost

安裝Java環境

安裝前最好更改系統軟體源為國內源（阿里雲）

$ sudo apt-get install default-jre default-jdk

需要配置JAVA_HOME環境變數

$ vim ~/.bashrc

加入這一行

export JAVA_HOME=/usr/lib/jvm/default-java

退出，讓環境變數生效

$ source ~/.bashrc

測試

$ echo $JAVA_HOME 
$ java -version
$ $JAVA_HOME 
/bin/java -version  #這句等同於上面

2.安裝 Hadoop 2

需要下載編譯好的hadoop-2.x.y.tar.gz 檔案

我下載的是2.7.6

將 Hadoop 安裝至 /usr/local/ 中：

$ sudo tar -zxf ~/Download/hadoop-2.7.6.tar.gz -C /usr/local
$ cd /usr/local/ 
$ sudo mv ./hadoop-2.7.6/ ./hadoop  
$ sudo chown -R hadoop ./hadoop  # 修改檔案許可權,第一個hadoop為使用者名稱

Hadoop 解壓後即可使用。檢測：

$ cd /usr/local/hadoop
$ ./bin/hadoop version

在這裡插入圖片描述

Hadoop 預設模式為非分散式模式（本地模式），無需進行其他配置即可執行。

Hadoop偽分散式配置

因為只是簡單地學習，僅使用偽分散式的方式。

修改配置檔案 core-site.xml ( vim ./etc/hadoop/core-site.xml)，將

<configuration></configuration>

修改為：

<configuration>    
    <property>        
        <name>hadoop.tmp.dir</name>        
        <value>file:/usr/local/hadoop/tmp</value>        
        <description>Abase for other temporary directories.
        </description>    
    </property>    
    <property>        
        <name>fs.defaultFS</name>        
        <value>hdfs://localhost:9000</value>    
    </property>
</configuration>

修改配置檔案 hdfs-site.xml：

<configuration>    
    <property>        
        <name>dfs.replication</name>        
        <value>1</value>    
    </property>  
    <property> 
        <name>dfs.namenode.name.dir</name>        
        <value>file:/usr/local/hadoop/tmp/dfs/name</value>    
    </property>  
    <property>
    <name>dfs.datanode.data.dir</name> 
    <value>file:/usr/local/hadoop/tmp/dfs/data</value>    
    </property>
</configuration>

執行 NameNode 的格式化:

$ ./bin/hdfs namenode -format

出現 “successfully formatted” 和 “Exitting with status 0”則代表成功

在這裡插入圖片描述

開啟 NameNode 和 DataNode 守護程序。

./sbin/start-dfs.sh

通過 jps 可以判斷是否成功啟動

如果有NameNode 或 DataNode則配置成功

在這裡插入圖片描述

可以訪問 http://localhost:50070 檢視詳細資訊

在這裡插入圖片描述

使用HDFS

在 HDFS 中建立使用者目錄

$ ./bin/hdfs dfs -mkdir -p /user/hadoop

注：

hadoop fs適用於任何不同的檔案系統，比如本地檔案系統和HDFS檔案系統
hadoop dfs只能適用於HDFS檔案系統
hdfs dfs跟hadoop dfs的命令作用一樣，也只能適用於HDFS檔案系統

開啟hdfs

$ ./sbin/start-dfs.sh

關閉hdfs

$ ./sbin/stop-dfs.sh

YARN

YARN 負責資源管理與任務排程。YARN 運行於 MapReduce 之上，提供了高可用性、高擴充套件性。

修改配置檔案 mapred-site.xml

重新命名：

$ mv ./etc/hadoop/mapred-site.xml.template ./etc/hadoop/mapred-site.xml

編輯 vim ./etc/hadoop/mapred-site.xml ：

<configuration>    
    <property>        
        <name>mapreduce.framework.name</name>        
        <value>yarn</value>    
    </property>
</configuration>

修改配置檔案 yarn-site.xml：

<configuration>    
    <property>        
        <name>yarn.nodemanager.aux-services</name>        <value>mapreduce_shuffle</value>        
    </property>
</configuration>

啟動 YARN （需要先執行過 ./sbin/start-dfs.sh）：

$ ./sbin/start-yarn.sh  
$ ./sbin/mr-jobhistory-daemon.sh start historyserver

通過 jps ，多了 NodeManager 和 ResourceManager 兩個後臺程序

在這裡插入圖片描述

啟動 YARN 後可以通過localhost:8088.cluster 檢視任務的執行情況

在這裡插入圖片描述

關閉 YARN 的指令碼：

$ ./sbin/stop-yarn.sh
$ ./sbin/mr-jobhistory-daemon.sh stop historyserver

Hadoop執行例子

hadoop附帶很多例子，包括wordcount、join、grep、terasort等。執行 ./bin/hadoop jar ./share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.6.jar 可以看到所有例子

在這裡插入圖片描述

選擇執行 grep 例子，將 input 資料夾中的所有檔案作為輸入，篩選當中符合正則表示式 dfs[a-z.]+ 的單詞並統計出現的次數，最後輸出結果到 output 資料夾中。

$ cd /usr/local/hadoop
$ mkdir ./input
$ cp ./etc/hadoop/*.xml ./input   # 將配置檔案作為輸入檔案
$ ./bin/hadoop jar ./share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.6.jar grep ./input ./output 'dfs[a-z.]+'
$ cat ./output/*          # 檢視執行結果

執行後輸出了作業的相關資訊，輸出的結果是符合正則的單詞各出現了1次

在這裡插入圖片描述

注意，Hadoop 預設不會覆蓋結果檔案，因此再次執行上面例項會提示出錯，需要先將 ./output 刪除。

rm -r ./output

為Hadoop新增至環境變數

每一次啟動都要進入/usr/local/hadoop目錄，再執行sbin/hadoop（等同於執行 /usr/local/hadoop/sbin/hadoop），受之前為jdk新增至環境變數過程的啟發，在這裡希望將Hadoop新增至環境變數。

在~/.bashrc中加入：

export PATH=$PATH:/usr/local/hadoop/sbin:/usr/local/hadoop/bin

執行source ~/.bashrc使設定生效。

在任意目錄中都可以直接開啟Hadoop：start-dfs.sh；直接啟動YARN：start-yarn.sh;使用hdfs：如hdfs dfs -ls input檢視HDFS檔案。

Ubuntu 18.04.1 LTS 搭建Hadoop環境

1.Ubuntu環境配置本文使用Ubuntu 18.04.1 LTS，其他版本搭建過程基本一致。建立hadoop使用者（可略） 1.建立新使用者 $ sudo useradd -m hadoop -s /bin/bash 2.設定密碼 $ sudo pass

Ubuntu 18.04.1 LTS下搭建git伺服器

sudo apt-get install git 安裝好git sudo adduser git 系統會提示設定密碼，此時請設定好你的密碼,還會要你設定email之類的此時可以按Enter回車預設為空 sudo vim /home/git/.ssh/authorized_keys 此時把你電腦裡

VirtualBox 5.2.20 + Ubuntu 18.04.1 LTS + openstack Rocky devstack實驗安裝

順利的安裝了openstack rocky實驗環境，基本安裝過程記錄如下：一、安裝VirtualBox 5.2.20 下載網址：https://www.virtualbox.org/wiki/Downloads 我選的是windows版本，在膝上型電腦win10下安裝

虛擬機器安裝Ubuntu 18.04.1 LTS教程

登陸Ubuntu官網下載系統映象，本文以Ubuntu 18.04.1 LTS為例映象路徑：https://www.ubuntu.com/download/desktop 開啟VMare workspace 選擇需要安裝系統的映象，即剛才下載的映象。填寫

Ubuntu 18.04.1 LTS 安裝中文輸入法

1、安裝Fcitx，開啟shell，輸入命令 sudo apt-get install fcitx 我之前就已經安裝好了 2、進入System Setting（系統設定） 3、進入Region & Language —>Manage Instal

Ubuntu18.04.1 LTS 搭建MYSQL環境

MySQL是一個關係型資料庫管理系統，目前屬於 Oracle 旗下產品。MySQL 最流行的關係型資料庫管理系統，在 WEB 應用方面MySQL是最好的 RDBMS (Relational Database Management System，關係資料庫管理系統) 應用軟體之一。

Ubuntu 18.04.1 LTS安裝cocos2d-x 3.17簡記

sha ash gtk3 ole root 進入目錄 .py dep cmake 準備工作下載最新3.17穩定版cocos2d-x： http://www.cocos2d-x.org/download 下載Android Studio，更新到最新版3.2.1。在And

Ubuntu 18.04.1 LTS安裝Shadowsocks-qt5

一、安裝shadowsocks-qt5 Ctrl+Alt+T開啟終端，輸入以下命令安裝好GUI介面shadowsocks-qt5 sudo add-apt-repository ppa:hzwhuang/ss-qt5 將ss-qt5下載後是無法正常安裝的，需要將bionic（18.04版

虛擬機器使用Linux系統——window自帶的Hyper-V + Ubuntu 18.04.1 LTS

目錄一、虛擬機器的選擇二、Linux系統的選擇三、使用體驗本機配置如下：電腦型號 HP Pavilion Gaming Laptop 15-cx0xxx 膝上型電腦 (掃描時間：2018年11月27日) 作業系統&nb

Ubuntu 18.04.1 LTS server安裝全紀錄

自定義 ubuntu 分區 reboot 方法 font 虛擬系統 ssh key ntfs VMware Workstation Pro操作創建新的虛擬機這裏強調一下虛擬機存放目錄的問題：建一個根目錄VM，在其下建xp、win7、ubuntu

Ubuntu 18.04.1 搭建Java環境和HelloWorld

lin ubun java版 source 項目版本 ext jdk1 section git 一、搭建Java環境系統環境 Ubuntu 18.04.1 JDK 8 IDEA 2018.2 1.下載JDK 官網地址：http://www.oracle.com/tec

Ubuntu 18.04.1 下快速搭建 LNMP環境(PHP7.2.5+MySql5.7+Nginx1.14.0)

在Linux環境下，搭建LNMP環境，大家以前或多或少都做過相關的操作，但是隨著軟體的更新，PHP，MySQL不斷的升級，以往很多比較老的教程，都已經無法完成這個搭建環境的任務了，今天偶然有興趣在最新的Ubuntu18.04上搭建LNMP環境，本來感覺挺容易的，但是在實際操作

Ubuntu 18.04.1 下快速搭建 LNMP環境

tro 很多 error: 管理員權限 conf request http lar mysql的安裝 1.Nginx的安裝 Nginx安裝是屬於最簡單的，只需要在命令行執行 sudo apt-get install nginx 就能自動安裝 Nginx，其中

ubuntu 18.04.1，配置opencv3.4.3環境，並用Qt測試

之前在windows裝過opencv，編譯環境也是Qt，這次想說在ubuntu下也裝個，但總是遇到各種皮皮蝦問題。這裡我借鑑下一位網友的安裝教程：https://blog.csdn.net/jindunwan7388/article/details/80397700#comm

記MySQL在Ubuntu（18.04.1 LTS）的安裝

本文記錄一次在Ubuntu（18.04.1 LTS）上安裝MySql過程，安裝後的mySQL版本為5.7.24。安裝環境 [email protected]~virtual-machine:/etc# cat /etc/issue Ubuntu 18

Ubuntu 18.04使用vscode搭建python3.x開發環境

VSCODE安裝python外掛新建一個test.py檔案，使用VSCODE開啟時如下顯示直接點選安裝，由於缺少pip環境會導致安裝失敗。於是先安裝pip：sudo apt-get in

VMware 安裝 Ubuntu Server 18.04.1 LTS

1、準備工作 2、新建虛擬機器自定義安裝選擇虛擬機器相容性選擇稍後安裝作業系統選擇客戶機作業系統根據下載系統決定定義VMware名稱，安裝位置處理器配置

ubuntu 16.04.1 LTS postgresql安裝配置

ket ons wget 5.6 int cst multi 啟動 oca postgresql安裝--------------------二進制安裝：wget https://get.enterprisedb.com/postgresql/postgresql-9.5.6

ubuntu 16.04.1 LTS 初始化

test shanghai ubuntu nap sysctl fail2ban all rtu system gcc環境------------------sudo apt-get update && \sudo apt-get install build

ubuntu 16.04.1 LTS redis安裝配置

star ins redis-cli -s download root per edi down 編譯安裝：apt-get updateapt-get install build-essential tclwget http://download.redis.io/redi

Ubuntu 18.04.1 LTS 搭建Hadoop環境

1.Ubuntu環境配置

建立hadoop使用者（可略）

更新apt

安裝Vim

安裝SSH、配置SSH無密碼登陸

安裝Java環境

2.安裝 Hadoop 2

Hadoop偽分散式配置

使用HDFS

YARN

Hadoop執行例子

為Hadoop新增至環境變數

相關推薦