ubuntu 18.04下配置Hadoop 3.0.3

阿新 • • 發佈：2018-12-30

ubuntu 18.04下配置Hadoop 3.0.3

文章開始把我喜歡的這句話送個大家：這個世界上還有什麼比自己寫的程式碼執行在一億人的電腦上更酷的事情嗎，如果有那就是讓這個數字再擴大十倍

1.安裝虛擬機器設定Ubuntu作業系統（網上教程很多不再講述）

2.安裝SSH,設定SSH無密碼登陸

$ sudo apt-get install openssh-server   #安裝SSH server
$ ssh 
 localhost                         #登陸SSH，第一次登陸輸入yes
$ exit                                  #退出登入的ssh localhost
$ cd ~/.ssh/                            #如果沒法進入該目錄，執行一次ssh localhost
$ ssh-keygen -t rsa

輸入完 $ ssh-keygen -t rsa　語句以後，需要連續敲擊三次回車，如下圖：

其中，第一次回車是讓KEY存於預設位置，以方便後續的命令輸入。第二次和第三次是確定passphrase，相關性不大。兩次回車輸入完畢以後，如果出現類似於下圖所示的輸出，即成功：

之後再輸入：

$ cat ./id_rsa.pub >> ./authorized_keys #加入授權
$ ssh localhost                         #此時已不需密碼即可登入localhost，並可見下圖。如果失敗則可以搜尋SSH免密碼登入來尋求答案

3安裝jdk

*******此處有坑！！！！！！！！注意一定要下載jdk8或以下版本，最開始我下載的全新版本jdk 11,由於不兼容於是半天的配置時間。。。。。。。。。。。

首先在oracle官網下載 http://www.oracle.com/technetwork/java/javase/downloads/index.html 接下來進行安裝與環境變數配置

$ mkdir /usr/lib/jvm                           #建立jvm資料夾
$ sudo tar zxvf jdk-7u80-linux-x64.tar.gz  -C /usr/lib #/ 解壓到/usr/lib/jvm目錄下
$ cd /usr/lib/jvm                                 #進入該目錄
$ mv  jdk1.7.0_80 java                         #重新命名為java
$ vi ~/.bashrc                                 #給JDK配置環境變數

另外推薦使用vim來編輯環境變數

$ vim ~/.bashrc

如果沒有vim,可以使用：

$sudo apt-get install vim

來進行下載。

在.bashrc檔案新增如下指令：

export JAVA_HOME=/usr/lib/jvm/java
export JRE_HOME=${JAVA_HOME}/jre
export CLASSPATH=.:${JAVA_HOME}/lib:${JRE_HOME}/lib
export PATH=${JAVA_HOME}/bin:$PATH

在檔案修改完畢以後，輸入程式碼：

$ source ~/.bashrc                       #使新配置的環境變數生效
$ java -version                          #檢測是否安裝成功，檢視java版本

終端顯示Java版本即成功。

4.安裝hadoop-3.0.0

先下載hadoop-2.6.0.tar.gz，連結如下:
http://mirrors.hust.edu.cn/apache/hadoop/common/

下面進行安裝：

$ sudo tar -zxvf  hadoop-3.0.3.tar.gz -C /usr/local    #解壓到/usr/local目錄下
$ cd /usr/local
$ sudo mv  hadoop-3.0.3    hadoop                      #重新命名為hadoop
$ sudo chown -R hadoop ./hadoop                        #修改檔案許可權

給hadoop配置環境變數，將下面程式碼新增到.bashrc檔案:

export HADOOP_HOME=/usr/local/hadoop
export CLASSPATH=$($HADOOP_HOME/bin/hadoop classpath):$CLASSPATH
export HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_HOME/lib/native
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

同樣，執行source ~./bashrc使設定生效，並檢視hadoop是否安裝成功

5.分散式配置

Hadoop 可以在單節點上以偽分散式的方式執行，Hadoop 程序以分離的 Java 程序來執行，節點既作為 NameNode 也作為 DataNode，同時，讀取的是 HDFS 中的檔案。Hadoop 的配置檔案位於 /usr/local/hadoop/etc/hadoop/ 中，偽分散式需要修改配置檔案 core-site.xml hdfs-site.xml hadoop-env.sh yarn-site.xml mapred-site.xml 等5個檔案。

1.修改hadoop-env.sh檔案
首先將jdk的路徑添（export JAVA_HOME=/usr/lib/jvm/java ）加到hadoop-env.sh檔案。

2.修改core-site.xml檔案：

<configuration>
        <property>
             <name>hadoop.tmp.dir</name>
             <value>file:/usr/local/hadoop/tmp</value>
             <description>Abase for other temporary directories.</description>
        </property>
        <property>
             <name>fs.defaultFS</name>
             <value>hdfs://localhost:9000</value>
        </property>
</configuration>

3.修改配置檔案 hdfs-site.xml

<configuration>
        <property>
             <name>dfs.replication</name>
             <value>1</value>
        </property>
        <property>
             <name>dfs.namenode.name.dir</name>
             <value>file:/usr/local/hadoop/tmp/dfs/name</value>
        </property>
        <property>
             <name>dfs.datanode.data.dir</name>
             <value>file:/usr/local/hadoop/tmp/dfs/data</value>
        </property>
</configuration>

4.修改mapred-site.xml檔案

<configuration>
        <property>
             <name>yarn.nodemanager.aux-services</name>
             <value>mapreduce_shuffle</value>
        </property>
        <property>
             <name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>
             <value>org.apache.hadoop.mapred.ShuffHandler</value>
        </property>
</configuration>

5.修改yarn-site.xml檔案

<configuration>
        <property>
             <name>mapreduce.framework.name</name>
             <value>yarn</value>
        </property>
</configuration>

配置完成。

6.格式化

執行 NameNode 的格式化

$ ./bin/hdfs namenode -format

啟動namenode和datanode程序，並檢視啟動結果

$ ./sbin/start-dfs.sh
$ jps

啟動完成後，可以通過命令 jps 來判斷是否成功啟動，若成功啟動則會列出如下程序: “NameNode”、”DataNode” 和 “SecondaryNameNode”

啟動Yarn程序，並檢視啟動結果

$ ./sbin/start-yarn.sh
$ jps

啟動完成後，可以通過命令 jps 來判斷是否成功啟動，若成功啟動則會列出如下程序: “ResourceManager”和”NodeManager”

也可start-all.sh 一次性啟動。

最後http:// localhost:8088/為hadoop web頁面

http:// localhost:50070/為HDFS頁面

加油吧，程式設計師！

ubuntu 18.04下配置Hadoop 3.0.3

ubuntu 18.04下配置Hadoop 3.0.3 文章開始把我喜歡的這句話送個大家：這個世界上還有什麼比自己寫的程式碼執

ubuntu 16.04 下配置 hadoop + eclipse 開發環境

注：筆記有參考這篇文章，但實際還是碰到了不少坑，所以做了一些整理；程式來源於這篇文章,稍做了修改。一、安裝 JDK 1.8 我安裝的是oracleJDK 1.8 1.先將含有相關包的清單匯入。 $ sudo add-apt-repository ppa:web

Ubuntu 16.04下為Android編譯OpenCV 3.2.0 Manager

由於 ica 如何 setting -i add 標記 roi stripe http://johnhany.net/2016/07/build-opencv-manager-for-android-on-ubuntu/ 最近想在Android上嘗試一下SIFT和SU

Ubuntu 18.04 下 PostgreSQL 10 的安裝與基礎配置

ade iptable 清除 ont crypt front ron NPU dmi 下載安裝在命令行執行如下語句： apt-get install postgresql-10 該指令會幫助你下載如下PostgreSQL組件： ` | ` -- | -- postgre

ubuntu 18.04下安裝配置Hue問題記錄

前段時間將Hadoop 在ubuntu環境下裝好，接下來嘗試安裝Hue來管理Hadoop，參照的資料有： 1、高可用Hadoop平臺－Hue In Hadoop 2、ubuntu16.04 安裝單機Hadoop&HIVE&HUE 現將過程中的一些問題記錄下來，供碰到類似問題的同學參考

Ubuntu 18.04下JDK與Eclipse安裝配置

一、簡單理解JAVA_SE 、EE、ME 三者的區別 Java SE(Java Platform,Standard Edition)，應該先說這個，因為這個是標準版本。 Java EE (Java Platform，Enterprise Edition)，java 的企業版本 Java ME(Java Pl

【18/12/29】Ubuntu 16.04下配置intel opencl環境

一. 靠譜的安裝教程　　1. 官網教程 https://software.intel.com/en-us/articles/sdk-for-opencl-2019-gsg，開啟後往下拉到【4. Production Examples】處，即可找到入口。官網教程的連結，是從 https://blog.c

Ubuntu 14.04下搭建Python3.4 + PyQt5.3.2 + Eric6.0開發平臺

引言找了很多Python GUI工具集，還是覺得PyQt比較理想，功能強大跨平臺，還支援介面設計器。花一天時間折騰了Ubuntu14.04（32位）+ Python3.4 + Qt5.3.2 + PyQt5.3.2 + Eric6.0 的完整開發平臺的搭建，各種出錯差點放

Ubuntu 18.04 下安裝配置clion 入的坑

Ubuntu18.04 千呼萬喚始出來，並作為穩定版長久使用，作為嘗新族，必須嘗試一番；發現各種便利，首先安裝Clion Pycharm這些軟體直接在軟體商城裡下載就可以直接使用；想到前不久我還在Ubuntu16.04下各種配置，終端啟動，說多了都是淚；不過

Ubuntu 18.04 下用命令行安裝Sublime

repo tps class all http true ubuntu har tab 介紹：添加來源： $ wget -qO - https://download.sublimetext.com/sublimehq-pub.gpg | sudo apt-key add

Ubuntu-18.04 下使用Nginx搭建高可用，高並發的asp.net core集群

style document pass width pro mat exceptio 就是 unix 一.實現前的準備以下是實現簡單負載均衡的思路，圖中的服務器均為虛擬機三臺Linux服務器，一臺用作Nginx負載均衡（192.168.254.139），另外兩臺

ubuntu 18.04下virtualbox啟動報錯

啟動VirtualBox的虛擬機器的時候出現瞭如圖所示的報錯解決辦法： [email protected]:~$ sudo apt-get update [email protected]:~$ sudo apt-get install dkms [email

ubuntu 18.04下解決網易雲音樂不能開啟的問題

1、sudo gedit /etc/sudoers在最後面加一行： guojing ALL = NOPASSWD: /usr/bin/netease-cloud-music 注：guojing為當前登入使用者名稱 2、sudo gedit /usr/share/applications/ne

Ubuntu 18.04 下用命令列安裝Sublime

介紹：新增來源： $ wget -qO - https://download.sublimetext.com/sublimehq-pub.gpg | sudo apt-key add - $ sudo apt-add-repository "deb https://download.sublime

Ubuntu 16.04下配置GPU版CUDA和cuDNN

先介紹一下我自己的配置環境 Ubuntu 16.04 Intel i7 CPU 16G記憶體 GTX980Ti 顯示卡 1、安裝NVIDIA顯示卡驅動（1）先在NVIDIA官網上下載對應的驅動程式，可根據自己的GPU的型號下載相應的.run檔案例如NVIDIA-L

在Ubuntu 16.04下安裝 virtualbox 5.0/5.1

不知道為什麼，下載好官方的安裝包之後安裝總是儲存。我放棄了官方的安裝包，想辦法從其他地方安裝。軟體商店試過，一直在安裝，似乎卡住了，最後是通過添加了一個源的方式才裝上的～這裡放上安裝的過程 sudo sh -c 'echo "deb http://download.virtua

Ubuntu 18.04下部署MongoDB複製集（副本集）

環境作業系統： 18.04 MongoDB: 4.0.3 伺服器首先部署3臺伺服器，1臺主節點 + 2臺從節點 3臺伺服器的內容ip分別是： 10.140.0.5 （主節點） 10.140.0.6 （從節點01）

Ubuntu 18.04 從頭配置 openVPN MySQL+PAM VPN系統

環境 server: Distributor ID: Ubuntu Description: Ubuntu 18.04.1 LTS Release: 18.04 Codename: bionic client: OS 名稱：Microsoft Windows 7 企業版 OS

Ubuntu 18.04中安裝VMware14.1.0踩坑

Ubuntu 18.04中安裝VMware14.1.0踩坑 96 GodfansMa 2018.09.04 10:50* 字數 465 閱讀 88評論 0喜歡 1 轉載自： https://www.jianshu.com/p/5fc43bbbac5a 如果只想快速安裝VMware 請

在Ubuntu 18.04上配置openvpn

在開發和工作中，有時候需要用VPN連線受限網路，所以我研究了一下，記錄了我在我Ubuntu 18.04伺服器上的安裝過程。本文參考了DigitalOcean的教程，原文CA和VPN伺服器為了安全是兩個不同的伺服器，我為了省事，讓VPN伺服器同時當做CA，如果有需要請

ubuntu 18.04下配置Hadoop 3.0.3