hadoop分散式環境搭建(vmware14+hadoop2.9.0(包含yarn)+Ubuntu16.04LTS+jdk1.8.0_161)

阿新 • • 發佈：2019-02-01

博主最近在vmware workstation14+hadoop2.9.0+Ubuntu16.04LTS環境下搭建了一個master(一個namenode)兩個slave(即兩個datanode)的分散式hadoop環境，下面將本次博主搭建的過程及步驟按照和各位博友分享，由於博主未儲存搭建時各步驟的截圖，因此將使用前輩們各步驟截圖或者無截圖，望各位前輩見諒。

進行配置之前，需要在ubuntu中安裝vim外掛編輯檔案，相比於vi和gedit工具，該工具更容易操作，也能避免亂碼等一系列不必要的問題。

安裝命令：sudo apt-get install vim

（一）第一步：新建三臺虛擬機器，並進行相應的網路配置(靜態IP，hostname檔案配置，hosts檔案配置，關閉防火牆或者開啟相應埠)

（1）利用vmware workstation14新建三個虛擬機器(網路模式選擇橋接模式)

並根據實體機所在的網路環境，在虛擬機器中設定靜態IP，博主搭建的網路環境如下（各位博友根據自己網路環境進行相應變化）：

master節點：192.168.1.200

slave1節點：192.168.1.201

slave2節點：192.168.1.202

以上配置可以從介面進行操作，以master為例。

（2）修改hostname檔案，需要root許可權，命令：su root，輸入密碼，然後進入root，然後vim etc/hostname，master節點機器，改為master，於此相同，slave1和slave2節點也分別改為slave1和slave2

（3）修改hosts檔案，將下列內容新增進hosts檔案（三個節點均需要配置此步驟，需要root許可權，進入root參考上條，以master為例）

192.168.1.200 master

192.168.1.201 slave1

192.168.1.202 slave2

（4）關閉防火牆或者開啟使用埠（三個節點均需要配置此步驟，博主使用的是關閉防火牆，簡單粗暴）

進入root使用者，關閉防火牆命令為：ufw disable

執行命令後，提示防火牆服務不會在開機時啟動即可

（5）測試

master節點：ping slave1 看是否ping通

ping slave2 看是否ping通

slave1 節點：ping master 看是否ping通

ping slave2 看是否ping通

slave2 節點：ping master 看是否ping通

ping slave1 看是否ping通

如以上測試通過，則第一步配置成功

（二）第二步，三臺虛擬機器分別新建相同的使用者（如果新建的三臺虛擬機器有相同的使用者，我覺得此步驟可以省略，以master為例）

（1）新建名為hadoop使用者組

（2）新增一個使用者mwq，並新增進hadoop使用者組，並制定使用者目錄

（3）設定mwq使用者密碼，連續輸入兩次

（4）設定mwq使用者許可權，賦予admin許可權

以下步驟切換到mwq使用者進行

（三）第三步，機器未安裝ssh時需安裝ssh服務，並在三臺虛擬機器之間開啟ssh免密的登入

（1）三臺機器均需安裝ssh服務(以master節點為例)

（2）虛擬機器自身免密登入自身（三臺虛擬機器均需要此步驟設定），以master節點為例，輸入ssh-keygen -t rsa -P ""，敲回車兩次，直到出現以下介面

進入.ssh資料夾

用cat id_rsa.pub >> authorized_keys 命令生成免密登入authorized_keys，實現免密登入

效果如下：

第一次需要輸入yes，以後就不需要了

（3）配置master到slave1和slave2的免密登入（該操作在slave1和slave2上操作）

首先將master中生成的id_rsa.pub複製到已安裝ssh服務的slave1和slave2中的.ssh資料夾

然後利用cat id_rsa.pub >> authorized_keys實現master登入到slave1和slave2的免密登入

（四）安裝java jdk環境（本文使用jdk1.8.0_161，三臺虛擬機器均需要此操作）

（1）首先去oracle官網，下載jdk8，預設檔案儲存到/home/mwq/Downloads

（2）我的解壓目錄為/usr/lib下的jvm資料夾，而且jvm資料夾不存在，需要在root許可權下建立，如下圖所示

進入jvm資料夾

複製Downloads資料夾下的jdk到jvm並解壓

切換到mwq使用者並配置環境變數，編輯/.bashrc檔案

在檔案末尾輸入以下內容

使配置檔案生效

檢視是否配置成功

另外的slave1和slave2節點也可按照以上步驟配置

（五）下載並配置hadoop(三臺主機均需相同配置)

在以下地址http://mirrors.hust.edu.cn/apache/hadoop/common/hadoop-2.9.0/hadoop-2.9.0.tar.gz下載hadoop-2.9.0，千萬別下成hadoop-2.9.0-src.tar.gz

博主在/home/mwq中新建hadoop資料夾，並將hadoop-2.9.0解壓到hadoop下面（三臺主機存放hadoop-2.9.0檔案的位置相同）

修改/home/mwq/hadoop/hadoop-2.9.0/etc/hadoop/hadoop-env.sh檔案

修改/home/mwq/hadoop/hadoop-2.9.0/etc/hadoop/core-site.xml檔案

修改/home/mwq/hadoop/hadoop-2.9.0/etc/hadoop/hdfs-site.xml檔案

修改/home/mwq/hadoop/hadoop-2.9.0/etc/hadoop/mapred-site.xml.template檔案

修改/home/mwq/hadoop/hadoop-2.9.0/etc/hadoop/slaves檔案

修改/etc/profile檔案,加入以下內容

執行結果：

（六）格式化，只需在master節點

hadoop namenode -format，測試通過後可以配置yarn和mapreduce

（七）配置yarn，主要修改yarn-env.sh，yarn-site.xml和mapred-sitexml，master節點修改好之後，複製到slave1和salve2節點即可

yarn-env.sh 新增jdk目錄

mapred-site.xml在剛才配置的基礎上，增加以下未有的內容

yarn-site.xml增加以下配置

（七）啟動hadoop服務

start-all.sh

hadoop分散式環境搭建(vmware14+hadoop2.9.0(包含yarn)+Ubuntu16.04LTS+jdk1.8.0_161)

博主最近在vmware workstation14+hadoop2.9.0+Ubuntu16.04LTS環境下搭建了一個master(一個namenode)兩個slave(即兩個datanode)的分散式hadoop環境，下面將本次博主搭建的過程及步驟按照和各位博

從零開始hadoop分散式環境搭建

1. Linux虛機換機環境安裝 1.1 linux環境安裝 1.建議選擇虛擬機器:VirtualBox 2.Linux版本：Ubuntu 3.安裝時選擇動態擴充套件磁碟，最大磁碟容量50G(最大磁碟容量太小，hadoop使用過程中容易出現意想不到的

Hadoop分散式環境搭建

Hadoop 2.x部署　　*local Mode 　　*Distributed Mode 　　　　*偽分散式　　　　　一臺機器，執行所有的守護程序　　　　　從節點DataNode、NodeManager

Hadoop分散式環境搭建（二）

Hadoop偽分散式環境搭建（二）　安裝Hadoop 1. 下載hadoop壓縮包 2. 解壓 cd /usr/local sudo tar -vxzf hadoop-2.

[大資料學習研究] 3. hadoop分散式環境搭建

1. Java安裝與環境配置 Hadoop是基於Java的，所以首先需要安裝配置好java環境。從官網下載JDK，我用的是1.8版本。在Mac下可以在終端下使用scp命令遠端拷貝到虛擬機器linux中。 danieldu@daniels-MacBook-Pro-857 ~/Down

hadoop2.9.0 hdfs環境搭建(偽分散式)

搭建hadoop2.9.0偽分散式步驟使用了centos7,jdk1.8,hadoop2.9.0 版本算是很新的了.沒有使用什麼古老的版本. 1. 檢視自帶的jdk,解除安裝centos中自帶的jdk 檢視: rpm -qa |grep java 解除安

Hadoop2.2.0偽分散式環境搭建（附：64位下編譯Hadoop-2.2.0過程）

Hadoop2.2.0偽分散式環境搭建：寫在前面：Hadoop2.2.0預設是支援32位的OS，如果想要在64位OS下執行的話，可以通過在64位OS下面編譯Hadoop2.2.0來實現，編譯的操作步驟在最後面呈現。 1：操作：下載軟體；檔案：Hadoop-2.2.0.

Spark之——Hadoop2.7.3+Spark2.1.0 完全分散式環境搭建全過程

一、修改hosts檔案在主節點，就是第一臺主機的命令列下;vim /etc/hosts我的是三臺雲主機：在原檔案的基礎上加上;ip1 master worker0 namenode ip2 worker1 datanode1 ip3 worker2 datanode2其中的i

Hadoop 偽分散式環境搭建——hadoop2.8+centos7（零基礎&完整版）

引言：環境：一、安裝虛擬機器在windows系統中安裝VMware14pro，直接下載安裝，無需贅述 ps：如有條件，請購買使用二、安裝linux作業系統 CentOS 是一個基於Red Hat Linux 提供的可自由使用

hadoop 全分散式環境搭建—— 詳細步驟

材料：三臺 linux 虛擬機器 hadoop2.7.2 版本以下全分散式搭建步驟：前期分別配置好JDK 建立hadoop 使用者設定好主機名稱 hosts 主機地址對映免密登入防火牆關閉三臺虛擬機器的互相通訊開始安裝

Hadoop偽分散式環境搭建之Linux作業系統安裝

Hadoop偽分散式環境搭建之Linux作業系統安裝本篇文章是接上一篇《超詳細hadoop虛擬機器安裝教程（附圖文步驟）》，上一篇有人問怎麼沒寫hadoop安裝。在文章開頭就已經說明了，hadoop安裝會在後面寫到，因為整個系列的文章涉及到每一步的截圖，導致文章整體很長。會分別先對虛擬機器

Hadoop2.7.3單機偽分散式環境搭建

Hadoop2.7.3單機偽分散式環境搭建作者：家輝，日期：2018-07-10 CSDN部落格： http://blog.csdn.net/gobitan 說明：Hadoop測試環境經常搭建，這裡也做成一個模板並記錄下來。基礎環境

Hadoop從入門到精通系列之--3.完全分散式環境搭建

目錄一什麼是完全分散式二準備伺服器三叢集分發指令碼 3.1 scp（secure copy）安全拷貝 3.2 rsync遠端同步 3.3 叢集分發指令碼四叢集規劃 4.1 規劃思想 4.2 具體配置 4.3 ssh免密登陸一什麼

Hadoop安裝教程_單機/偽分散式配置_CentOS6.4/Hadoop2.6.0

2015-12-17 (updated: 2017-03-02) 本教程適合於在 CentOS 6.x 系統中安裝原生 Hadoop 2，適用於Hadoop 2.7.1, Hadoop 2.6.0 等版本，主要參考了官方安裝教程，步驟詳細，輔以適當說明，相信按照步驟來，都

hadoop系列之偽分散式環境搭建及測試驗證

Hadoop2.x 偽分散式環境搭建及測試驗證作者：Dennis 日期：2018-08-09 前置條件： Linux 虛擬機器一臺，版本為 CentOS 7.4，假設 IP 地址為 192.168.159.181，並修改如下：修改/etc/hostname 的

Hadoop系列之完全分散式環境搭建及測試驗證

前置條件：已製作好CentOS 虛擬機器模板。該模板安裝好Oracle JDK，且 JAVA_HOME 值為/usr/java/jdk1.8.0_171-amd64/jre。準備三臺虛擬機器搭建完全 Hadoop 分散式最少需要三臺伺服器，假設三臺伺服器

hadoop叢集環境搭建之偽分散式叢集環境搭建

搭建叢集的模式有三種 1.偽分散式：在一臺伺服器上，啟動多個執行緒分別代表多個角色(因為角色在叢集中使用程序表現的) 2.完全分散式：在多臺伺服器上，每臺伺服器啟動不同角色的程序，多臺伺服器構成叢集 node01:NameNode node02:

最詳細的Hadoop+Hbase+Hive完全分散式環境搭建教程（二）

繼續上次的教程，這次安裝hbase與hive 一、hbase2.1.1安裝在master節點： $ tar -zxvf hbase-2.1.1-bin.tar.gz -C /opt $ cd /opt/hbase-2.1.1/conf/ $ vi hbase-

Hadoop偽分散式環境搭建詳細步驟和詞頻統計

一.Linux系統配置以下操作是在root使用者下進行的 1.配置網路環境在Linux圖形化介面，點選視窗欄的System-Preferences-Network Connections-System eth0-IPv4 Settings M

Hadoop2.7.4完全分散式環境搭建

軟體版本虛擬機器管理軟體：VMware WorkStation Pro 12.0 作業系統：CentOS 6.7 Hadoop：Hadoop 2.7.4 JDK：jdk-8u65-linux-x64.tar.gz 一、環境準備 1、修改各個節點主機名：vi /e