CentOS6.5虛擬機器下搭建Hadoop偽分散式環境

阿新 • • 發佈：2019-01-10

一、實驗環境

作業系統：CentOS6.5
Hadoop版本：hadoop-2.7.2
JDK版本：jdk-8u73-linux-x64

二、搭建步驟

1.安裝作業系統：使用VitualBox安裝CentOS6.5作業系統，安裝方式選擇為預設。（硬碟大小為20G，預設使用全部空間會對其做成LVM）。

2.通過以下命令修改當前主機名稱：

vim /etc/sysconfig/network

修改完成後重啟機器。

3.配置網路：
    ① 開機不啟動NetworkManager服務：

chkconfig NetworkManager off

    ② 停掉NetworkManager服務：

/etc/init.d/NetworkManager stop

    ③ 編輯網絡卡配置檔案

vim /etc/sysconfig/network-scripts/ifcfg-eth0

      內容編輯如下：

DEVICE=eth0    
HWADDR=08:00:27:71:30:C0     
TYPE=Ethernet           
UUID=af0e8611-c438-4aa6-923c-ab55b3380478
ONBOOT=yes
BOOTPROTO=static
IPADDR=192.168.0.15
NETMASK=255.255.255.0

4.關閉防火牆並設為開機不啟動：
    ① 關閉防火牆服務：

/etc/init.d/iptables stop

    ② 開機不啟動防火牆：

chkconfig NetworkManager off

5.配置JDK環境：
    ① 將jdk-8u73-linux-x64.tar.gz包解壓到/opt當中：

tar -xvf jdk-8u73-linux-x64.tar.gz -C /opt/

    ② 配置系統環境變數：

vim /etc/profile

     在/etc/profile檔案中新增如下行：

export JAVA_HOME=/opt/jdk1.8.0_73
export JRE_HOME=${JAVA_HOME} 
/jre
export PATH=${JAVA_HOME}/bin:$PATH

    儲存退出，然後使用如下命令更新當前終端的環境變數配置

source /etc/profile

    完成之後，使用如下命令來確認配置是否成功

java -version

    若配置成功，則如下圖所示：
    ![java -version](https://img-blog.csdn.net/20160223215030112)

6.在/下依次建立新資料夾，並將hadoop程式壓縮包解壓到該資料夾當中。

mkdir -p /hadoop/program && tar -xvf hadoop-2.7.2.tar.gz -C /hadoop/program/

7.將含有hadoop常用命令的目錄新增到環境變數中

vim /etc/profile

 在最後新增如下欄位：

export HADOOP_HOME=/hadoop/program/hadoop-2.7.2
export PATH=$HADOOP_HOME/bin:${PATH}

儲存重啟，然後使用source命令更新當前終端配置。

8.配置hadoop：
hadoop的配置檔案都在程式目錄下中的etc/hadoop資料夾當中，對應我當前機器的絕對路徑為/hadoop/program/hadoop-2.7.2/etc/hadoop資料夾。搭建hadoop偽分散式環境需要修改5個配置問價，如下：
    ① core-site.xml
    *該配置檔案指定**NameNode地址**以及hadoop執行時產生檔案的的存放地址*。 修改configuration標籤：

<configuration>
        <property>
                <name>fs.defaultFS</name>
                <value>hdfs://node1:9000</value>
        </property>

        <property>
                <name>hadoop.tmp.dir</name>
                <value>/hadoop/tmp</value>
        </property>
</configuration>

    ② hadoop-env.sh
    該配置檔案主要指定hadoop執行時的環境變數，在該檔案中，修改預設的JAVA_HOME對應值：

export JAVA_HOME=/opt/jdk1.8.0_73

    ③ hdfs-site.xml
    通過該配置檔案指定檔案存放副本的數量，修改configuration標籤對應值（儲存1份副本）：

<configuration>
        <property>
                <name>dfs.replication</name>
                <value>1</value>
        </property>
</configuration>

    ④ mapred-site.xml
    指定mapreduce的執行方法（YARN），修改configuration標籤如下：

<configuration>
        <property>
                <name>mapreduce.framework.name</name>
                <value>yarn</value>
        </property>
</configuration>

⑤ yarn-site.xml
通過該配置檔案指定NodeManager獲取資料的方式使shuffle，和指定YARN ResourceManager的地址，修改configuration標籤如下。

<configuration>

<!-- Site specific YARN configuration properties -->
        <property>
                <name>yarn.nodemanager.aux-services</name>
                <value>mapreduce_shuffle</value>
        </property>

        <property>
                <name>yarn.resourcemanager.hostname</name>
                <value>node1</value>
        </property>
</configuration>

三、啟動Hadoop

1.初始化HDFS檔案系統：

hdfs namenode -format

2.啟動HDFS和MapReduce，相應的啟動指令碼在hadoop程式目錄中的sbin資料夾中，分別執行start-hdfs.sh和start-yarn.sh指令碼。

四、測試Hadoop

1.通過瀏覽器方式對HDFS和MapReduce進行訪問，HDFS預設的瀏覽器訪問埠為為50070,MapReduce預設的訪問埠為8088。訪問成功如圖所示：

HDFS訪問成功頁面

MapReduce訪問成功頁面

2.將檔案上傳到HDFS當中，使用命令:

hadoop fs -put 檔名稱 hdfs://node1:9000/

這裡寫圖片描述

在Utilities標籤頁下可以看到上傳的檔案的資訊。

3.使用MapReduce進行簡單的資料分析，使用Hadoop程式目錄下的share/hadoop/mapreduce/中的測試jar檔案hadoop-mapreduce-examples進行測試：

hadoop jar hadoop-mapreduce-examples-2.7.2.jar wordcount hdfs://node1:word hdfs://node1:wordout

執行成功後，可以看到在HDFS下有的wokdout檔案：
這裡寫圖片描述

下載下來進行檢視，可以看到：
這裡寫圖片描述

CentOS6.5虛擬機器下搭建Hadoop偽分散式環境

一、實驗環境作業系統：CentOS6.5 Hadoop版本：hadoop-2.7.2 JDK版本：jdk-8u73-linux-x64 二、搭建步驟 1.安裝作業系統：使用VitualBox安裝CentOS6.5作業系統，安裝方式選擇為

windows10下 eclipse連線虛擬機器中的Hadoop偽分散式叢集

在windows用eclipse連線hadoop之後，可以便於進行mapreduce開發，非常方便，如果在虛擬機器裡面用eclipse的話，emmmmmm，你會卡到懷疑人生。首先需要去下載eclipse，這個直接官網就ok link

關於VMWare虛擬機器下搭建hadoop叢集練習各虛擬機器間無法ping通主機名的問題

最近看了點hadoop的視訊教程，看起來好流弊的樣子，於是忍不住動手在VMWare上嘗試著搭下hadoop的叢集環境，然而對於初學者的我，上來就遇到了一個問題。。。在跟著嘗試做ssh免密碼登入的時候，在虛擬機器間直接ping ip地址可以ping通，但是ping主機名的

在 kali linux 下搭建 hadoop 偽分散式系統

記錄在 kali linux 下搭建 hadoop 偽分散式的過程： 1. 安裝和設定 JDK： 1） kali 中預設已經安裝 Java，可以使用 java -version 檢查 Java的安裝情況；發現 java 的安裝檔名可能是 openjdk 2

虛擬機器下搭建JDK+Tomcat+Nginx環境【一】——安裝準備工作

自己動手在虛擬機器上搭建Jdk8-Tomcat8-Nginx1.12的部署環境，虛擬機器VMware workstation12，作業系統centOS 7。一：下載軟體火狐上搜索，直接下

搭建Hadoop偽分散式環境（筆記）

軟硬體環境 CentOS 7.2 64 位 OpenJDK- 1.8 Hadoop- 2.7 關於本教程的說明雲實驗室雲主機自動使用 root 賬戶登入系統，因此本教程中所有的操作都是以 root 使用者來執行的。若要在自己的雲主機上進行本教程的實驗，為了系統安全，建議

Centos7下配置Hadoop偽分散式環境

Centos 版本：7 Hadoop版本：2.7.4 Java版本：1.8 一、安裝JDK 官網下載jdk 1.8 http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.

Ubuntu16.04搭建hadoop偽分散式環境

參考自：https://blog.csdn.net/hliq5399/article/details/78193113 原材料： 1.Ubuntu16.04作業系統成品（在vmware上安裝成功） 2.jdk-7u67-linux-x64.tar.gzjdk-7u67-

搭建 Hadoop 偽分散式環境

軟硬體環境 CentOS 7.2 64 位 OpenJDK- 1.8 Hadoop- 2.7 關於本教程的說明雲實驗室雲主機自動使用 root 賬戶登入系統，因此本教程中所有的操作都是以 root 使用者來執行的。若要在自己的雲主機上進行本教程的實驗

Windows 7 64位系統上搭建Hadoop偽分散式環境（很詳細）

在開始配置前，我們先了解Hadoop的三種執行模式。 Hadoop的三種執行模式獨立（或本地）模式：無需執行任何守護程序，所有程式都在同一個JVM上執行。在獨立模式下測試和除錯MapReduce程式很方便，因此該模式在開發階段比較適合。 **偽分散式

基於docker搭建hadoop偽分散式環境時遇到的坑

最近課堂作業需要使用hadoop環境，正好前段時間學了一下docker教程的用法，而自己又只有一臺電腦，所以就趁著這次機會學習下怎麼利用docker搭建偽分散式的hadoop環境。我主要時參考這篇博主的教程,教程很好，跟著這個教程大部分都是很順利的

分散式儲存 CentOS6.5虛擬機器環境搭建FastDFS-5.0.5叢集

前言: 由於公司專案需要，最近開始學習一下分散式儲存相關知識，確定使用FastDFS這個開源工具。利用週末的時間在虛擬機器上搭建了分散式儲存系統，在搭建過程中，發現網上的資料說的並不是很全，有些細節需要單獨搜尋或者自己判斷，所以現在想寫這篇部落格儘量記錄一下自己在過程中遇到的問題，以及是如何解決

Linux3 在VMware中搭建CentOS6.5虛擬機器

前言: 本文主要是我在大家hadoop叢集之前，需啊先安裝CentOS虛擬機器，記錄在此，作為參考。如果能幫助到其他人，自然是更好啦。 ============================================================長長的分割線=============

VMware虛擬機器中搭建Hadoop叢集

1、下載的軟體： VMware Workstation Ubuntu SUN-JDK Hadoop,可到官網下載 2、安裝 VMwareWorkstation 虛擬機器，並建立 Master 虛擬主機(記住，先是建立一個虛擬機器，然後在這個基礎上進行clone，

zookeeper-3.4.7 環境搭建（偽分散式環境三臺虛擬機器）

樓主小白，本帖給自已以後重灌留點記憶。希望能幫到他人。本人實驗切實可行。環境準備 hadoop-2.7.5（搭建完成），centos 6.5 ，zookeeper-3.4.7.tar.gz 1.準備安裝目錄為 /home/ywh (cd ) 2.解壓縮 zoo

CentOS6.5虛擬機器安裝Caffe大致記錄

1. 首先，我是在虛擬機器上安裝的，虛擬機器的安裝過程這裡不說了。安裝完centos6.5後，要看看你的網路配置，這裡可以參考：我是自動獲取IP的。配置完成後需要重啟服務 ifconfig -a vi /etc/sysconfig/network-scripts/i

虛擬機器下建立Hadoop環境

2018/6/26本文大多參考博主luck_nhb的搭建Hadoop叢集，只是加入了自己的一點想法、邏輯，有興趣的可以去看原文https://blog.csdn.net/luck_nhb/article/details/79444635本文多數命令不能直接複製、貼上，請手打！

vmware的centos6.5虛擬機器網路無法連線的解決辦法

VMware是一款虛擬機器，支援各種熱門系統，我們可以在VMware虛擬機器中安裝其他系統以滿足個人需求，但在為VMware安裝CentOS6.5後，無法連線網路，這是什麼原因導致的呢？下面就給大家介紹

[虛擬機器VM][Ubuntu12.04]搭建Hadoop完全分散式環境（一）

前言大家都知道，Hadoop的部署方式可分為單機模式偽分散式完全分散式本篇主要講解的就是完全分散式。搭建完全分散式的叢集環境，需要多臺的硬體裝置，作為初學者，為了搭建叢集去買多臺電腦，多少有點不現實，所以這裡我採用的是VM虛擬機器，模擬搭

如何在ubuntu虛擬機器下搭建jenkins，並通過主機訪問

安裝jdk 1、首先到oracle下載上下載jdk-7u60-linux-i586.tar.gz 2、將jdk-7u60-linux-i586.tar.gz拷貝到/usr/lib/jvm/目錄下面，這裡如果沒有jvm資料夾，則建立該資料夾, 命令: sud

CentOS6.5虛擬機器下搭建Hadoop偽分散式環境

一、 實驗環境

二、 搭建步驟

三、 啟動Hadoop

四、 測試Hadoop

相關推薦

一、實驗環境

二、搭建步驟

三、啟動Hadoop

四、測試Hadoop