Hadoop2.x偽分布式環境搭建(一)

阿新 • • 發佈：2017-07-19

ava 內容 replicat 檢查 user form 基本臨時 sla

1、安裝hadoop環境，以hadoop-2.5.0版本為例，搭建偽分布式環境，所需要工具包提供網盤下載：http://pan.baidu.com/s/1o8HR0Qu

2、上傳所需要的工具包到linux相對就應的目錄中

3、接上篇(Linux基礎環境的各項配置(三)中最後一部分，需卸載系統自帶的jdk，以免後續安裝的jdk產生沖突)，卸載jdk完成後，安裝jdk-7u67-linux-x64.tar.gz版本，上述工具包可下載

(1)、解壓JDK

tar -zxf jdk-7u67-linux-x64.tar.gz -C ../model/

(2)、配置環境變量，在/etc/profile配置文件末尾加入如下內容（需要管理員權限才能操作此文件

）

##JAVA_HOME
export JAVA_HOME=/opt/model/jdk1.7.0_67
export PATH=$PATH:$JAVA_HOME/bin

(3)、讓文件生效執行如下命令

source /etc/profile

(4)、執行java -version命令，出現如下圖所示則jdk配置成功

技術分享

4、hadoop-2.5.0安裝與配置

(1)、解壓下載好的hadoop-2.5.0.tar.gz包

tar -zxf hadoop-2.5.0.tar.gz -C ../model/

(2)、進入hadoop-2.5.0目錄，在當前路徑的share目錄下，有個doc目錄，此目錄存放的都是官方英文說明文檔，基本沒用且占用空間及大，建議刪除此目錄，為後續發送集群節點節省時間

rm -rf share/doc

(3)、修改/opt/model/hadoop-2.5.0/etc/hadoop目錄下hadoop-env.sh、mapred-env.sh、yarn-env.sh這三個配置文件，設置JAVA_HOME安裝目錄，如下所示

export JAVA_HOME=/opt/model/jdk1.7.0_67

(4)、修改core-site.xml配置文件，內容如下

<configuration>
    <!--指定namenode主節點所在的位置以及交互端口號-->
    <property>
        < 
name>fs.defaultFS</name>
        <value>hdfs://hadoop-senior01.dinghong.com:8020</value>
    </property>
    <!--更改hadoop.tmp.dir的默認臨時目錄路徑-->
    <!-- /opt/model/hadoop-2.5.0/data/tmp 這個路徑需自己先行創建 -->
    <property>
        <name>hadoop.tmp.dir</name>
        <value>/opt/model/hadoop-2.5.0/data/tmp</value>
    </property>
</configuration>

(5)、修改slaves配置文件，內容修改如下

#定義datanode從節點所在哪臺機器，由於此次筆記是偽分布式安裝，所有主從節點都在一臺機器上，所以主機名都是一樣
hadoop-senior01.dinghong.com

(6)、修改hdfs-site.xml配置文件，內容如下

<configuration>
    <!--指定副本個數，默認值是3個-->
    <property>
        <name>dfs.replication</name>
        <value>1</value>
    </property>
</configuration>

(7)、修改yarn-site.xml配置文件，內容如下

<configuration>
    <!-- 指定yarn上運行的是mapreduce程序 -->
    <property>
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
    </property>
    <!--指定ResourceManager的位置-->
    <property>
        <name>yarn.resourcemanager.hostname</name>
        <value>hadoop-senior01.dinghong.com</value>
    </property>
</configuration>

(8)、將mapred-site.xml.template文件重命名為mapred-site.xml，並修改其內容如下

<configuration>
    <!--指定MapReduce運行在YARN上-->
    <property>
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
    </property>
</configuration>

(9)、對於NameNode進行格式化操作，命令如下（只需要一次格式化，多次格式化會出錯）：

 bin/hdfs namenode -format

出現如下圖所示，表示格式化成功，若格式化出現錯誤，則需要仔細查找日誌信息，查找出錯原因，再次格式之前，一定把/opt/model/hadoop-2.5.0/data/tmp目錄下的文件刪除幹凈

技術分享

5、hadoop-2.5.0上述步驟操作完畢後，即可啟動相關進程

sbin/hadoop-daemon.sh start namenode
sbin/hadoop-daemon.sh start datanode
sbin/yarn-daemon.sh start resourcemanager
sbin/yarn-daemon.sh start nodemanager

技術分享

在web頁面訪問hdfs以及yarn信息頁面，說明啟動成功了，如下圖所示

技術分享

6、繼續開啟自帶歷史服務器和日誌聚集功能

(1)、修改mapred-site.xml配置文件，配置歷史服務器，添加如下內容

<!-- 指定歷史服務器的所在機器 -->
<property>
    <name>mapreduce.jobhistory.address</name>
    <value>hadoop-senior01.ibeifeng.com:10020</value>
 </property>
<!-- 指定歷史服務器外部訪問地址 -->
<property>
    <name>mapreduce.jobhistory.webapp.address</name>
    <value>hadoop-senior01.ibeifeng.com:19888</value>
</property>

(2)、修改yarn-site.xml配置文件，開啟日誌聚集功能，添加如下內容

<!-- 指定是否開啟日誌聚集功能 -->
<property>
    <name>yarn.log-aggregation-enable</name>
    <value>true</value>
</property>
<!-- 設置日誌在HDFS上保留的時間期限 -->
<property>
    <name>yarn.log-aggregation.retain-seconds</name>
    <value>106800</value>
</property>

7、HDFS文件權限的修改

(1)、修改hdfs-site.xml配置文件，設置不檢查文件權限，添加如下內容

<!--設置不啟用HDFS文件系統的權限檢查-->
<property>
    <name>dfs.permissions.enabled</name>
    <value>false</value>
</property>

(2)、修改core-site.xml配置文件，設置不檢查文件權限，添加如下內容

<!--指定修改Hadoop靜態用戶名,建議設為hadoop啟動用戶-->
<property>
    <name>hadoop.http.staticuser.user</name>
    <value>dhong</value>
</property>

8、重啟上述6、7步修改過配置文件的相關進程，並運行程序測試，修改是否正確

總結：

　　以上步驟是hadoop環境的基本配置，可以在上面跑wordcount程序了，由於是用偽分布式搭建的環境，配置比較簡單，僅供搭建實驗環境參考，在真實的工作當中，hadoop要配置的信息遠不止這些，也為自己學習大數據記錄一些簡單的筆記

Hadoop2.x偽分布式環境搭建(一)

ava 內容 replicat 檢查 user form 基本臨時 sla 1、安裝hadoop環境，以hadoop-2.5.0版本為例，搭建偽分布式環境，所需要工具包提供網盤下載：http://pan.baidu.com/s/1o8HR0Qu 2、上傳所需要的工具包到

HDFS偽分布式環境搭建

Hadoop HDFS 大數據偽分布式環境搭建 HDFS概述及設計目標什麽是HDFS：是Hadoop實現的一個分布式文件系統（Hadoop Distributed File System），簡稱HDFS 源自於Google的GFS論文論文發表於2003年，HDFS是GFS的克隆版

NoSQL-redis-單機多實例，偽分布式環境搭建

地址 eat 圖片 info .com 開啟 enabled 生成 rep 1、需要6個redis實例 2、創建redis-cluster，拷貝6份，安裝生成得bin 3、修改配置文件打開cluster-enabled yes前面得註釋 port 分別為7001，70

hadoop偽分布式環境搭建

hadoop1、準備1.1、在vmware上安裝centos7的虛擬機1.2、系統配置配置網絡# vi /etc/sysconfig/network-scripts/ifcfg-ens33BOOTPROTO=staticONBOOT=yesIPADDR=192.168.120.131GATEWAY=192.1

hadoop0.20.2偽分布式環境搭建

VM cal local 下載 lld map same ces task 雖然現在hadoop版本已經到了主流2點多的時代，但是對於學習大數據而言，我還是選擇從以前老的版本0.20.2學起。下面就是偽分布式的環境搭建過程。hadoop下載地址：http://archive

hadoop偽分布式環境搭建:linux操作系統安裝圖解

提問光驅存儲設備 -i 耐心語言圖文目前下載本篇文章是接上一篇《新手入門篇：虛擬機搭建hadoop環境的詳細步驟》，上一篇有人問怎麽沒寫hadoop安裝。在文章開頭就已經說明了，hadoop安裝會在後面寫到，因為整個系列的文章涉及到每一步的截圖，導致文章整體很

Spark2.4.0偽分布式環境搭建

hadoop webui 路徑安裝 title temp env idt ava 一、搭建環境的前提條件　　環境：ubuntu-16.04 　　　　　hadoop-2.6.0 　　　　 jdk1.8.0_161。　　　　　spark-2.4.0-bin-h

Hadoop初體驗：快速搭建Hadoop偽分布式環境

hadoop 偽分布式大數據 0.前言本文旨在使用一個全新安裝好的Linux系統從0開始進行Hadoop偽分布式環境的搭建，以達到快速搭建的目的，從而體驗Hadoop的魅力所在，為後面的繼續學習提供基礎環境。對使用的系統環境作如下說明：操作系統：CentOS 6.5 64位主機I

Hadoop完全分布式環境搭建

操作主目錄可用 8.0 www map 是否 devel ice 前言本文搭建了一個由三節點（master、slave1、slave2）構成的Hadoop完全分布式集群（區別單節點偽分布式集群），並通過Hadoop分布式計算的一個示例測試集群的正確性。本文集群三

CDH版本hadoop2.6偽分布式安裝

2.6 ica sha sbin 安裝目錄 htm 分布集群 cond CDH版本hadoop的一個重要分支，使用hadoop-2.6.0-cdh5.9.0在單臺CentOS配置hadoop偽分布式環境； 1、基礎環境配置主機名 IP地址角色 Hadoop用戶

HDFS偽分布式環境操作

。/；（一）、HDFS shell操作以上已經介紹了如何搭建偽分布式的Hadoop，既然環境已經搭建起來了，那要怎麽去操作呢？這就是本節將要介紹的內容： HDFS自帶有一些shell命令，通過這些命令我們可以去操作HDFS文件系統，這些

hadoop 分布式環境搭建處理

大數據 hadoop 一: 環境配置二：系統環境的初始化三：安裝hadoop與配置處理四：環境測試一: 環境配置 1.1系統軟件要求：系統：CentOS 6.4 X64 軟件：Hadoop-2.5.2.tar.gz native-2.5.2.tar.gz jdk-7u6

HDFS偽分布式環境操作-此文章在我的個人51.cto轉載

其他命令 col 這就是 logger dcom usr etc where mkdir -p （一）、HDFS shell操作以上已經介紹了如何搭建偽分布式的Hadoop，既然環境已經搭建起來了，那要怎麽去操作呢？這就是本節將要介紹的

VM上Hadoop3.1偽分布式模式搭建

RM .sh ota exe sysconfig s參數 CA 外網地址 https://www.cnblogs.com/asker009/p/9126354.html 最近要搭建一個Hadoop做實驗，因為版本的問題遇到不少的坑，本文記錄VM上搭建的CentOS7.0

Hadoop分布式環境搭建

虛擬文件 ado 進程 .com dev png per bsp 作者：gqk: 　　使用多個服務器訪問hadoop的各個進程；　　Hadoop分布式環境搭建準備工作：　　　　克隆三個虛擬機：　　　　　　　　機器規劃：　　　　　　　更改兩個機器的MAC的地址

hadoop2.4.1偽分布式搭建.txt

java hadoop pro sts temp hostname lin 屌絲子網掩碼 1.準備Linux環境 1.0點擊VMware快捷方式，右鍵打開文件所在位置 -> 雙擊vmnetcfg.exe -> VMnet1 host-only -&g

【HADOOP】| 環境搭建：從零開始搭建hadoop大數據平臺（單機/偽分布式）-下

虛擬機克隆成功之前藍色 ref pin highlight .gz xml文件因篇幅過長，故分為兩節，上節主要說明hadoop運行環境和必須的基礎軟件，包括VMware虛擬機軟件的說明安裝、Xmanager5管理軟件以及CentOS操作系統的安裝和基本網絡配置。具體

hadoop偽分布式集群搭建與安裝（ubuntu系統）

log 結束實的變量開啟 web 路徑 har ont 1：Vmware虛擬軟件裏面安裝好Ubuntu操作系統之後使用ifconfig命令查看一下ip; 2：使用Xsheel軟件遠程鏈接自己的虛擬機，方便操作。輸入自己ubuntu操作系統的賬號密碼之後就鏈接成

Hadoop簡介與偽分布式搭建—DAY01

fig 初始化 resolve 子網掩碼產生安裝包 ifcfg 指定 property 一、 Hadoop的一些相關概念及思想 1、hadoop的核心組成：（1）hdfs分布式文件系統（2）mapreduce 分布式批處理運算框架（3）yarn 分布式

python分布式爬蟲搭建開發環境（二）

back col 性能 16px 動態網頁網頁 ebs {} 常見類 scrapy 優勢： resquests和Beautifulsoup都是庫，scrapy是框架 scrapy框架可以加入前兩項 scrapy基於twisted，性能是最大的優勢 scrapy方便擴展，

Hadoop2.x偽分布式環境搭建(一)

1、安裝hadoop環境，以hadoop-2.5.0版本為例，搭建偽分布式環境，所需要工具包提供網盤下載：http://pan.baidu.com/s/1o8HR0Qu

2、上傳所需要的工具包到linux相對就應的目錄中

3、接上篇(Linux基礎環境的各項配置(三)中最後一部分，需卸載系統自帶的jdk，以免後續安裝的jdk產生沖突)，卸載jdk完成後，安裝jdk-7u67-linux-x64.tar.gz版本，上述工具包可下載

4、hadoop-2.5.0安裝與配置

5、hadoop-2.5.0上述步驟操作完畢後，即可啟動相關進程

6、繼續開啟自帶歷史服務器和日誌聚集功能

7、HDFS文件權限的修改

8、重啟上述6、7步修改過配置文件的相關進程，並運行程序測試，修改是否正確

總結：

相關推薦