CDH版本hadoop2.6偽分布式安裝

阿新 • • 發佈：2018-01-19

2.6 ica sha sbin 安裝目錄 htm 分布集群 cond

CDH版本hadoop的一個重要分支，使用hadoop-2.6.0-cdh5.9.0在單臺CentOS配置hadoop偽分布式環境；

1、基礎環境配置

主機名	IP地址	角色	Hadoop用戶
localhost	192.168.30.139	NameNode、ResourceManager、SecondaryNameNode、DataNode、NodeManager	hadoop

1.1、關閉防火墻和SELinux

1.1.1、關閉防火墻

$ systemctl stop firewalld 
$ systemctl disable firewalld

1.1.2、關閉SELinux

$ setenforce 0
$ sed -i ‘s/enforcing/disabled/‘ /etc/sysconfig/selinux

註：以上操作需要使用root用戶

1.2、hosts配置

$ vi /etc/hosts

########## Hadoop host ##########
192.168.30.139   localhost

註：以上操作需要使用root用戶，通過ping 主機名可以返回對應的IP即可

1.3、配置無密碼訪問

首先要創建hadoop用戶，然後在4臺主機上使用hadoop用戶配置無密碼訪問，所有主機的操作相同，以hadoop-master為例

生成私鑰和公鑰

$ ssh-keygen -t rsa

拷貝公鑰到主機（需要輸入密碼）

$ ssh-copy-id hadoop@hadoop

註：以上操作需要在hadoop用戶，通過hadoop用戶ssh到其他主機不需要密碼即可。

1.4、Java環境配置

1.4.1、下載JDK

註：使用hadoop用戶操作

$ cd /home/hadoop
$ curl -o jdk-8u151-linux-x64.tar.gz http://download.oracle.com/otn-pub/java/jdk/8u151-b12/e758a0de34e24606bca991d704f6dcbf/jdk-8u151-linux-x64.tar.gz?AuthParam=1516091623_fa4174d4b1eed73f36aa38230498cd48

1.4.2、安裝java

安裝java可使用hadoop用戶操作；

$ mkdir -p /home/hadoop/app/java
$ tar -zxf jdk-8u151-linux-x64.tar.gz
$ mv jdk1.8.0_151 /home/hadoop/app/java/jdk1.8

配置Java環境變量：
```
$ vi /home/hadoop/.bash_profile
```

export JAVA_HOME=/home/hadoop/app/java/jdk1.8
export JRE_HOME=$JAVA_HOME/jre
export CLASSPATH=.:$CLASSPATH:$JAVA_HOME/lib:$JRE_HOME/lib
export PATH=$PATH:$JAVA_HOME/bin:$JRE_HOME/bin

啟用環境變量
$ source /home/hadoop/.bash_profile

註：通過java –version命令返回Java的版本信息即可

2、安裝hadoop

2.1、下載安裝CDH版本的hadoop

$ cd ~
$ curl -O http://archive.cloudera.com/cdh5/cdh/5/hadoop-2.6.0-cdh5.13.0.tar.gz
$ mkdir -p app/hadoop
$ tar -zxf hadoop-2.6.0-cdh5.9.0.tar.gz -C ./app/hadoop/

2.2、安裝配置hadoop

hadoop的安裝配置使用hadoop用戶操作；

$ mkdir -p /home/hadoop/app/hadoop/hdfs/{name,data}

2.2.1、配置core-site.xml

$ vi /home/hadoop/app/hadoop/hadoop-2.6.0-cdh5.9.0/etc/hadoop/core-site.xml

<configuration>
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://localhost:9000</value>
    </property>
    <property>
        <name>hadoop.tmp.dir</name>
        <value>file:/home/hadoop/app/hadoop/tmp</value>
    </property>
</configuration>

2.2.2、配置hdfs-site.xml

$ vi /home/hadoop/app/hadoop/hadoop-2.6.0-cdh5.9.0/etc/hadoop/hdfs-site.xml

<configuration>
    <property>
        <name>dfs.replication</name>
        <value>1</value>
    </property>
    <property>
        <name>dfs.namenode.name.dir</name>
        <value>/home/hadoop/app/hadoop/hdfs/name</value>
    </property>
    <property>
        <name>dfs.datanode.data.dir</name>
        <value>/home/hadoop/app/hadoop/hdfs/data</value>
    </property>
    <property>
        <name>dfs.webhdfs.enabled</name>
        <value>true</value>
    </property>
</configuration>

2.2.3、配置mapred-site.xml

$ cd /home/hadoop/app/hadoop/hadoop-2.6.0-cdh5.9.0/etc/hadoop/
$ cp mapred-site.xml.template mapred-site.xml

$ vi /home/hadoop/app/hadoop/hadoop-2.6.0-cdh5.9.0/etc/hadoop/mapred-site.xml

<configuration>
    <property>
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
    </property>
</configuration>

2.2.4、配置yarn-site.xml

$ vi /home/hadoop/app/hadoop/hadoop-2.6.0-cdh5.9.0/etc/hadoop/yarn-site.xml

<configuration>

<!-- Site specific YARN configuration properties -->
    <property>
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
    </property>
</configuration>

2.2.5、配置slaves

$ vi app/hadoop/hadoop-2.6.0-cdh5.9.0/etc/hadoop/slaves

localhost

2.2.6、配置hadoop-env

修改hadoop-env.sh文件的JAVA_HOME環境變量，操作如下：
$ vi /home/hadoop/app/hadoop/hadoop-2.6.0-cdh5.9.0/etc/hadoop/hadoop-env.sh

export JAVA_HOME=/home/hadoop/app/java/jdk1.8

2.2.7、配置yarn-env

修改yarn-env.sh文件的JAVA_HOME環境變量，操作如下：

$ vi /home/hadoop/app/hadoop/hadoop-2.6.0-cdh5.9.0/etc/hadoop/hadoop-env.sh

export JAVA_HOME=/home/hadoop/app/java/jdk1.8

2.2.8、配置mapred-env

修改mapred-env.sh文件的JAVA_HOME環境變量，操作如下：

$ vi /home/hadoop/app/hadoop/hadoop-2.6.0-cdh5.9.0/etc/hadoop/hadoop-env.sh

export JAVA_HOME=/home/hadoop/app/java/jdk1.8

2.2.9、配置HADOOP_PREFIX

$ vi /home/hadoop/.bash_profile

####HADOOP_PREFIX
export HADOOP_PREFIX=/home/hadoop/app/hadoop/hadoop-2.6.0-cdh5.9.0
export PATH=$PATH:$HADOOP_PREFIX/bin:$HADOOP_PREFIX/sbin

啟用環境變量

$ source /home/hadoop/.bash_profile

註：通過echo $HADOOP_PREFIX命令返回hadoop的安裝目錄

3、啟動hadoop偽分布式

3.1、啟動hdfs

格式化hdfs
```
$ hdfs namenode -format
```
啟動dfs
```
$ start-dfs.sh
```

啟動的進程

$ jps
15376 NameNode
15496 DataNode
15656 SecondaryNameNode
15759 Jps

註：關閉dfs命令為：stop-dfs.sh

3.2、啟動yarn

$ start-yarn.sh

註：關閉yarn命令為：stop-yarn.sh

3.3、啟動集群

hdfs和yarn的啟動可以使用一條命令執行：

啟動：start-all.sh
關閉: stop-all.sh

啟動後的所有進程：

$ jps
15376 NameNode
16210 Jps
15811 ResourceManager
15907 NodeManager
15496 DataNode
15656 SecondaryNameNode

MapReducer PI運算

$ hadoop jar /home/hadoop/app/hadoop/hadoop-2.6.0-cdh5.9.0/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.6.0-cdh5.9.0.jar pi 5 10

返回的結果是：Estimated value of Pi is 3.28000000000000000000

YARN管理界面：http://192.168.30.139:8088
HDFS管理界面：http://192.168.30.139:50070

4、hdfs的shell操作和Wordcount演示

4.1、簡單的hdfs shell操作

創建目錄

$ hadoop fs -mkdir /input
$ hadoop fs -mkdir /output

查看目錄

$ hadoop fs -ls /
Found 4 items
drwxr-xr-x   - hadoop supergroup          0 2018-01-19 10:56 /input
drwxr-xr-x   - hadoop supergroup          0 2018-01-19 10:56 /output
drwx------   - hadoop supergroup          0 2018-01-19 10:51 /tmp
drwxr-xr-x   - hadoop supergroup          0 2018-01-19 10:51 /user

上傳文件

$ hadoop fs -put  /home/hadoop/app/hadoop/hadoop-2.6.0-cdh5.9.0/LICENSE.txt /input

查看文本文件內容
```
$ hadoop fs -cat /input/LICENSE.txt 
```

4.2、Wordcount

將HDFS上/input/LICENSE.txt 使用hadoop內置Wordcount的jar包統計文檔的Wordcount

啟動測試

$ hadoop jar /home/hadoop/app/hadoop/hadoop-2.6.0-cdh5.9.0/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.6.0-cdh5.9.0.jar wordcount /input /output/wordcounttest

查看結果

$ hadoop fs -ls /output/wordcounttest
Found 2 items
-rw-r--r--   1 hadoop supergroup          0 2018-01-19 11:04 /output/wordcounttest/_SUCCESS
-rw-r--r--   1 hadoop supergroup      22117 2018-01-19 11:04 /output/wordcounttest/part-r-00000
$
$ hadoop fs -cat /output/wordcounttest/part-r-00000|sort -k2 -nr|head
the 641
of  396
or  269
and 255
to  241
this    164
in  162
OR  161
OF  160
a   128

5、參考資料

http://archive.cloudera.com/cdh5/cdh/5/hadoop-2.6.0-cdh5.7.5/hadoop-project-dist/hadoop-common/SingleCluster.html

CDH版本hadoop2.6偽分布式安裝

2.6 ica sha sbin 安裝目錄 htm 分布集群 cond CDH版本hadoop的一個重要分支，使用hadoop-2.6.0-cdh5.9.0在單臺CentOS配置hadoop偽分布式環境； 1、基礎環境配置主機名 IP地址角色 Hadoop用戶

Macbook Hbase(1.2.6) 偽分布式安裝，Hadoop(2.8.2) ，使用自帶zookeeper

may use oop cab cto 電腦 nds log4j clu 首先需要保證hadoop已經在電腦上安裝。然後接下來只需要下載hhase配置就行了。 Step1: 下載hbase http://archive.apache.org/dist/hbase/1.2.6

Hadoop2.x偽分布式環境搭建(一)

ava 內容 replicat 檢查 user form 基本臨時 sla 1、安裝hadoop環境，以hadoop-2.5.0版本為例，搭建偽分布式環境，所需要工具包提供網盤下載：http://pan.baidu.com/s/1o8HR0Qu 2、上傳所需要的工具包到

Hadoop偽分布式安裝

namenode 無法 let 日誌 logs targe mpi 開機啟動 form 本文介紹的主要是Hadoop的偽分布式的搭建以及遇到的相關問題的解決，做一下記錄，jdk的安裝這裏就不做太多的介紹了，相信大家根據網上的安裝介紹很快就能安裝成功。

hbase偽分布式安裝

jps env ges val logs rep java tdi 官網下載 1、首先去官網下載hbase，我下載的是hbase-1.2.6-bin.tar.gz 2、修改用戶對/usr目錄的操作權限 sudo chown -R 用戶名 ./usr，比如我的當前用戶名稱為h

ZooKeeper：win7上安裝單機及偽分布式安裝

efi nio 調度 oracle set inf arch mit amd 　　zookeeper是一個為分布式應用所設計的分布式的、開源的調度服務，它主要用來解決分布式應用中經常遇到的一些數據管理問題，簡化分布式應用，協調及其管理的難度，提高性能的分布式服務。　　本

zookeeper 偽分布式安裝

jre gradle apache cde .sh org 不同的 exceptio zookeep 1 下載zookeeper安裝包下載地址 http://apache.fayea.com/zookeeper/ 我下載的是zookeeper-3.4.6.t

HBase - 偽分布式安裝過程

解壓 iba 服務器列表 true rop 添加內容 .bashrc html start 環境　　- hadoop 　　- 沒有zookeeper（用hbase自帶的zookeeper，當然後期我會改用獨立的zookeeper） HBase介紹　　參考：hbase是什

【Hadoop】在Ubuntu系統下安裝Hadoop單機/偽分布式安裝

multi .cn 編輯器重新偽分布式 sources edit 信息情況 Ubuntu 14.10 前方有坑：由於之前的分布式系統電腦帶不動，所以想換一個偽分布式試一試。用的是Virtualbox + Ubuntu 14.10 。結果遇到了 apt-get 源無

Mac Hadoop2.6（CDH5.9.2）偽分布式集群安裝

home address oca tno 操作系統 fault locate java contents 操作系統： MAC OS X 一、準備 1、 JDK 1.8 　　下載地址：http://www.oracle.com/technetwork/java/javase

hadoop2.4.1偽分布式搭建.txt

java hadoop pro sts temp hostname lin 屌絲子網掩碼 1.準備Linux環境 1.0點擊VMware快捷方式，右鍵打開文件所在位置 -> 雙擊vmnetcfg.exe -> VMnet1 host-only -&g

hadoop偽分布式集群搭建與安裝（ubuntu系統）

log 結束實的變量開啟 web 路徑 har ont 1：Vmware虛擬軟件裏面安裝好Ubuntu操作系統之後使用ifconfig命令查看一下ip; 2：使用Xsheel軟件遠程鏈接自己的虛擬機，方便操作。輸入自己ubuntu操作系統的賬號密碼之後就鏈接成

hadoop偽分布式模式下安裝及運行

ram linux .sh gre 卸載 def href sha path 一 . 安裝JDK 查詢目前系統的JDK： rpm -qa|grep jdk. 卸載JDK yum -y remove xx tar -xzvf jdk-7u80-linu

spark2.2.0偽分布式

執行 .sh work export pan exp source p地址全分布式環境：　　hadoop2.6.0 　　jdk1.8 　　ubuntu 14.04 64位 1 安裝scala環境版本是scala-2.10.6，官網下載地址http://www.sca

Hadoop初體驗：快速搭建Hadoop偽分布式環境

hadoop 偽分布式大數據 0.前言本文旨在使用一個全新安裝好的Linux系統從0開始進行Hadoop偽分布式環境的搭建，以達到快速搭建的目的，從而體驗Hadoop的魅力所在，為後面的繼續學習提供基礎環境。對使用的系統環境作如下說明：操作系統：CentOS 6.5 64位主機I

Ubuntu16.04 install Hadoop 偽分布式

修改 ica hdfs stop 輸入密碼退出 ati 如果 per 1.安裝SSH server、配置SSH無密碼登陸Ubuntu默認安裝了SSH client，還需要安裝SSH server。sudo apt-get install openssh-server設置S

Hadoop簡介與偽分布式搭建—DAY01

fig 初始化 resolve 子網掩碼產生安裝包 ifcfg 指定 property 一、 Hadoop的一些相關概念及思想 1、hadoop的核心組成：（1）hdfs分布式文件系統（2）mapreduce 分布式批處理運算框架（3）yarn 分布式

Hadoop（二）搭建偽分布式集群

tro check -- conf XML 可能 ado dem daemon 前言　　前面只是大概介紹了一下Hadoop，現在就開始搭建集群了。我們下嘗試一下搭建一個最簡單的集群。之後為什麽要這樣搭建會慢慢的分享，先要看一下效果吧！一、Hadoop的三種運行模式（

ZooKeeper偽分布式集群部署

cti 般的客戶端分布末尾安裝例子安裝目錄 bin 本文為Zookeeper偽分布式環境的部署，機器環境Wie 　　1、Centos 6.8 　　2、JDK為1.8.0_121 3、zookeeper版本為3.4.9 一、zookeepe

hadoop偽分布式部署

hadoop偽分布式========一.hadoop偽分布式========= <code> 偽分布式環境配置需要安裝openjdk 和openjdk-devel軟件包（用的是1.8.0版本） rpm -ql Java-openjdk-devel-1.8.0 | grep ‘/bin/javac

CDH版本hadoop2.6偽分布式安裝

1、基礎環境配置

1.1、關閉防火墻和SELinux

1.1.1、關閉防火墻

1.1.2、關閉SELinux

1.2、hosts配置

1.3、配置無密碼訪問

1.4、Java環境配置

1.4.1、下載JDK

1.4.2、安裝java

2、安裝hadoop

2.1、下載安裝CDH版本的hadoop

2.2、安裝配置hadoop

2.2.1、配置core-site.xml

2.2.2、配置hdfs-site.xml

2.2.3、配置mapred-site.xml

2.2.4、配置yarn-site.xml

2.2.5、配置slaves

2.2.6、配置hadoop-env

2.2.7、配置yarn-env

2.2.8、配置mapred-env

2.2.9、配置HADOOP_PREFIX

3、啟動hadoop偽分布式

3.1、啟動hdfs

3.2、啟動yarn

3.3、啟動集群

4、hdfs的shell操作和Wordcount演示

4.1、簡單的hdfs shell操作

4.2、Wordcount

5、參考資料

相關推薦