Hadoop2.6.3版本叢集搭建

阿新 • • 發佈：2019-01-30

一、環境說明

1.機器：三臺虛擬機器

2.Linux版本

cat /proc/version

Linux version 3.19.0-25-generic ([email protected]) (gcc version 4.8.2 (Ubuntu 4.8.2-19ubuntu1) ) #26~14.04.1-Ubuntu SMP

3.jdk版本

java -version

java version “1.8.0_65”
Java(TM) SE Runtime Environment (build 1.8.0_65-b17)
Java HotSpot(TM) 64-Bit Server VM (build 25.65-b01, mixed mode)

4.叢集節點:一個masters，兩個slave

二、準備工作

1.安裝jdk：http://blog.csdn.net/u014706843/article/details/50442329
2.ssh免密碼驗證：http://blog.csdn.net/u014706843/article/details/50442533
3 建立hadoop執行帳號
即為hadoop叢集專門設定一個使用者組及使用者，這部分比較簡單，參考示例如下：
sudo groupadd hadoop //設定hadoop使用者組
sudo useradd –s /bin/bash –d /home/xx–m xx–g hadoop –G root//新增一個xx使用者，此使用者屬於hadoop使用者組，且具有root許可權。
sudo passwd xx//設定使用者xx登入密碼
su xx//切換到zhm使用者中
上述3個虛機結點均需要進行以上步驟來完成hadoop執行帳號的建立。

三、安裝Hadoop

tar -xzvf hadoop-2.6.3.tar.gz

3、修改檔名字

 mv hadoop-2.6.3 hadoop

4、配置hosts檔案

vi /etc/hosts

大家可以參考自己的IP地址以及相應的主機名完成配置,我的如下圖

這裡寫圖片描述
5、修改配置檔案
主要涉及的配置檔案有7個：都在/hadoop/etc/hadoop資料夾下，可以用gedit命令對其進行編輯。如果沒有安裝gedit的話，可以使用vi命令，我使用的是vi命令。

xx@master:~$ sudo cd hadoop/etc/hadoop

5.1、配置 hadoop-env.sh檔案–>修改JAVA_HOME

xx@master:~$ sudo vi hadoop-env.sh

#The java implementation to use.

export JAVA_HOME=/home/xx/user/java/jdk1.8.0_65
5.2、配置 yarn-env.sh 檔案–>>修改JAVA_HOME

xx@master:~$ sudo vi yarn-env.sh

檔案裡面新增內容

# some Java parameters

export JAVA_HOME=/home/xx/user/java/jdk1.8.0_65
5.3、配置slaves檔案–>>增加slave節點

xx@master:~$ vi slave

新增主機名，我的slave節點名稱是node1，node2
5.4配置 core-site.xml檔案–>>增加hadoop核心配置（hdfs檔案埠是9000、file:/home/xx/hadoop-/tmp/）

xx@master:~$ vi core-site.xml

檔案內容如下：

<name>fs.default.name</name>
<value>hdfs://master:9000</value>
<final>true</final>
</property>
<property>
<name>io.file.buffer.size</name>
<value>131072</value>
</property>
<property>
<name>hadoop.tmp.dir</name>
<value>/home/xx/hadoop/tmp</value>
<description>A base for other temporary directories</description>
</property>
<property>
<name>hadoop.proxyuser.spark.hosts</name>
<value>*</value>
</property>
<property>
<name>hadoop.proxyuser.spark.groups</name>
<value>*</value>
</property>
</configuration>
-- INSERT --

5.5配置 hdfs-site.xml 檔案–>>增加hdfs配置資訊（namenode、datanode埠和目錄位置）

xx@master:~$ vi hdfs-site.xml

檔案內容如下：

<final>true</final>
</property>
<property>
<name>dfs.namenode.secondary.http-address</name>
<value>master:9001</value>
<final>true<final>
</property>

<property>
<name>dfs.data.dir</name>
<value>/home/xx/hadoop/data</value>
<final>true</final>
</property>
<property>
<name>dfs.replication</name>
<value>2</value>
<final>true</final>
</property>
<property>
<name>dfs.webhdfs.enabled</name>
<value>true</value>
</property>
</configuration>

5.6配置 mapred-site.xml 檔案–>>增加mapreduce配置（使用yarn框架、jobhistory使用地址以及web地址）

xx@master:~$ vi mapred-site.xml

檔案內容如下：

<configuration>
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
<final>true</final>
</property>
<property>
<name>mapreduce.jobhistory.adress</name>
<value>master:10020</value>
<final>true</final>
</property>
<property>
<name>mapreduce.jobhistory.webapp.address</name>
<value>master:19888</value>
<final>true</final>
</property>
</configuration>

5.7配置 yarn-site.xml 檔案–>>增加yarn功能

xx@master:~$ vi yarn-site.xml

檔案內容如下：

<configuration>

<!-- Site specific YARN configuration properties -->

<property>
   <name>yarn.nodemanager.aux-services</name>
   <value>mapreduce_shuffle</value>
   <final>true</final>
  </property>
  <property>
   <name>yarn.nodemanager.auxservices.mapreduce.shuffle.class</name>
   <value>org.apache.hadoop.mapred.ShuffleHandler</value>
   <final>true</final>
  </property>
  <property>
   <name>yarn.resourcemanager.address</name>
   <value>master:8032</value>
  </property>
  <property>
   <name>yarn.resourcemanager.scheduler.address</name>
   <value>master:8030</value>
  </property>
  <property>
   <name>yarn.resourcemanager.resource-tracker.address</name>
   <value>master:8035</value>
  </property>
  <property>
   <name>yarn.resourcemanager.admin.address</name>
   <value>master:8033</value>
  </property>
  <property>
   <name>yarn.resourcemanager.webapp.address</name>
   <value>master:8088</value>
  </property>
</configuration>

5.8將配置好的hadoop檔案copy到另一臺slave機器上

xx@master:~$ scp -r ./hadoop node1:~

到節點node1和node2上面檢視，看到Hadoop檔案目錄已經複製過去，這樣slave節點node1，node2已經安裝好了Hadoop-2.6.3。

四、驗證

1、格式化namenode:

xx@master:~/hadoop$ ./bin/hdfs namenode -format

出現以下資訊就是格式化成功：

 INFO common.Storage: Storage directory /home/xx/hadoop/name has been successfully formatted.

2、啟動hdfs:

xx@master:~/hadoop$ ./sbin/start-dfs.sh

啟動內容如下：

Starting namenodes on [master]
master: starting namenode, logging to /home/xx/hadoop/logs/hadoop-xx-namenode-master.out
node1: starting datanode, logging to /home/xx/hadoop/logs/hadoop-xx-datanode-node1.out
node2: starting datanode, logging to /home/xx/hadoop/logs/hadoop-xx-datanode-node2.out
Starting secondary namenodes [master]
master: starting secondarynamenode, logging to /home/xx/hadoop/logs/hadoop-xx-secondarynamenode-master.out
[email protected]:~/hadoop/sbin$ jps
4042 Jps
3612 NameNode
3871 SecondaryNameNode

在slave節點node1，node2上面會有datanode的程序，如果沒有就是沒有啟動成功。有時候會手誤，導致配置檔案少了節點或者少了‘/’等符號，master節點就會報錯，修改完master節點的檔案之後，要記得slave節點上面也要修改，不然你在master節點上看不到詳細錯誤資訊。
3、停止hdfs

xx@master:~/hadoop/sbin$ ./stop-dfs.sh

停止內容如下：

Stopping namenodes on [master]
master: stopping namenode
node2: stopping datanode
node1: stopping datanode
Stopping secondary namenodes [master]
master: stopping secondarynamenode
xx@master:~/hadoop/sbin$ jps
6632 Jps

4、啟動yarn:

xx@master:~/hadoop/sbin$ ./start-yarn.sh

啟動內容如下：

starting yarn daemons
starting resourcemanager, logging to /home/xx/hadoop/logs/yarn-xx-resourcemanager-master.out
node2: starting nodemanager, logging to /home/xx/hadoop/logs/yarn-xx-nodemanager-node2.out
node1: starting nodemanager, logging to /home/xx/hadoop/logs/yarn-xx-nodemanager-node1.out
[email protected]:~/hadoop/sbin$ jps
7412 Jps
7135 ResourceManager

5、停止yarn:

xx@master:~/hadoop/sbin$ ./stop-yarn.sh

停止過程內容如下：

stopping yarn daemons
stopping resourcemanager
node2: stopping nodemanager
node1: stopping nodemanager
no proxyserver to stop
xx@master:~/hadoop/sbin$ jps
7532 Jps
xx@master:~/hadoop/sbin$

6、檢視叢集狀態：

xx@master:~/hadoop/bin$ ./hdfs dfsadmin -report

Configured Capacity: 245987983360 (229.09 GB)
Present Capacity: 229095870464 (213.36 GB)
DFS Remaining: 229095813120 (213.36 GB)
DFS Used: 57344 (56 KB)
DFS Used%: 0.00%
Under replicated blocks: 0
Blocks with corrupt replicas: 0
Missing blocks: 0

-------------------------------------------------
Live datanodes (2):

Name: 192.168.1.73:50010 (node1)
Hostname: node1
Decommission Status : Normal
Configured Capacity: 194334412800 (180.99 GB)
DFS Used: 28672 (28 KB)
Non DFS Used: 12184432640 (11.35 GB)
DFS Remaining: 182149951488 (169.64 GB)
DFS Used%: 0.00%
DFS Remaining%: 93.73%
Configured Cache Capacity: 0 (0 B)
Cache Used: 0 (0 B)
Cache Remaining: 0 (0 B)
Cache Used%: 100.00%
Cache Remaining%: 0.00%
Xceivers: 1
Last contact: Sun Jan 03 22:15:18 EST 2016


Name: 192.168.1.123:50010 (node2)
Hostname: node2
Decommission Status : Normal
Configured Capacity: 51653570560 (48.11 GB)
DFS Used: 28672 (28 KB)
Non DFS Used: 4707680256 (4.38 GB)
DFS Remaining: 46945861632 (43.72 GB)
DFS Used%: 0.00%
DFS Remaining%: 90.89%
Configured Cache Capacity: 0 (0 B)
Cache Used: 0 (0 B)
Cache Remaining: 0 (0 B)
Cache Used%: 100.00%
Cache Remaining%: 0.00%
Xceivers: 1
Last contact: Sun Jan 03 22:15:17 EST 2016

xx@master:~/hadoop$ mkdir input

9.2、在input建立f1、f2並寫內容

xx@master:~/hadoop$ touch input/f1
xx@master:~/hadoop$ vi ./input/f1
Hello world ，
xx@master:~/hadoop$ touch input/f2
xx@master:~/hadoop$ vi ./input/f2
Hello Hadoop .
xx@master:~/hadoop$

9.3、在hdfs建立/tmp/input目錄

xx@master:~/hadoop$ ./bin/hadoop fs -mkdir /tmp
xx@master:~/hadoop$ ./bin/hadoop fs -mkdir /tmp/input

9.4、將f1、f2檔案copy到hdfs /tmp/input目錄

xx@master:~/hadoop$ ./bin/hadoop fs -put input/ /tmp

9.5、檢視hdfs上是否有f1、f2檔案

xx@master:~/hadoop$ ./bin/hadoop fs -ls /tmp/input
Found 2 items 
-rw-r--r--   2 xx supergroup    14 2016-01-03 22:29/tmp/input/f1
-rw-r--r--   2 xx supergroup    15 2016-01-03 22:29/tmp/input/f2

9.6、執行wordcount程式
注意空格

xx@master:~/hadoop$ ./bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.6.3.jar wordcount /tmp/input /output

執行內容如下：

16/01/03 22:35:03 INFO client.RMProxy: Connecting to ResourceManager at master/192.168.1.72:8032
16/01/03 22:35:04 INFO input.FileInputFormat: Total input paths to process : 2
16/01/03 22:35:04 INFO mapreduce.JobSubmitter: number of splits:2
16/01/03 22:35:05 INFO mapreduce.JobSubmitter: Submitting tokens for job: job_1451877255267_0001
16/01/03 22:35:05 INFO impl.YarnClientImpl: Submitted application application_1451877255267_0001
16/01/03 22:35:05 INFO mapreduce.Job: The url to track the job: http://master:8088/proxy/application_1451877255267_0001/
16/01/03 22:35:05 INFO mapreduce.Job: Running job: job_1451877255267_0001
16/01/03 22:35:16 INFO mapreduce.Job: Job job_1451877255267_0001 running in uber mode : false
16/01/03 22:35:16 INFO mapreduce.Job:  map 0% reduce 0%
16/01/03 22:35:25 INFO mapreduce.Job:  map 100% reduce 0%
16/01/03 22:35:33 INFO mapreduce.Job:  map 100% reduce 100%
16/01/03 22:35:33 INFO mapreduce.Job: Job job_1451877255267_0001 completed successfully

9.7、檢視執行出來的檔名

[email protected]:~/hadoop$ ./bin/hadoop fs -ls /output/
Found 2 items
-rw-r--r--   2 xx supergroup          0 2016-01-03 22:35 /output/_SUCCESS
-rw-r--r--   2 xx supergroup         33 2016-01-03 22:35 /output/part-r-00000

9.8、檢視結果

xx@master:~/hadoop$ ./bin/hadoop fs -cat /output/part-r-00000                   ,       1
.       1
Hadoop  1
Hello   2
world   1

至此，搭建結束！歡迎收藏

Hadoop2.6.3版本叢集搭建

一、環境說明

二、準備工作

三、安裝Hadoop

#The java implementation to use.

# some Java parameters

四、驗證

Hadoop2.6.3版本叢集搭建

Hadoop2.7.3-HA 叢集搭建（傳智播客）

hadoop-2.6.0.tar.gz + spark-1.5.2-bin-hadoop2.6.tgz的叢集搭建（單節點）（Ubuntu系統）

hadoop-2.6.0.tar.gz + spark-1.6.1-bin-hadoop2.6.tgz的叢集搭建（單節點）（CentOS系統）

CentOS7搭建Hadoop2.6完全分散式叢集環境

hadoop-2.6.0-cdh5.4.5.tar.gz(CDH)的3節點叢集搭建(含zookeeper叢集安裝）

hadoop2.8.4+spark2.3.1叢集搭建

Hadoop2.6.0版本號MapReudce演示樣例之WordCount（一）

OSG 3.6.3 版本編譯一些問題

Ubuntu + Hadoop2.7.3偽分佈搭建

CDH 6.0.1 叢集搭建「Process」

CDH 6.0.1 叢集搭建「After install」

3.Zookeeper-叢集搭建

elasticsearch6.3版本linux搭建

美逛app3.6.3版本更新功能十分強大淘客大牛評論：美逛越來越牛逼了

CentOS7部署ElasticSearch 5.2.2 版本叢集搭建

Hadoop2.0高可用叢集搭建

Redis 3.0叢集搭建測試（一）

Redis 3.0叢集搭建測試（二）

redis4.0.2版本叢集搭建

Hadoop2.6.3版本叢集搭建

一、環境說明

二、準備工作

三、安裝Hadoop

#The java implementation to use.

# some Java parameters

四、驗證

相關推薦