最新版hadoop2.7.1單機版與偽分散式安裝配置

阿新 • • 發佈：2019-02-19

前提：熟悉Linux系統操作，掌握基本的Linux命令

注意：安裝路徑中不能有任何中文字元和空格！

我安裝的是ubuntu14，使用者名稱是ubuntu，機器名是ubuntu，hadoop的版本是hadoop-2.7.1.tar.gz

一、在Ubuntu下建立hadoop使用者組和使用者

1、將hadoop使用者新增到系統使用者

ubuntu@ubuntu:~$ sudo addgroup hadoop 
ubuntu@ubuntu:~$ sudo adduser --ingroup hadoop hadoop

2、現在只是添加了一個使用者hadoop，它並不具備管理員許可權，我們給

hadoop使用者新增許可權，開啟/etc/sudoers檔案

ubuntu@ubuntu:~$ sudo vim /etc/sudoers

在root ALL=(ALL:ALL) ALL下新增hadoop ALL=(ALL:ALL) ALL

二、配置Java環境

1、將jdk-7u80-linux-x64.tar.gz解壓到相應路徑(可以用命令也可以直接選中右鍵解壓)，我這裡是解壓到/home/ubuntu/software/java，解壓後文件夾為jdk1.7.0_80(所在路徑為/home/ubuntu/software/java/jdk1.7.0_80)

2、解壓完之後配置環境變數

ubuntu@ubuntu:$ sudo vim /etc/profile

在最後新增如下：

export JAVA_HOME=/home/ubuntu/software/java/jdk1.7.0_80
export JRE_HOME=/home/ubuntu/software/java/jdk1.7.0_80/jre
exportCLASSPATH=.:$CLASSPATH:$JAVA_HOME/lib:$JRE_HOME/lib
exportPATH=$PATH:$JAVA_HOME/bin:$JRE_HOME/bin

執行java -version命令驗證Java是否安裝配置成功。

ubuntu@ubuntu:~$ java -version
java version "1.7.0_80"
Java(TM) SE Runtime Environment (build 1.7.0_80-b15)
Java HotSpot(TM) 64-Bit Server VM (build 24.80-b11, mixed mode)

三、SSH安裝

1、先安裝ssh。記住：從這裡開始需要先從ubuntu使用者切換到hadoop使用者

ubuntu@ubuntu:~$ su - hadoop
Password:
hadoop@ubuntu:~$ sudo apt-get install openssh-server

2、如果ssh安裝完成之後，先啟動服務

hadoop@ubuntu:~$ sudo /etc/init.d/ssh start

啟動後通過命令檢視是否正確啟動

 hadoop@ubuntu:~$ ps -e |grep ssh

3、作為一個安全通訊協議（ssh生成金鑰有rsa和dsa兩種生成方式，預設情況下采用rsa方式），使用時需要密碼，因此我們要設定成免密碼登入，生成私鑰和公鑰：

hadoop@ubuntu:~$ ssh-keygen -t rsa -P ""

（注：回車後會在~/.ssh/下生成兩個檔案：id_rsa和id_rsa.pub這兩個檔案是成對出現的前者為私鑰，後者為公鑰）

進入~/.ssh/目錄下，將公鑰id_rsa.pub追加到authorized_keys授權檔案中，開始是沒有authorized_keys檔案的（authorized_keys 用於儲存所有允許以當前使用者身份登入到ssh客戶端使用者的公鑰內容）：

hadoop@ubuntu:~$ cat ~/.ssh/id_rsa.pub>> ~/.ssh/authorized_keys

執行ssh localhost命令進行登入：

hadoop@ubuntu:~$ ssh localhost
Welcome to Ubuntu 14.04.3 LTS (GNU/Linux 3.19.0-43-generic x86_64)
 
 * Documentation:  https://help.ubuntu.com/
 
18 packages can be updated.
18 updates are security updates.
 
Last login: Thu Jan 21 14:40:38 2016 from localhost

出現“Welcome to Ubuntu 14.04.3 LTS。。。”則表示登入成功。

( 注：當ssh遠端登入到其它機器後，現在你控制的是遠端的機器，需要執行退出命令才能重新控制本地主機。)

使用命令exit可以進行退出

hadoop@ubuntu:~$ exit
logout
Connection to localhost closed.

編輯/etc/hosts檔案，將

127.0.0.1 localhost
127.0.1.1 ubuntu

改為

192.168.1.128 localhost
192.168.1.128 ubuntu

注：192.168.1.128為虛擬機器機的ip地址(用命令ifconfig可以檢視ip)

四、安裝hadoop-2.7.1

1、將hadoop-2.7.gz解壓到/usr/local下面

hadoop@ubuntu:~$ sudo tar –xzf hadoop-2.7.gz

重新命名hadoop-2.7.1資料夾名為hadoop(為了敲命令方便)

hadoop@ubuntu:~$ sudo mv hadoop-2.7.1 hadoop

2、要確保所有的操作都是在使用者hadoop下完成的，所以將該hadoop資料夾的屬主使用者設為hadoop。

hadoop@ubuntu:/usr/local$sudo chown –R hadoop:hadoop hadoop

3、配置hadoop-env.sh檔案(hadoop-env.sh檔案在hadoop/etc/hadoop路徑下面)

hadoop@ubuntu:/usr/local$ sudo vim /usr/local/hadoop/etc/hadoop/hadoop-env.sh

在hadoop-env.sh中export JAVA_HOME後面新增以下資訊(JAVA_HOME路徑改為實際路徑)：

export JAVA_HOME=/home/ubuntu/software/java/jdk1.7.0_80
export HADOOP_INSTALL=/usr/local/hadoop
export PATH=$PATH:/usr/local/hadoop/bin:/usr/local/hadoop/sbin
export HADOOP_MAPRED_HOME=$HADOOP_INSTALL
export HADOOP_COMMON_HOME=$HADOOP_INSTALL
export YARN_HOME=$HADOOP_INSTALL

儲存之後執行下面命令使配置生效

 hadoop@ubuntu:/usr/local/hadoop/etc/hadoop$source hadoop-env.sh

再到/etc/profile中新增HADOOP_INSTALL並修改PATH，結果為

export JAVA_HOME=/home/ubuntu/software/java/jdk1.7.0_80
export JRE_HOME=/home/ubuntu/software/java/jdk1.7.0_80/jre
export HADOOP_INSTALL=/usr/local/hadoop
export CLASSPATH=.:$CLASSPATH:$JAVA_HOME/lib:$JRE_HOME/lib
exportPATH=$PATH:$JAVA_HOME/bin:$JRE_HOME/bin:$HADOOP_INSTALL/bin:$HADOOP_INSTALL/sbin

儲存後重啟虛擬機器。

切換到hadoop使用者，

執行命令

hadoop@ubuntu:/usr/local/hadoop$ hadoop version

如果看到如下hadoop版本資訊則表示hadoop單機模式安裝成功

hadoop@ubuntu:/usr/local/hadoop$ hadoop version
Hadoop 2.7.1
Subversion https://git-wip-us.apache.org/repos/asf/hadoop.git -r15ecc87ccf4a0228f35af08fc56de536e6ce657a
Compiled by jenkins on 2015-06-29T06:04Z
Compiled with protoc 2.5.0
From source with checksum fc0a1a23fc1868e4d5ee7fa2b28a58a
This command was run using/usr/local/hadoop/share/hadoop/common/hadoop-common-2.7.1.jar

現在執行一下hadoop自帶的例子wordcount來感受以下MapReduce過程：
在hadoop目錄下新建input資料夾

hadoop@ubuntu:/usr/local/hadoop$ sudo mkdir input

將etc中的所有檔案拷貝到input資料夾中

hadoop@ubuntu:/usr/local/hadoop$ cp etc/*input

執行wordcount程式，並將結果儲存到output中(注意input所在路徑、jar所在路徑)

hadoop@ubuntu:/usr/local/hadoop/share/hadoop/mapreduce$bin/hadoop jar hadoop-mapreduce-examples-2.7.1.jarwordcount /usr/local/hadoop/input/hadoop output

執行

hadoop@ubuntu:/usr/local/hadoop$ cat output/*

會看到conf所有檔案的單詞和頻數都被統計出來。

到此單機模式已經安裝成功，下面可以接著偽分佈模式安裝

一、在/etc/hadoop下配置一下幾個檔案core-site.xml、hdfs-site.xml、mapred-site.xml、yarn-site.xml
在後面新增如下資訊

core-site.xml

<configuration>
<property>
       <name>hadoop.tmp.dir</name>
       <value>file:/usr/local/hadoop/tmp</value>
       <description>Abase for other temporarydirectories.</description>
</property>
<property> 
       <name>fs.defaultFS</name> 
       <value>hdfs://192.168.154.128:9000</value> 
</property> 
</configuration>

hdfs-site.xml

<configuration>
   <property> 
       <name>dfs.replication</name> 
       <value>1</value> 
   </property> 
   <property> 
       <name>dfs.namenode.name.dir</name> 
       <value>file:/usr/local/hadoop/tmp/dfs/name</value> 
   </property> 
   <property> 
       <name>dfs.datanode.data.dir</name> 
       <value>file:/usr/local/hadoop/tmp/dfs/data</value> 
   </property>
</configuration>

mapred-site.xml(沒有則複製一份mapred-site.xml.template並命名為mapred-site.xml)

<configuration>
<property>   
       <name>mapreduce.framework.name</name> 
       <value>yarn</value>    
</property>
</configuration>

yarn-site.xml

<configuration>
<property>
       <name>yarn.nodemanager.aux-services</name>
       <value>mapreduce_shuffle</value>
</property>
<property>
       <name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>
       <value>org.apache.hadoop.mapred.ShuffleHandler</value>
</property>
</configuration>

二、HDFS檔案系統格式化和系統啟動

下面進行HDFS檔案系統進行格式化：

 $bin/hdfs namenode -format

然後啟用NameNode及DataNode程序：

hadoop@ubuntu:/usr/local/hadoop$ sbin/start-dfs.sh

hadoop@ubuntu:/usr/local/hadoop$ sbin/start-yarn.sh

啟動程序之後用jps命令檢視程序情況，出現6個程序名字說明啟動成功

8431 JobTracker  
8684 TaskTracker  
7821 NameNode  
7281 DataNode
8915 Jps  
8341 SecondaryNameNode

至此，hadoop偽分散式安裝成功。

hadoop2.7.5單機版安裝及wordCount執行

hadoop2.7.5單機版安裝簡介 Hadoop主要完成兩件事，分散式儲存和分散式計算。 Hadoop主要由兩個核心部分組成： 1.HDFS：分散式檔案系統，用來儲存海量資料。 2.MapReduce：並行處理框架，實現任務分解和排程。 HDFS 是一個分散

mahout最新版+hadoop2.4.1執行kmeans分散式演算法

1、理論須知用過mahout和hadoop整合的朋友們，都經過很多折騰，mahout這個東西是包括了好多的機器學習演算法，確實我們呼叫起來相當方便，畢竟我們不需要為了使用一個演算法重新編碼。但是mahout0.10之前都只能支援到hadoop1.x版本，所以大部分使用ha

【HBase基礎教程】1、HBase之單機模式與偽分散式模式安裝

在這篇blog中，我們將介紹Hbase的單機模式安裝與偽分散式的安裝方式，以及通過瀏覽器檢視Hbase的使用者介面。搭建hbase偽分散式環境的前提是我們已經搭建好了hadoop完全分散式環境，搭建hadoop環境請參考：【Hadoop基礎教程】4、Hadoop

linux搭建單機版和偽分散式hadoop

前提:我使用的window作業系統，然後下載的VMware建立虛擬機器，然後在xshell中進行操作，並使用filezilla進行檔案的上傳。這些可以自行百度搜索下載。單機版hadoop環境搭建首先我們用VMware建立一個新的虛擬機器。建立過程不在細說了。建立完成後，user

hadoop單機版和偽分散式搭建

單機版：使用的是linux上的檔案系統，用於測試使用過程：解壓到 /usr/local/ 配置/etc/profile下的環境變數 source /etc/profile ,然後修改 /usr/local/etc/hadoop/hadoop-env.sh 中的JAVA_HOME為jd

ubuntu16+Hadoop2.7.3環境搭建（偽分散式）

Hadoop 環境的搭建一、安裝VMWare 虛擬機器虛擬機器版本VMware12，考慮到啟動速度，裝在固態硬碟中。二、安裝Linux 安裝版本：ubuntu-16.04.1-server-amd64 此版本沒有圖形化介面，體積較小

Centos下Spark單機版（python）安裝配置

如果上面都成功了，那說明我們就基本安裝成功了，可以用scala或者python來開發相關程式了。但是如果我們希望能夠在一個很清新的IDE中開發程式怎麼辦？那麼這裡強烈推薦一款互動式的開發工具-jupyter notebook。接下來我們就來配置該工具，以保證能連線上sprak。

Zookeeper的單機模式與偽分散式模式的搭建

一、Zookeeper的搭建方式 Zookeeper安裝方式有三種，單機模式和叢集模式以及偽叢集模式。 1.單機模式：Zookeeper只執行在一臺伺服器上，適合測試環境； 2.偽叢集模式：就是在一臺物理機上執行多個Zookeeper 例項。 3.叢集模式：Zoo

Hadoop 2.7 偽分散式安裝配置 Error: JAVA_HOME is not set and could not be found.

問題：如果你明明安裝配置了 JAVA_HOME 卻還是報錯如果遇到 Error: JAVA_HOME is not set and could not be found. 的錯誤，而你明

Spark2.0.1偽分散式安裝配置

前言.Spark簡介和hadoop的區別 Spark 是一種與 Hadoop 相似的開源叢集計算環境，但是兩者之間還存在一些不同之處，Spark 啟用了記憶體分佈資料集，除了能夠提供互動式查詢外，它還可以優化迭代工作負載。 1.架構不同。 Hadoop是對

HBase單機/偽分散式安裝/配置筆記

一、單機模式安裝在官網下載hbase 解壓到任一目錄下修改hbase配置檔案修改conf目錄下hbase-env.sh：設定JAVA_HOME環境變數修改conf目錄下hbase-

Linux下Hadoop2.7.1集群環境的搭建（超詳細版）

目錄 hdfs cp命令 manage war 替代 share logs hadoop 本文旨在提供最基本的，可以用於在生產環境進行Hadoop、HDFS分布式環境的搭建，對自己是個總結和整理，也能方便新人學習使用。一、基礎環境在Linux上安裝Hadoop之前

01_PC單機Spark開發環境搭建_JDK1.8+Spark2.3.1+Hadoop2.7.1

tor 環境 eve exe ring row test source 分享圖片本文檔基於Windows搭建本地JAVA Spark開發環境。 1 JDK 1.8安裝官網下載JDK。註意JDK安裝目錄不可以包含空格，比如：C:\Java\jdk1.8.

Linux下Hadoop2.7.1叢集環境的搭建（超詳細版）

1 <?xml version="1.0"?> 2 <!-- 3 Licensed under the Apache License, Version 2.0 (the "License"); 4 you may not use this file except in c

【原創 Hadoop&Spark 動手實踐 3】Hadoop2.7.3 MapReduce理論與動手實踐

pack license 讀取 rgs 理論程序員開發 -s 接口 pri 開始聊MapReduce，MapReduce是Hadoop的計算框架，我學Hadoop是從Hive開始入手，再到hdfs，當我學習hdfs時候，就感覺到hdfs和mapreduce關系的緊密。這個

ourphp 最新版(v1.7.3) 後臺sql註入

http dmi client app conf agen 9.png 系統 sql語句 version:<?php /*************************************************************************

ArcGIS Enterprise 10.5.1 靜默安裝部署記錄（Centos 7.2 minimal版）- 2、安裝Portal for ArcGIS

-a 切換 https stop user 安裝執行 limits 方式安裝Portal for ArcGIS 解壓portal安裝包，tar -xzvf Portal_for_ArcGIS_Linux_1051_156440.tar.gz 切換到arcgis賬戶靜

ArcGIS Enterprise 10.5.1 靜默安裝部署記錄（Centos 7.2 minimal版）- 3、安裝 ArcGIS for Server

切換驗證裝包 start dap sof 訪問權限 tar 服務安裝ArcGIS for Server 解壓server安裝包，tar -xzvf ArcGIS_Server_Linux_1051_156429.tar.gz 切換到arcgis賬戶靜默安裝serv

記工作中在Red Hat 7.1企業版安裝Oracle數據庫歷程

hat entos 機會 oracle 數據庫賬號 post 安裝oracle red hat 7 最近公司在搞系統服務器整合，我負責的MES數據庫需要從原有服務器器遷移到新服務器上，問硬件組的同事要了IP 、賬號、密碼，開始安裝oracle數據庫。在以前的工作中，很少