hadoop 完全分散式安裝

阿新 • • 發佈：2018-12-13

一個完全的hadoop分散式安裝至少需要3個zookeeper，3個journalnode，3個datanode，2個namenode組成。

也就是說需要11個節點，但是我雲主機有限，只有3個，所以把很多節點搭在了同一個伺服器上。

步驟：

1.關閉防火牆

service iptables stop

2.修改主機名

vim /etc/sysconfig/network

三臺主機都需要修改

HOSTNAME=hadoop01 # 第一臺

HOSTNAME=hadoop02 # 第二臺

HOSTNAME=hadoop03 # 第三臺

例如：

3.修改hosts檔案進行對映

vim /etc/hosts

三臺主機都要修改

10.42.127.183   hadoop01
10.42.8.245     hadoop02
10.42.62.96     hadoop03

例如：

4.免密登入

產生祕鑰：ssh-keygen

進行復制：ssh-copy-id 使用者名稱@主機

第一臺主機操作示例：

ssh-keygen

回車

ssh-copy-id [email protected]10.42.127.183

ssh-copy-id [email protected]10.42.8.245

ssh-copy-id [email protected]10.42.62.96

其餘兩臺進行相同操作。

5.重啟三臺伺服器

reboot

6.安裝jdk

7.安裝zookeeper

安裝zookeeper過程

8.啟動zookeeper

9.安裝hadoop

（1）編輯 hadoop-env.sh，並且重新生效

vim hadoop-env.sh

export JAVA_HOME=/home/presoftware/jdk1.8
export HADOOP_CONF_DIR=/home/software/hadoop-2.7.1/etc/hadoop

（2）編輯 core-site.xml

vim core-site.xml

    <!--指定hdfs的nameservice，為整個叢集起一個別名-->
    <property>
        <name>fs.defaultFS</name>        
        <value>hdfs://ns</value>
    </property>
    <!--指定Hadoop資料臨時存放目錄-->
    <property>
        <name>hadoop.tmp.dir</name>
        <value>/home/software/hadoop-2.7.1/tmp</value>
    </property>
    <!--指定zookeeper的存放地址-->
    <property>
        <name>ha.zookeeper.quorum</name>
        <value>hadoop01:2181,hadoop02:2181,hadoop03:2181</value>
    </property>

（3）編輯 hdfs-site.xml

vim hdfs-site.xml

    <!--執行hdfs的nameservice為ns，注意要和core-site.xml中的名稱保持一致-->
    <property>
        <name>dfs.nameservices</name>
        <value>ns</value>
    </property>
    <!--ns叢集下有兩個namenode，分別為nn1, nn2-->
    <property>
        <name>dfs.ha.namenodes.ns</name>
        <value>nn1,nn2</value>
    </property>
    <!--nn1的RPC通訊-->
    <property>
        <name>dfs.namenode.rpc-address.ns.nn1</name>
        <value>hadoop01:9000</value>
    </property>
    <!--nn1的http通訊-->
    <property>
        <name>dfs.namenode.http-address.ns.nn1</name>
        <value>hadoop01:50070</value>
    </property>
    <!-- nn2的RPC通訊地址 -->
    <property>
        <name>dfs.namenode.rpc-address.ns.nn2</name>
        <value>hadoop02:9000</value>
    </property>
    <!-- nn2的http通訊地址 -->
    <property>
        <name>dfs.namenode.http-address.ns.nn2</name>
        <value>hadoop02:50070</value>
    </property>
    <!--指定namenode的元資料在JournalNode上存放的位置，這樣，namenode2可以從journalnode集
    群裡的指定位置上獲取資訊，達到熱備效果-->
    <property>
        <name>dfs.namenode.shared.edits.dir</name>
        <value>qjournal://hadoop01:8485;hadoop02:8485;hadoop03:8485/ns</value>
    </property>
    <!-- 指定JournalNode在本地磁碟存放資料的位置 -->
    <property>
        <name>dfs.journalnode.edits.dir</name>
        <value>/home/software/hadoop-2.7.1/tmp/journal</value>
    </property>
    <!-- 開啟NameNode故障時自動切換 -->
    <property>
        <name>dfs.ha.automatic-failover.enabled</name>
        <value>true</value>
    </property>
    <!-- 配置失敗自動切換實現方式 -->
    <property>
        <name>dfs.client.failover.proxy.provider.ns</name>
        <value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>
    </property>
    <!-- 配置隔離機制 -->
    <property>
        <name>dfs.ha.fencing.methods</name>
        <value>sshfence</value>
    </property>
    <!-- 使用隔離機制時需要ssh免登陸 -->
    <property>
        <name>dfs.ha.fencing.ssh.private-key-files</name>
        <value>/root/.ssh/id_rsa</value>
    </property>
    <!--配置namenode存放元資料的目錄，可以不配置，如果不配置則預設放到hadoop.tmp.dir下-->
    <property>  
        <name>dfs.namenode.name.dir</name>  
        <value>file:///home/software/hadoop-2.7.1/tmp/hdfs/name</value>  
    </property>  
    <!--配置datanode存放元資料的目錄，可以不配置，如果不配置則預設放到hadoop.tmp.dir下-->
    <property>  
        <name>dfs.datanode.data.dir</name>  
        <value>file:///home/software/hadoop-2.7.1/tmp/hdfs/data</value>  
    </property>
    <!--配置複本數量-->  
    <property>  
        <name>dfs.replication</name>  
        <value>3</value>  
    </property> 
    <!--設定使用者的操作許可權，false表示關閉許可權驗證，任何使用者都可以操作-->          
                           
    <property>  
        <name>dfs.permissions</name>  
        <value>false</value>  
    </property>

（4）編輯 mapred-site.xml

vim mapred-site.xml

　　<property>  
    　　<name>mapreduce.framework.name</name>  
    　　<value>yarn</value>  
　　</property>

（5）編輯 yarn-site.xml

vim yarn-site.xml

    <!--配置yarn的高可用-->
    <property>
        <name>yarn.resourcemanager.ha.enabled</name>
        <value>true</value>
    </property>
    <!--指定兩個resourcemaneger的名稱-->
    <property>
        <name>yarn.resourcemanager.ha.rm-ids</name>
        <value>rm1,rm2</value>
    </property>
    <!--配置rm1的主機-->
    <property>
        <name>yarn.resourcemanager.hostname.rm1</name>
        <value>hadoop01</value>
    </property>
    <!--配置rm2的主機-->
    <property>
        <name>yarn.resourcemanager.hostname.rm2</name>
        <value>hadoop03</value>
    </property>
    <!--開啟yarn恢復機制-->
    <property>
        <name>yarn.resourcemanager.recovery.enabled</name>
        <value>true</value>
    </property>
    <!--執行rm恢復機制實現類-->
    <property>
        <name>yarn.resourcemanager.store.class</name>
        <value>org.apache.hadoop.yarn.server.resourcemanager.recovery.ZKRMStateStore</value>
    </property>
    <!--配置zookeeper的地址-->
    <property>
        <name>yarn.resourcemanager.zk-address</name>
        <value>hadoop01:2181,hadoop02:2181,hadoop03:2181</value>
    </property>
    <!--執行yarn叢集的別名-->
    <property>
        <name>yarn.resourcemanager.cluster-id</name>
        <value>ns-yarn</value>
    </property>
    <!-- 指定nodemanager啟動時載入server的方式為shuffle server -->
    <property>  
        <name>yarn.nodemanager.aux-services</name>  
        <value>mapreduce_shuffle</value>  
    </property> 
    <!-- 指定resourcemanager地址 -->
    <property>
        <name>yarn.resourcemanager.hostname</name>
        <value>hadoop03</value>
    </property>

（6）編輯 slaves

vim slaves

hadoop01
hadoop02
hadoop03

（7）配置環境變數

vim /etc/profile

export HADOOP_HOME=/home/software/hadoop-2.7.1
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

（8）將hadoop拷貝到另外兩個主機

scp -r hadoop-2.7.1 hadoop02:/home/software/

scp -r hadoop-2.7.1 hadoop03:/home/software/

（9）配置另外兩個主機的環境變數

export HADOOP_HOME=/home/software/hadoop-2.7.1
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

10.在任意一個節點上進行Zookeeper格式化註冊

hdfs zkfc -formatZK

11.建立指定的目錄

cd hadoop-2.7.1/

mkdir tmp

cd tmp

mkdir journal

mkdir hdfs

cd hdfs/

mkdir data

mkdir name

12.在三臺節點上分別啟動journalnode

hadoop-daemon.sh start journalnode

13.格式化第一個節點

hadoop namenode -format

14.啟動第一個節點的namenode

hadoop-daemon.sh start namenode

15.格式化第二個節點上的namenode

hdfs namenode -bootstrapStandby

16.啟動第二個點的namenode

hadoop-daemon.sh start namenode

17.在三個節點上分別啟動datanode

hadoop-daemon.sh start datanode

18.在第一個節點和第二個節點上啟動zkfc實現狀態的切換

hadoop-daemon.sh start zkfc

19.在第一個節點上啟動yarn

start-yarn.sh

20.在第三個節點上啟動resourcemanager

yarn-daemon.sh start resourcemanager

21.瀏覽器訪問

第一個伺服器：http://10.42.127.183:50070

第二個伺服器：http://10.42.8.245:50070

出現上圖所示即為成功。

Hadoop完全分散式安裝Hive

編譯安裝 Hive 如果需要直接安裝 Hive，可以跳過編譯步驟，從 Hive 的官網下載編譯好的安裝包，下載地址為http://hive.apache.org/downloads.html。 Hive的環境配置需要MySQL的支援，所以首先需要安裝MySQL，

Hadoop完全分散式安裝zookeeper

D.1安裝 ZooKeeper D.1.1 下載 ZooKeeper ZooKeeper 是 Apache 基金會的一個開源、分散式應用程式協調服務，是 Google 的 Chubby一個開源的實現。它是一個為分散式應用提供一致性服務的軟體，提供的功能包括配置維護、域名服務、分散式同步、

Hadoop完全分散式安裝2

hadoop簡介： 1.獨立模式(standalone|local)單機模式；所有的產品都安裝在一臺機器上且本地磁碟和副本可以在接下來的xml檔案中 nothing! &

hadoop 完全分散式安裝

一個完全的hadoop分散式安裝至少需要3個zookeeper，3個journalnode，3個datanode，2個namenode組成。也就是說需要11個節點，但是我雲主機有限，只有3個，所以把很多節點搭在了同一個伺服器上。步驟： 1.關閉防火牆 service

Hadoop完全分散式安裝教程

最近開始學習大資料課程，便開始自己安裝搭建完全分散式，下面是自己一步一步的安裝方式，期間會遇到各種問題，但還是自己查詢資料解決了：1.在安裝hadoop2.0之前，需要準備好以下軟體（如下圖1）圖1：然後將這兩個軟體共享到centos上（如下圖2，圖3所示）在vm這上面有個

【hadoop】hadoop完全分散式叢集安裝

文章目錄前言裝備 Core 總結前言後面準備更新hdfs操作（shell命令版本），hbase，hive的操作。所以這裡先更新一下hadoop叢集安裝。裝備 1.hadoop-2.6.5.tar.gz

（超詳細）從零開始安裝與配置hadoop完全分散式環境

強調！！！使用者名稱稱要相同，否則可能出現稀奇古怪的錯誤！！！（我就因為這個問題，在後面快裝完的時候不得不從頭再來）原因：Hadoop要求所有機器上Hadoop的部署目錄結構要求相同（因為在啟動時按與主節點相同的目錄啟動其它任務節點），並且都有一

Hadoop+HBase完全分散式安裝

記錄下完全分散式HBase資料庫安裝步驟準備3臺機器：10.202.7.191 / 10.202.7.139 / 10.202.9.89 所需準備的Jar包： 1.JDK安裝一般Linux的發行版本有預裝openjdk，這裡安裝標準sun公司的jdk。 1.1檢視當前機器安裝的jdk rp

基於hadoop-2.6.0的hbase完全分散式安裝

1.安裝環境：有一個完全分散式的hadoop-2.6.0。 2.安裝準備：需要在網上下一個hbase的壓縮包，我這兒用的是hbase-1.0.3-bin.tar.gz，下載地址here 3.解壓下載好的hbase到一個目錄下,並更改使用者及使用者組（我這兒用

Hadoop完全分散式用MapReduce實現自定義排序、分割槽和分組

經過前面一段時間的學習，簡單的單詞統計已經不能實現更多的需求，就連自帶的一些函式方法等也是跟不上節奏了；加上前面一篇MapReduce的底層執行步驟的瞭解，今天學習自定義的排序、分組、分割槽相對也特別容易。認為不好理解，先參考一下前面的一篇：https://bl

ubantu 16.4 Hadoop 完全分散式搭建

一個虛擬機器　　1.以 NAT網絡卡模式裝載虛擬機器　　2.最好將幾個用到的虛擬機器修改主機名，靜態IP /etc/network/interface，這裡是 s101 s102 s103 三

Hadoop完全分散式配置問題

關於搭建Hadoop完全分散式時配置的問題配置hadoop的配置檔案core-site.xml, hdfs-site.xml， mapred-site.xml，yarn-site.xml，slaves（workers）（都在Hadoop安裝目錄/etc/hadoop資料夾下） 1、co

hadoop完全分散式遇到的問題總結

第一步、確保你的jdk、hadoop、SSH免密已經配置好了，開啟2臺以上的虛擬機器，並且能正常上網（後面放大招啦）第二部、配置/etc/hosts檔案(如下格式) 192.168.244.128 hadoop02 192.168.244.129 hadoop0

安裝HBase--單節點、偽分散式、完全分散式安裝

1.下載HBase 連結：http://mirrors.cnnic.cn/apache/hbase/ 選擇 stable 目錄，下載 bin 檔案：在Linux上解壓，部落格中解壓在/home/hadoop 目錄下：進入解壓目錄： 2.修改配置修改JD

VMware上部署Hadoop完全分散式&spark

相信大多數初學者和我一樣，對配置環境頭疼的一批；我在這裡簡單介紹一下hadoop基於虛擬機器的完全分散式部署； 1 首先說一下我的電腦配置吧： win10作業系統；8g記憶體；i5六代處理器；配置越高越好吧（要不然容易卡頓）； Ubuntu 16.04(這個映象大家可以去網上下

史上最簡單詳細的Hadoop完全分散式叢集搭建

一.安裝虛擬機器環境 Vmware12中文官方版連結：https://pan.baidu.com/s/1IGKVfaOtcFMFXNLHUQp41w 提取碼：6rep 啟用祕鑰：MA491-6NL5Q-AZAM0-ZH0N2-AAJ5A 這個安裝就十分的簡單了，只需要不斷點選下

Hadoop完全分散式搭建步驟

請在搭建偽分散式的基礎上搭建完全分散式 1、克隆兩臺虛擬機器(點選藍色超連結有如何克隆虛擬機器)。 2、克隆完成之後首先在三臺機器上都分別輸入 $ ifconfig 檢視是否有eth0 如下：是正確的。【 eth0 &nbs

ZooKeeper完全分散式安裝與配置

Apache ZooKeeper是一個為分散式應用所設計開源協調服務，其設計目是為了減輕分散式應用程式所承擔的協調任務。可以為使用者提供同步、配置管理、分組和命名服務。 1.環境說明在三臺裝有centos6.5（64位）伺服器上安裝ZooKeeper，官網建議至少3個節點，本

Hadoop完全分散式叢集的搭建

如果前一章的內容你看懂了，那麼請先刪除之前搭建的三個新伺服器重新克隆三個！！！(博主絕對不是故意為之，真的只是忘記了？) Hadoop完全分散式叢集的搭建 1.分散式叢集搭建規劃 2.叢集的配置（許可權問題，命令執行位置問題請自行注意） 2.1

hadoop 偽分散式安裝

0. 關閉防火牆重啟後失效 service iptables start ;#立即開啟防火牆，但是重啟後失效。 service iptables stop ;#立即關閉防火牆，但是重啟後失效。重啟後生效 chkconfig iptables on ;#開啟防火牆，重啟後生效 chkconfig

hadoop 完全分散式安裝

步驟：

1.關閉防火牆

2.修改主機名

3.修改hosts檔案進行對映

4.免密登入

5.重啟三臺伺服器

6.安裝jdk

7.安裝zookeeper

8.啟動zookeeper

9.安裝hadoop

（1） 編輯 hadoop-env.sh，並且重新生效

（2）編輯 core-site.xml

（3）編輯 hdfs-site.xml

（4）編輯 mapred-site.xml

（5） 編輯 yarn-site.xml

（6）編輯 slaves

（7）配置環境變數

（8）將hadoop拷貝到另外兩個主機

（9）配置另外兩個主機的環境變數

10.在任意一個節點上進行Zookeeper格式化註冊

11.建立指定的目錄

12.在三臺節點上分別啟動journalnode

13.格式化第一個節點

14.啟動第一個節點的namenode

15.格式化第二個節點上的namenode

16.啟動第二個點的namenode

17.在三個節點上分別啟動datanode

18.在第一個節點和第二個節點上啟動zkfc實現狀態的切換

19.在第一個節點上啟動yarn

20.在第三個節點上啟動resourcemanager

21.瀏覽器訪問

相關推薦

（1）編輯 hadoop-env.sh，並且重新生效

（5）編輯 yarn-site.xml