Hadoop的HA環境搭建

阿新 • • 發佈：2018-09-20

resource 執行事務隔離級別 hdf dfa def rop proxy 不可重復讀

一、集群的規劃

Zookeeper集群：
192.168.176.131 （bigdata112）
192.168.176.132 （bigdata113）
192.168.176.135 （bigdata114）

Hadoop集群：
192.168.176.131 （bigdata112） NameNode1 ResourceManager1 Journalnode
192.168.176.132 （bigdata113） NameNode2 ResourceManager2 Journalnode
192.168.176.135 （bigdata114） DataNode1 NodeManager1

192.168.176.136 （bigdata115） DataNode2 NodeManager2

二、準備工作

1、安裝JDK
2、配置環境變量
3、配置免密碼登錄
4、配置主機名

三、配置Zookeeper（在192.168.176.131安裝）

在主節點（bigdata112）上配置ZooKeeper

（*）配置/training/zookeeper-3.4.6/conf/zoo.cfg文件

dataDir=/training/zookeeper-3.4.6/tmp

server.1=bigdata112:2888:3888
server.2=bigdata113:2888:3888
server.3=bigdata114:2888:3888

（*）在/training/zookeeper-3.4.6/tmp目錄下創建一個myid的空文件
echo 1 > /training/zookeeper-3.4.6/tmp/myid

（*）將配置好的zookeeper拷貝到其他節點，同時修改各自的myid文件

        scp -r /training/zookeeper-3.4.6/ bigdata113:/training
        scp -r /training/zookeeper-3.4.6/ bigdata114:/training

（*）分別修改113和114上/training/zookeeper-3.4.6/tmp/myid為2和3

四、安裝Hadoop集群（在bigdata112上安裝）

1、修改hadoo-env.sh
export JAVA_HOME=/training/jdk1.8.0_144

2、修改core-site.xml

<configuration>
            <!-- 指定hdfs的nameservice為ns1 -->
            <property>
                    <name>fs.defaultFS</name>
                    <value>hdfs://ns1</value>
            </property>
            <!-- 指定hadoop臨時目錄 -->
            <property>
                    <name>hadoop.tmp.dir</name>
                    <value>/training/hadoop-2.7.3/tmp</value>
            </property>

            <!-- 指定zookeeper地址 -->
            <property>
                    <name>ha.zookeeper.quorum</name>
                    <value>bigdata112:2181,bigdata113:2181,bigdata114:2181</value>
            </property>
</configuration>

3、修改hdfs-site.xml（配置這個nameservice中有幾個namenode）

<configuration> 
            <!--指定hdfs的nameservice為ns1，需要和core-site.xml中的保持一致 -->
            <property>
                <name>dfs.nameservices</name>
                <value>ns1</value>
            </property>

            <!-- ns1下面有兩個NameNode，分別是nn1，nn2 -->
            <property>
                <name>dfs.ha.namenodes.ns1</name>
                <value>nn1,nn2</value>
            </property>

            <!-- nn1的RPC通信地址 -->
            <property>
                <name>dfs.namenode.rpc-address.ns1.nn1</name>
                <value>bigdata112:9000</value>
            </property>
            <!-- nn1的http通信地址 -->
            <property>
                <name>dfs.namenode.http-address.ns1.nn1</name>
                <value>bigdata112:50070</value>
            </property>

            <!-- nn2的RPC通信地址 -->
            <property>
                <name>dfs.namenode.rpc-address.ns1.nn2</name>
                <value>bigdata113:9000</value>
            </property>
            <!-- nn2的http通信地址 -->
            <property>
                <name>dfs.namenode.http-address.ns1.nn2</name>
                <value>bigdata113:50070</value>
            </property>

            <!-- 指定NameNode的日誌在JournalNode上的存放位置 -->
            <property>
                <name>dfs.namenode.shared.edits.dir</name>
                <value>qjournal://bigdata112:8485;bigdata113:8485;/ns1</value>
            </property>
            <!-- 指定JournalNode在本地磁盤存放數據的位置 -->
            <property>
                <name>dfs.journalnode.edits.dir</name>
                <value>/training/hadoop-2.7.3/journal</value>
            </property>

            <!-- 開啟NameNode失敗自動切換 -->
            <property>
                <name>dfs.ha.automatic-failover.enabled</name>
                <value>true</value>
            </property>

            <!-- 配置失敗自動切換實現方式 -->
            <property>
                <name>dfs.client.failover.proxy.provider.ns1</name>
                <value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>
            </property>

            <!-- 配置隔離機制方法，多個機制用換行分割，即每個機制暫用一行-->
            <property>
                <name>dfs.ha.fencing.methods</name>
                <value>
                    sshfence
                    shell(/bin/true)
                </value>
            </property>

            <!-- 使用sshfence隔離機制時需要ssh免登陸 -->
            <property>
                <name>dfs.ha.fencing.ssh.private-key-files</name>
                <value>/root/.ssh/id_rsa</value>
            </property>

            <!-- 配置sshfence隔離機制超時時間 -->
            <property>
                <name>dfs.ha.fencing.ssh.connect-timeout</name>
                <value>30000</value>
            </property>
</configuration>

4、修改mapred-site.xml

    <configuration>
    <property>
            <name>mapreduce.framework.name</name>
            <value>yarn</value>
    </property>
    </configuration>

5、修改yarn-site.xml

    <configuration>
        <!-- 開啟RM高可靠 -->
        <property>
           <name>yarn.resourcemanager.ha.enabled</name>
           <value>true</value>
        </property>

        <!-- 指定RM的cluster id -->
        <property>
           <name>yarn.resourcemanager.cluster-id</name>
           <value>yrc</value>
        </property>

        <!-- 指定RM的名字 -->
        <property>
           <name>yarn.resourcemanager.ha.rm-ids</name>
           <value>rm1,rm2</value>
        </property>

        <!-- 分別指定RM的地址 -->
        <property>
           <name>yarn.resourcemanager.hostname.rm1</name>
           <value>bigdata112</value>
        </property>
        <property>
           <name>yarn.resourcemanager.hostname.rm2</name>
           <value>bigdata113</value>
        </property>

        <!-- 指定zk集群地址 -->
        <property>
           <name>yarn.resourcemanager.zk-address</name>
           <value>bigdata112:2181,bigdata113:2181,bigdata114:2181</value>
        </property>

        <property>
           <name>yarn.nodemanager.aux-services</name>
           <value>mapreduce_shuffle</value>
        </property>
    </configuration>

6、修改slaves

    bigdata14
    bigdata15

7、將配置好的hadoop拷貝到其他節點

    scp -r /training/hadoop-2.7.3/ root@bigdata113:/training/
    scp -r /training/hadoop-2.7.3/ root@bigdata114:/training/
    scp -r /training/hadoop-2.7.3/ root@bigdata115:/training/

五、啟動Zookeeper集群

   啟動
    ./zkServer.sh start 
    查看狀態
    ./zkServer.sh status

六、在bigdata112和bigdata113上啟動journalnode

hadoop-daemon.sh start journalnode

七、格式化HDFS（在bigdata112上執行）

格式化HDFS
```
hdfs namenode -format
```

2.將112上這臺的/training/hadoop-2.7.3/tmp/dfs拷貝到bigdata13的/training/hadoop-2.7.3/tmp/dfs下

scp -r /training/hadoop-2.7.3/tmp/dfs/* root@bigdata113:/training/hadoop-2.7.3/tmp/dfs/

3.格式化zookeeper

  hdfs zkfc -formatZK

日誌：

17/07/13 00:34:33 INFO ha.ActiveStandbyElector: Successfully created /hadoop-ha/ns1 in ZK.

八、在bigdata12上啟動Hadoop集群

start-all.sh

日誌：
    Starting namenodes on [bigdata12 bigdata13]
    bigdata12: starting namenode, logging to /root/training/hadoop-2.4.1/logs/hadoop-root-namenode-hadoop113.out
    bigdata13: starting namenode, logging to /root/training/hadoop-2.4.1/logs/hadoop-root-namenode-hadoop112.out
    bigdata14: starting datanode, logging to /root/training/hadoop-2.4.1/logs/hadoop-root-datanode-hadoop115.out
    bigdata15: starting datanode, logging to /root/training/hadoop-2.4.1/logs/hadoop-root-datanode-hadoop114.out

    bigdata13: starting zkfc, logging to /root/training/hadoop-2.7.3/logs/hadoop-root-zkfc-bigdata13.out
    bigdata12: starting zkfc, logging to /root/training/hadoop-2.7.3/logs/hadoop-root-zkfc-bigdata12.out

bigdata113上的ResourceManager需要單獨啟動

    命令：yarn-daemon.sh start resourcemanager

九、問題延伸

1、隔離機制和隔離級別
    （*）關系型數據庫：如果不考慮事務隔離級別，造成臟讀、不可重復讀、幻讀
    （*）HDFS的HA：如果不考慮隔離機制（隔離級別），造成腦裂的問題
2、什麽是腦裂的問題？
    腦裂的問題，針對的是數據節點（DataNode）
    由於某種原因，造成了整個HDFS中存在多個active的NameDode，這時候DataNode就不知道誰是真正的NameNode。

Hadoop的HA環境搭建

vue.js開發環境搭建

回車 try htm 成功效果 webpack log 表示測試 1、安裝node.js，忽略 2、基於node.js，利用淘寶npm鏡像安裝相關依賴在cmd裏直接輸入：npm install -g cnpm –-registry=https://regi

Spring【一，環境搭建】

pla cee 數據 web int 世界 aging support ges Spring 大家都不陌生，企業應用中很流行的一個平臺。從最開始的 Servlet 控制所有，到 MVC 模式的出現。從 SSH （Struts、Spring、Hibernate）所謂的三

Python 環境搭建

enter tom 系統變量尋找壓縮包執行權 content 添加 export Python 環境搭建本章節我們將向大家介紹如何在本地搭建Python開發環境。 Python可應用於多平臺包括 Linux 和 Mac OS X。你可以通過終端窗口輸入 "pyt

[原創]ObjectARX開發環境搭建之VS2010+ObjectARX2012Wizard+Addin工具條問題修復

系統右鍵 9.png line cls sid 新建使用開發環境目前ObjectARX版本越來越高，也越來越簡化開發，如果需要同時開發低版本和高版本的ARX程序，就需要搭建批量編譯環境，以滿足ARX開發的需要。批量編譯的搭建網絡上已經有了很多的教程，基本上都是基於

yum,httpd,php環境搭建方法

lpn bin kcon devel php-mysql common secure httpd 環境 #刪除已有的yum 1 rpm -qa|grep yum|xargs rpm -e --nodeps 2 ls 3 rpm -ivh pyt

jquery環境搭建

.com 搭建 java head query jquery baidu aid char <html><head> <meta http-equiv="Content-Type" content="text/html; charset=

tomcat8+jdk1.8.0_131環境搭建與添加用戶(win764位)

tomcattomcat8下載地址：http://mirrors.tuna.tsinghua.edu.cn/apache/tomcat/tomcat-8/v8.5.14/bin/apache-tomcat-8.5.14-windows-x64.zip jdk1.8.0下載地址：http://download.

項目進階之集群環境搭建（一）概述

問題特點多臺 cpu 好的 content 成了系統資源通過今天我們說一個不是特別新，但近期今年伴隨大數據熱而比較火的一個技術-集群技術。什麽是集群技術集群（Cluster）技術是指一組相互犭蟲立的計算機，利用快速通信網絡組

mingw64環境搭建

fun boot 新版本 endif ava tps audio rom static 1.首先下載mingw64， https://nchc.dl.sourceforge.net/project/mingw/Installer/mingw-get-setup.exe

【Linux】LAMP環境搭建（簡易版）

freetype 軟件系統解壓縮 net done .gz 輔助 one 一. 輔助軟件包安裝準備工作：1.Linux系統準備恢復快照（初始化安裝）設置IP 關閉SELINUX 配置yum源 2.yum -y install gcc

Android NDK 環境搭建

pad str 還要 ndk路徑不出 tar evel 例如 command 使用最新ndk，直接拋棄cygwin，曾經做Android的項目要用到NDK就必需要下載NDK，下載安裝Cygwin(模擬Linux環境用的)，下載CDT（Eclipse C/C++開發插件

apache kafka源碼project環境搭建(IDEA)

name env check 轉載 2.2.0 var 10.9 環境 con 1.gradle安裝 gradle安裝 2.下載apache kafka源碼 apache kafka下載 3.用gradle構建產生IDEAproject文件先裝好idea的sc

Nginx + FastCgi + Spawn-fcgi + C 架構的server環境搭建

text -c one install usr world abs for 中間件 1.Nginx 1.1.安裝 Nginx 的中文維基 http://wiki.codemongers.com/NginxChs 下載 Nginx 0.6.26（開發版）（請下載最

CentOS7.2 上 Nginx PHP Mariadb 環境搭建

lnmp centos7.2最近有個ERP+PHP-web 測試頁面環境部署需求，需要部署nginx+php的cgi+socket的模式、mysql環境。查看服務端口是否起來，我們習慣使用netstat指令查看，所以如果你的系統裏尚未安裝netstat，可直接安裝 yum install -y net-to

SpringData系列一Spring Data的環境搭建

vendor ssi over str spa ger repos getbean date 　本節作為主要講解Spring Data的環境搭建 JPA Spring Data :致力於減少數據訪問層(DAO)的開發量。開發者唯一要做的就是聲音持久層的接口，其他都交給

Python3-Django-1.開發環境搭建

file 響應令行 ide star local bsp pla 創建官網　　https://www.djangoproject.com/ 安裝　　http://www.runoob.com/django/django-install.html 創建項目　　方式一

windows下php、mysql環境搭建

ins ads unity 5.7 文件 all color 註意 ont php http://windows.php.net/download/ mysql https://dev.mysql.com/downloads/windows/installer/5.7.ht

ubuntu14.04 LTS Python IDE專用編輯器PyCharm開發環境搭建

terminal 環境搭建 1-1 reat 開發環境搭建 cnblogs ati .html eat 一　PyCharm下載官網下載地址：https://www.jetbrains.com/pycharm/download/ 這裏的PyCharm有付費和免費版本，我

php+mysql+nginx+phpmyadmin環境搭建

nts home sem 鏈接 ipv4 1.5 不出英文由於英文原文：http://blog.frd.mn/install-nginx-php-fpm-mysql-and-phpmyadmin-on-os-x-mavericks-using-homebrew/ 參照

54.Storm環境搭建

最好配置瀏覽器目錄結構 kill profile 技術分享 .py star 集群環境搭建關閉防火墻，修改/etc/hosts配置（3臺機器的ip可以相互通信）下載安裝jdk7（1.6以上），配置JAVA_HOME, CLASSPATH 搭建Zookeeper集

Hadoop的HA環境搭建

二、準備工作

三、配置Zookeeper（在192.168.176.131安裝）

四、安裝Hadoop集群（在bigdata112上安裝）

五、啟動Zookeeper集群

六、在bigdata112和bigdata113上啟動journalnode

七、格式化HDFS（在bigdata112上執行）

八、在bigdata12上啟動Hadoop集群

九、問題延伸

相關推薦