hadoop完全分散式搭建HA（高可用）

阿新 • • 發佈：2018-12-31

首先建立5臺虛擬機器（最少三臺），並且做好部署規劃

ip地址	主機名	安裝軟體	程序
192.168.xx.120	master	jdk,hadoop,zookeeper	namenode,ZKFC,Resourcemanager
192.168.xx.121	master2	jdk,hadoop,zookeeper	namenode,ZKFC,Resourcemanager
192.168.xx.122	slave1	jdk,hadoop,zookeeper	natanode,nodemanager,zookeeper,Journalnode,
192.168.xx.123	slave2	jdk,hadoop,zookeeper	natanode,nodemanager,zookeeper,Journalnode,
192.168.xx.124	slave3	jdk,hadoop,zookeeper	natanode,nodemanager,zookeeper,Journalnode,

一、首先設定防火牆防火牆

立即關閉防火牆service iptables stop

設定防火牆開機不啟動 chkconfig iptables off

設定 selinux 將SELINUX 改為disabled

二、編輯主機名對映

vi/etc/hosts

下載 ssh包獲取scp命令

yuminstall openssh-clients

將hosts遠端拷貝至後面四臺機器

scp /etc/hostsmaster2:/etc/hosts

三、設定五臺機器時間同步

最小化安裝沒有ntpdate這個軟體，首先用yum命令下載

yum –y installntp

設定master 與指定時間伺服器同步

ntpdate cn.pool.ntp.org

設定後面4臺機器與master同步

修改master ntp配置檔案

vi /etc/ntp.conf

講restrict 上的網段改為自己的網段

註釋server 伺服器

在最下面新增兩行server 和fudge內容

啟動ntpd ，並設定為開機啟動

關閉後面幾臺ntpd，並設定為開機不啟動

同步master時間伺服器

ntpdate master

四、建立普通使用者

adduser hadoop

passwd hadoop 設定密碼

五、SSH免密登入

切換到普通使用者

在五臺機器上都輸入ssh-keygen –t rsa，然後一直按回車

將祕鑰拷貝到五臺機器上

ssh-copy-id master

ssh-copy-id master2

ssh-copy-id slave1

ssh-copy-id slave2

ssh-copy-id slave3

測試能否免密登入，設定成功！

在其他四臺機器上重複以上操作

六、安裝jdk

我這裡是最小化安裝不需要檢查系統自己看裝的jdk，如果不是需要解除安裝

通過下面兩行命令查詢解除安裝

rpm –qa |grep jdk

rpm –e –nodep

修改/opt/資料夾使用者

chown –R hadoop:hadoop /opt/

建立 /opt/software資料夾，這個資料夾用來存放壓縮包，建立/opt/modules這個檔案用來存放解壓的軟體

上傳jdk到software

解壓jdk到modules

配置環境變變數，切換到root使用者vi /etc/profile 也可以在普通使用者下修改vi ~/.bash_profile，在最後新增

儲存退出，輸入 source /etc/profile ，然後輸入java -version驗證版本

將java scp至其他幾臺機器

將配置檔案scp至其他幾臺機器

七、進入slave1主機，安裝配置zookeeper

上傳zookeeper到software資料夾，並解壓到modules

修改zookeeper配置檔案

修改dataDir 路徑，增加server配置資訊

建立zkData資料夾並建立myid檔案，在slave1輸入1

scp zookeeper資料夾到slave2和slave3下

修改slave2和slave3 的myid檔案

啟動zookeeper，並驗證狀態

啟動 bin/zkCli.sh，配置完成！

八、安裝配置hadoop

上傳hadoop到software資料夾，並解壓到modules

配置hadoop環境變數

root vi /etc/profile，記得source /etc/profile

修改hadoop 配置檔案

修改 etc/hadoop 下的環境變數檔案增加java環境變數

hadoop-env.sh mapred-env.sh yarn-env.sh

export JAVA_HOME=/opt/modules/jdk1.7.0_79

修改core-site.xml檔案

<configuration>
    <property>  
        <name>fs.defaultFS</name>  
        <value>hdfs://ns1</value>  
    </property>  
    <property>  
        <name>hadoop.tmp.dir</name>  
        <value>/opt/modules/App/hadoop-2.5.0/data/tmp</value>  
    </property>  
    <property>  
        <name>hadoop.http.staticuser.user</name>  
        <value>hadoop</value>  
    </property>  
    <property>  
        <name>ha.zookeeper.quorum</name>  
        <value>slave1:2181,slave2:2181,slave3:2181</value>  
    </property>
</configuration>

修改hdfs-site.xml檔案

<configuration>
    <property>  
        <name>dfs.replication</name>  
        <value>3</value>  
    </property>  
    <property>  
        <name>dfs.permissions.enabled</name>  
        <value>false</value>  
    </property>  
    <property>  
        <name>dfs.nameservices</name>  
        <value>ns1</value>  
    </property>  
    <property>  
        <name>dfs.blocksize</name>  
        <value>134217728</value>  
    </property>  
    <property>  
        <name>dfs.ha.namenodes.ns1</name>  
        <value>nn1,nn2</value>  
    </property>  
    <!-- nn1的RPC通訊地址，nn1所在地址  -->  
    <property>  
        <name>dfs.namenode.rpc-address.ns1.nn1</name>  
        <value>master:8020</value>  
    </property>  
    <!-- nn1的http通訊地址，外部訪問地址 -->  
    <property>  
        <name>dfs.namenode.http-address.ns1.nn1</name>  
        <value>master:50070</value>  
    </property>  
    <!-- nn2的RPC通訊地址，nn2所在地址 -->  
    <property>  
        <name>dfs.namenode.rpc-address.ns1.nn2</name>  
        <value>master2:8020</value>  
    </property>  
    <!-- nn2的http通訊地址，外部訪問地址 -->  
    <property>  
        <name>dfs.namenode.http-address.ns1.nn2</name>  
        <value>master2:50070</value>  
    </property>  
    <!-- 指定NameNode的元資料在JournalNode日誌上的存放位置(一般和zookeeper部署在一起) -->  
    <property>  
        <name>dfs.namenode.shared.edits.dir</name>  
        <value>qjournal://slave1:8485;slave2:8485;slave3:8485/ns1</value>  
    </property>  
    <!-- 指定JournalNode在本地磁碟存放資料的位置 -->  
    <property>  
        <name>dfs.journalnode.edits.dir</name>  
        <value>/opt/modules/hadoop-2.5.0-cdh5.3.6/data/journal</value>  
    </property>  
    <!--客戶端通過代理訪問namenode，訪問檔案系統，HDFS 客戶端與Active 節點通訊的Java 類，使用其確定Active 節點是否活躍  -->  
    <property>  
        <name>dfs.client.failover.proxy.provider.ns1</name>  
        <value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>  
    </property>  
    <!--這是配置自動切換的方法，有多種使用方法，具體可以看官網，在文末會給地址，這裡是遠端登入殺死的方法  -->  
    <property>  
        <name>dfs.ha.fencing.methods</name>  
        <value>sshfence</value>     
    </property>  
    <!-- 這個是使用sshfence隔離機制時才需要配置ssh免登陸 -->  
    <property>  
        <name>dfs.ha.fencing.ssh.private-key-files</name>  
        <value>/home/hadoop/.ssh/id_rsa</value>  
    </property>  
    <!-- 配置sshfence隔離機制超時時間，這個屬性同上，如果你是用指令碼的方法切換，這個應該是可以不配置的 -->  
    <property>  
        <name>dfs.ha.fencing.ssh.connect-timeout</name>  
        <value>30000</value>  
    </property>  
    <!-- 這個是開啟自動故障轉移，如果你沒有自動故障轉移，這個可以先不配 -->  
    <property>  
        <name>dfs.ha.automatic-failover.enabled</name>  
        <value>true</value>  
    </property>  
</configuration>

修改mapred-site.xml.template名稱為mapred-site.xml並修改

<configuration>
    <property>  
        <name>mapreduce.framework.name</name>  
        <value>yarn</value>  
    </property>  
    <property>  
        <name>mapreduce.jobhistory.address</name>  
        <value>master:10020</value>  
    </property>  
    <property>  
        <name>mapreduce.jobhistory.webapp.address</name>  
        <value>master:19888</value>  
    </property>  
</configuration>

配置 yarn-site.xml

<configuration>
    <property>  
        <name>yarn.nodemanager.aux-services</name>  
        <value>mapreduce_shuffle</value>  
    </property>
    <!-- Site specific YARN configuration properties -->
    <!--啟用resourcemanager ha-->  
    <!--是否開啟RM ha，預設是開啟的-->  
    <property>  
       <name>yarn.resourcemanager.ha.enabled</name>  
       <value>true</value>  
    </property>  
    <!--宣告兩臺resourcemanager的地址-->  
    <property>  
       <name>yarn.resourcemanager.cluster-id</name>  
       <value>rmcluster</value>  
    </property>  
    <property>  
       <name>yarn.resourcemanager.ha.rm-ids</name>  
       <value>rm1,rm2</value>  
    </property>  
    <property>  
       <name>yarn.resourcemanager.hostname.rm1</name>  
       <value>master</value>  
    </property>  
    <property>  
       <name>yarn.resourcemanager.hostname.rm2</name>  
       <value>master2</value>  
    </property>  
   
    <!--指定zookeeper叢集的地址-->   
    <property>  
       <name>yarn.resourcemanager.zk-address</name>  
        <value>slave1:2181,slave2:2181,slave3:2181</value>  
    </property>  
    <!--啟用自動恢復，當任務進行一半，rm壞掉，就要啟動自動恢復，預設是false-->   
    <property>  
       <name>yarn.resourcemanager.recovery.enabled</name>  
       <value>true</value>  
    </property>  
   
    <!--指定resourcemanager的狀態資訊儲存在zookeeper叢集，預設是存放在FileSystem裡面。-->   
    <property>  
       <name>yarn.resourcemanager.store.class</name>  
       <value>org.apache.hadoop.yarn.server.resourcemanager.recovery.ZKRMStateStore</value>  
    </property> 

</configuration>

配置slaves

scp hadoop到其他四臺機器，拷貝之前刪除share/doc檔案

分別在master和master2的yarn-site.xml上新增

<property>  
   <name>yarn.resourcemanager.ha.id</name>  
   <value>rm1</value>  
</property>
<property>  
   <name>yarn.resourcemanager.ha.id</name>  
   <value>rm2</value>  
</property>

啟動zookeeper

啟動journalnode sbin/hadoop-deamon.sh startjournalnode

格式化master namenode bin/hdfs namenode –format

啟動 master namenode sbin/hadoop-deamon.sh startnamenode

在master2上同步master namenode元資料 bin/hdfs namenode -bootstrapStandby

啟動master2 namenode sbin/hadoop-deamon.sh startnamenode

此時進入 50070 web頁面，兩個namenode都是standby狀態，這是可以先強制手動是其中一個節點變為active bin/hdfs haadmin –transitionToActive–forcemanual

此時master變為active

手動故障轉移已經完成，接下來配置自動故障轉移

先把整個叢集關閉，zookeeper不關，輸入bin/hdfs zkfc –formatZK，格式化ZKFC

在slave1上登入zookeeper

輸入ls / ，發現多了一個hadoop-ha節點，這是配置應該沒有問題

啟動叢集，在master 輸入 sbin/start-dfs.sh

此時一個節點stanby 一個節點active

現在kill掉master namenode程序，重新整理master頁面

master自動切換為active，配置成功！

啟動yarn，測試resourcemanager ha ,master1輸入 sbin/start-yarn.sh

master2輸入 sbin/yarn-daemaon.sh start resourcemanager

在web 端輸入master2:8088自動跳轉

Kill master rm程序

master2:8088 active

wordcount程式測試，在本地建立一個測試檔案，並上傳到hdfs上

檢視輸出檔案 hadoop fs –cat /output1/part*,執行成功

關閉active rm ，再次執行wordcount

關閉active namenode，檢視檔案

檢視成功，rm nn HA配置成功!

hadoop完全分散式搭建HA（高可用）

首先建立5臺虛擬機器（最少三臺），並且做好部署規劃ip地址主機名安裝軟體程序 192.168.xx.120 master jdk,hadoop,zookeeper namenode,ZKFC,Resourcemanager 192.168.xx.121 m

獨立模式、偽分佈模式、hbase和hadoop HA（高可用）完全分散式模式。整合配置

一、獨立模式： 1.下載hbase檔案略 2.tar開略 3.配置環境變數略 4.修改配置檔案在hbase安裝目錄下： //配置jdk路徑 [/conf/hbase-env.sh] export JAVA_HOME=/zdq/jdk //配置hbas

四節點搭建Hadoop HA（高可用）叢集模式

準備工作：四個節點間的ssh互通，（至少兩個NN節點和其他節點ssh互通）； JDK 1.7+，環境變數配置，各節點保持一致； /etc/hosts 節點名對映，各節點保持一致；保證各元件版本間相容性，推薦使用cdh的jar包 datas : 當做所

kafka HA（高可用搭建）

[[email protected] kafka_2.11-1.1.0]$ bin/kafka-console-consumer.sh --zookeeper localhost:2181 --from-beginning --topic topic2

圖文：Linux-DNS主備服務器搭建（高可用）

重啟 slave 配置文件服務器 image http img -a 建立 DNS主服務器（master）：192.168.127.147從服務器（slave）：192.168.127.1481、首先在master和slave上安裝DNS包： 2、編輯master上的D

ubantu 16.4 Hadoop 完全分散式搭建

一個虛擬機器　　1.以 NAT網絡卡模式裝載虛擬機器　　2.最好將幾個用到的虛擬機器修改主機名，靜態IP /etc/network/interface，這裡是 s101 s102 s103 三

Hadoop完全分散式搭建步驟

請在搭建偽分散式的基礎上搭建完全分散式 1、克隆兩臺虛擬機器(點選藍色超連結有如何克隆虛擬機器)。 2、克隆完成之後首先在三臺機器上都分別輸入 $ ifconfig 檢視是否有eth0 如下：是正確的。【 eth0 &nbs

ubantu 16.4 Hadoop 完全分散式搭建

一個虛擬機器　　1.以 NAT網絡卡模式裝載虛擬機器　　2.最好將幾個用到的虛擬機器修改主機名，靜態IP /etc/network/interface，這裡是 s101 s102 s103 三臺主機 ubantu，改/etc/hostname檔案　　3.安裝ssh 　　

hadoop完全分散式搭建

1、安裝linux作業系統。 2、配置網路，固定ip。本人一般採用nat模式。 3、關閉防火牆檢視防火牆狀態 chkconfig iptables --list chkconfig ip6tables --list 臨時關閉防火牆（立即生效） service ipta

Spring Cloud構建微服務架構分散式配置中心（高可用與動態重新整理）【Dalston版】

高可用問題傳統作法通常在生產環境，Config Server與服務註冊中心一樣，我們也需要將其擴充套件為高可用的叢集。在之前實現的config-server基礎上來實現高可用非常簡單，不需要我們為這些服務端做任何額外的配置，只需要遵守一個配置規則：將所有的Config Server都指向同一

Hadoop2.7.2之叢集搭建（高可用）

叢集規劃主機名 ip 安裝的軟體程序 hadoop01 192.168.1.101 jdk、hadoop NN、DFSZKFailoverController hadoop02 192.1

Ubuntu Hadoop 完全分散式搭建

系統：Ubuntu16.04 jdk：jdk1.8.0_101 Hadoop：hadoop2.7.3 首先需要有兩臺以上的計算機，一臺作為Master節點，其他的作為Slave節點，所有的伺服器上都需要配置好jdk的環境，我這裡準備了兩臺伺服器作為

Hadoop完全分散式搭建流程---超詳細

1.克隆兩個節點 2.修改靜態IP 3.修改主機名：【master(主)，slave1(從)，slave2(從)】 4.修改IP和主機名的對映：【/etc/hosts】 5.SSH無密登入： a.修改hostname $>su root $>gedi

nginx+keepalived IP飄移（高可用）

1、安裝keepalived yum install -y keepalived 設定開機自啟動 systemctl enable keepalived.service 2、修改配置檔案（1）主配置檔案 vim

二、k8s1.12 master多節點（高可用）

架構圖 master 節點我們要避免單節點，防止故障 1、多節點部署我們在192.168.1.9上面部署另外一臺master 首先我們將主節點檔案拷貝過去： cd /opt scp -r kubernetes 192.168.1.9:/opt/ scp -r

Nginx+keepalived實現伺服器一主一備（高可用）

1.上一篇講解了如何在伺服器搭建Nginx伺服器，這裡不做過多描述。首先把壓縮包拷貝到Linux的/usr/local目錄下（主Nginx：192.168.0.111） 2.安裝keepalived（主Nginx：192.168.0.111）進入/usr/local目錄下：

Nginx反向代理Tomcat實現現負載均衡（高可用）以及利用redis+Session同步會話共享配置詳解

簡介：一、Redis介紹 redis是一個key-value儲存系統。和Memcached類似，它支援儲存的value型別相對更多，包括string(字串)、list(連結串列)、set(集合)、zset(sortedset --有序集合)和hash（雜湊型別）。與m

HDFS高可用完全分散式搭建步驟

一、準備階段分散式思想分散式叢集規劃主機名 IP地址 NN-1 NN-2 DN ZK ZKFC JNN

HDFS高可用的完全分散式搭建流程

HDFS高可用的完全分散式設計架構圖 HDFS的高可用指的是HDFS持續對各類客戶端提供讀、寫服務的能力，因為客戶端對HDFS的讀、寫操作之前都要訪問Namenode伺服器，客戶端只有從Namenode獲取元資料之後才能繼續進行讀、寫。所以HDFS的高可用的關

大資料(六) --高可用完全分散式搭建

說明搭建之前, 先根據HDFS三種模式一文將叢集的初始環境配置OK. 高可用完全分散式搭建叢集規劃 NN(active) NN(standby) DN ZK ZKFC JNN node01 √ – – – √ √ node02

hadoop完全分散式搭建HA（高可用）

相關推薦