Hadoop-HA配置詳細步驟

阿新 • • 發佈：2017-08-06

eno col ice nbsp 版本 files tab des frame

1. HA服務器配置

對hdfs做高可用

1.1服務器詳情

服務器：centos7

Hadoop:2.6.5

Jdk:1.8

共四臺服務器

192.168.1.111 node1

192.168.1.112 node2

192.168.1.113 node3

192.168.1.114 node4

在每臺服務器的/etc/hosts文件中添加上邊四行內容

服務器分配

	NN	DN	ZK	ZKFC	JN	RM	DM
Node1	1		1	1		1
Node2	1	1	1	1	1		1
Node3		1	1		1		1
Node4		1			1		1

Journalnode:需要為奇數個

Zookeeper：需要為奇數個

ZKFS和NN在同臺服務器

DM和DN保持一致。

1.2配置免密登錄

在每臺服務器分別生成各自的公鑰私鑰

　　命令如下

　　ssh-keygen –t rsa –P ‘’ –f ~/.ssh/id_rsa

　　此時查看 ~/.ssh目錄下，會有兩個文件，id_rsa(私鑰)、id_rsa.pub(公鑰)

將id_rsa.pub文件內容拼接到每臺服務器的~/.ssh/authorized_keys文件

　　命令如下

　　cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys

　　每臺服務器都需要拼接四次，包括本節點及其它三個節點的，配置完成後，即可免密登錄其它節點

1.3Hadoop配置

此處使用的hadoop版本為2.6.5

1.3.1 hadoop-env.sh

編輯/etc/hadoop/hadoop-env.sh文件

找到JAVA_HOME配置位置，修改JAVA_HOME如下

export JAVA_HOME= /home/java/jdk1.8.0_144

1.3.2 hdfs-site.xml(/etc/hadoop/hdfs-site.xml)

配置nameservice

<property>
  <name>dfs.nameservices</name>
  <value>mycluster</value>
</property>

再配置所有namenode的名字

<property>
  <name>dfs.ha.namenodes.mycluster</name>
  <value>nn1,nn2</value>
</property>

註意：此處的mycluster和上邊指定的服務名一致，nn1 nn2位兩個namenode名稱

配置RPC協議的端口，兩個namenode都要配置

<property>
  <name>dfs.namenode.rpc-address.mycluster.nn1</name>
  <value>machine1.example.com:8020</value>
</property>
<property>
  <name>dfs.namenode.rpc-address.mycluster.nn2</name>
  <value>machine2.example.com:8020</value>
</property>

配置HTTP協議的端口和主機

<property>
  <name>dfs.namenode.http-address.mycluster.nn1</name>
  <value>node1:50070</value>
</property>
<property>
  <name>dfs.namenode.http-address.mycluster.nn2</name>
  <value>node2:50070</value>
</property>

配置journalnode

<!-- 配置journalnode -->

<property>
  <name>dfs.namenode.shared.edits.dir</name>
  <value>qjournal://node2:8485;node3:8485;node4:8485/mycluster</value>
</property>

註意：此處的mycluster需要和服務名一樣

配置ConfiguredFailoverProxyProvider類，HDFS通過這個類來找到active的namenode

<property>
  <name>dfs.client.failover.proxy.provider.mycluster</name>
  <value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>
</property>

配置ssh fencing

<property>
  <name>dfs.ha.fencing.methods</name>
  <value>sshfence</value>
</property>
<property>
  <name>dfs.ha.fencing.ssh.private-key-files</name>
  <value>/root/.ssh/id_rsa</value>
</property>

<!--配置journalnode的工作目錄-->
<property>
  <name>dfs.journalnode.edits.dir</name>
  <value>/opt/journalnode/data</value>
</property>

開啟自動切換（可選），手動切換也可用

<!--開啟自動切換（可選）-->
<property>
   <name>dfs.ha.automatic-failover.enabled</name>
   <value>true</value>
 </property>

1.3.3 core-site.xml

配置namenode入口

<!--配置namenode入口-->
<property>
  <name>fs.defaultFS</name>
  <value>hdfs://mycluster</value>
</property>

註意：此處的mycluster需要和hdfs-site.xml文件中的nameservice名稱一致

配置zookeeper的集群，zookeeper所在的節點

<!--配置zookeeper的集群-->
<property>
   <name>ha.zookeeper.quorum</name>
   <value>node1:2181,node2:2181,node3:2181</value>
 </property>

配置工作目錄hadoop.tmp.dir 默認是在系統的臨時目錄下/tmp

<!--配置hadoop的工作目錄，默認在系統的臨時目錄下/tmp-->
<property>
   <name>hadoop.tmp.dir </name>
   <value>/opt/hadoop2</value>
 </property>

1.3.4 slaves配置datanode

node2

node3

node4

不需要配master了，因為沒有secondarynamenode，journalnode替代了它

2啟動hdfs

先將zookeeper啟動起來 ./zkServer.sh start
必須先啟動journalnode

　　需要在node2、3、4啟動journalnode

　　命令 ./hadoop-daemon.sh start journalnode

在任意一個namenode上格式化

　　在node1上格式化namenode

　　./hdfs namenode –format

　　註意centos關閉防火墻一定要用systemctl stop firewalld

　　格式化後，在/opt/hadoop2下就會有元數據文件了

將node1上的元數據文件拷貝到node2中
- 必須先啟動node1中的namenode

　　　　　　./hadoop-daemon.sh start namenode

- 在沒有格式化namenode的節點上（node2）上執行命令

　　　　　　./hdfs namenode –bootstrapStandby

　　　　命令成功執行後，在/opt/hadoop2/下就會有元數據文件了

格式化zk,在任意一臺namenode節點上

　　hdfs zkfc -formatZK

停止hdfs

　　./stop-dfs.sh

　　會停止除了zookeeper之外的所有進程

啟動hdfs

　　./start-dfs.sh

[[email protected] sbin]# ./start-dfs.sh

Starting namenodes on [node1 node2]

node2: starting namenode, logging to /home/hadoop/hadoop-2.6.5/logs/hadoop-root-namenode-node2.out

node1: starting namenode, logging to /home/hadoop/hadoop-2.6.5/logs/hadoop-root-namenode-node1.out

node4: starting datanode, logging to /home/hadoop/hadoop-2.6.5/logs/hadoop-root-datanode-node4.out

node3: starting datanode, logging to /home/hadoop/hadoop-2.6.5/logs/hadoop-root-datanode-localhost.out

node2: starting datanode, logging to /home/hadoop/hadoop-2.6.5/logs/hadoop-root-datanode-node2.out

Starting journal nodes [node2 node3 node4]

node4: starting journalnode, logging to /home/hadoop/hadoop-2.6.5/logs/hadoop-root-journalnode-node4.out

node3: starting journalnode, logging to /home/hadoop/hadoop-2.6.5/logs/hadoop-root-journalnode-localhost.out

node2: starting journalnode, logging to /home/hadoop/hadoop-2.6.5/logs/hadoop-root-journalnode-node2.out

Starting ZK Failover Controllers on NN hosts [node1 node2]

node2: starting zkfc, logging to /home/hadoop/hadoop-2.6.5/logs/hadoop-root-zkfc-node2.out

node1: starting zkfc, logging to /home/hadoop/hadoop-2.6.5/logs/hadoop-root-zkfc-node1.out

[[email protected] sbin]# jps

5234 Jps

5188 DFSZKFailoverController

3302 QuorumPeerMain

4920 NameNode

啟動成功

　　http://192.168.1.111:50070/

　　http://192.168.1.112:50070/

會發現有一個是active 一個是standby

測試

　　在hdfs新建一個路徑，上傳文件

　　./hdfs dfs -mkdir -p /usr/file

　　./hdfs dfs -put /home/java/jdk-8u144-linux-x64.tar.gz /usr/file/

3.配置mapreduce

3.1 mapred-site.xml

<property>
     <name>mapreduce.framework.name</name>
     <value>yarn</value>
</property>

3.2 yarn-site.xml

<!--resourcemanager在哪臺服務器上-->
<property>
         <name>yarn.resourcemanager.hostname</name>
         <value>node1</value>
</property>
<property>
         <name>yarn.nodemanager.aux-services</name>
         <value>mapreduce_shuffle</value>
</property>
<property>
         <name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>
         <value>org.apache.hadoop.mapred.ShuffleHandler</value>
</property>

4.全面啟動

需要先將hdfs停掉

　　在node1上./stop-dfs.sh

全面啟動

　　Node1上 ./start-all.sh

jps查看進程

[[email protected] sbin]# jps

6977 NameNode

7603 Jps

3302 QuorumPeerMain

7244 DFSZKFailoverController

7327 ResourceManager

啟動成功。

Hadoop-HA配置詳細步驟

eno col ice nbsp 版本 files tab des frame 1. HA服務器配置對hdfs做高可用 1.1服務器詳情服務器：centos7 Hadoop:2.6.5 Jdk:1.8 共四臺服務器 192.168.1.111 node1 192

windows10上使用Eclipse配置Hadoop開發環境詳細步驟+WordCount示例

說明：Hadoop叢集已經搭建完畢，叢集上使用的Hadoop-2.5.0。目的：在window10系統上利用Eclipse配置Hadoop開發環境，編寫MapReduce關聯Hadoop叢集。準備：JDK環境變數配置、Eclipse、hadoop-2.7.5.tar、h

linux系統使用NAT模式上網配置詳細步驟

ip配置1.6/1.7 ip配置配置固定的ip是為了讓你的系統可以上網，這樣你可以遠程連接你的服務器。打開虛擬機進入虛擬系統=》進入root用戶/輸入用戶密碼命令：ls【列出當前目錄下的目錄或者文件】#ip addr【查看你的網卡信息】#dhclient【自動給你的虛擬系統配置ip地址】nes33【虛擬網卡】

Linux Tomcat安裝及配置詳細步驟

linu uri 得到 developer .sh spa develop 技術分享 .tar.gz 1. 連接服務器，進入你要存儲文件的文件夾（我的是 cd /root/developer），下載tomcat,得到 apache-tomcat-9.0.4.tar.gz

新手入門篇：虛擬機搭建hadoop環境的詳細步驟

文檔優勢 indent gic 地址完成 align 頁面一段前兩天看到有人留言問在什麽情況下需要部署hadoop，我給的回答也很簡單，就是在需要處理海量數據的時候才需要考慮部署hadoop。關於這個問題在很早之前的一篇分享文檔也有說到這個問題，數據量少的完全發揮不

Linux服務NFS配置詳細步驟

rep 配置 rtm fire showmount 防火墻 ports 目錄進程 1.環境準備以用戶名[root@doudou ~] ip：192.168.24.181/24為服務端以用戶名[root@linfan ~] ip：192.168.24.132/24為客戶

[大資料] hadoop HA 配置

前提：已經通過上一篇的環境配置好了zookeeper環境 1 叢集規劃 bigdata01.com bigdata02.com bigdata02.com namenode n

Apollo 配置詳細步驟（Windows環境）

一. 準備工作 1.下載 apollo 安裝包下載連結：http://activemq.apache.org/apollo/download.html 2.下載 java JDK 安裝包 ( apollo 依賴 java 環境) 下載連結：

使用IDEA建立javaweb專案並配置詳細步驟+匯出war包詳細步驟

###一.使用IDEA建立一個javaweb專案 1.File->New Project選擇Web Application 然後填寫好路徑和專案名稱，點選確定。 2.先看一下剛建立好的專案的目錄結構 3.在WEB-INF目錄下右鍵選擇NEW-&

Android Studio安裝配置詳細步驟（圖文）

下載到 https://developer.android.com/sdk/index.html （需翻牆）或者通過其他途徑下載安裝包。我下載的是android-studio-bundle-145.3537739-windows.exe 為完整安裝包，其中包

Linux(阿里雲Centos7)環境下搭建svn伺服器以及許可權配置詳細步驟

本篇文章主要介紹在CentOS7中採用yum安裝方式。優點：簡單，一鍵安裝，不用手動配置環境變數等。缺點：安裝位置為yum預設。本篇文章以阿里雲CentOS7為例。詳細步驟：一、yum安裝subversion 1. 安裝命令 yum install sub

Hadoop叢集搭建(詳細步驟)—完全分散式執行模式

分析： 1）準備3臺客戶機（關閉防火牆、靜態ip、主機名稱） 2）安裝jdk 3）配置環境變數 4）安裝hadoop 5）配置環境變數 6）配置叢集 7）單點啟動 8）配置ssh 9）群起並測試叢集一、虛擬機器準備詳見：二、編寫叢集分

微信公眾平臺開發（1）配置介面(微信公眾平臺搭建php開發配置詳細步驟講解)

一、簡介微信公眾平臺是騰訊公司在微信的基礎上新增的功能模組，通過這一平臺，個人和企業都可以打造一個微信的公眾號，並實現和特定群體的文字、圖片、語音的全方位溝通、互動。二、通訊機制三、註冊微信平臺公眾帳號四、伺服器端配置4.1 示例程式碼設定微信公眾平臺提供了一個php示例程式碼：（百度雲盤連結地址：https

Activiti工作流引擎的官方例項配置詳細步驟

概述學習Activiti工作流引擎，第一步自然是是下載官方提供的Demo原始碼來參考。 Activiti官網：activiti-5.22.0.zip 下載下來的原始碼結構為： war包裡就是官方示例建立Java web專案

linux基礎(十)----linux網路配置詳細步驟---橋接模式和兩臺機子的遠端通訊

本篇記錄如何給linux設定橋接網路配置到達可以linux系統可以上網的目的。配置linux網路配置虛擬機器網路模式設定橋接編輯配置檔案啟動登入後開始編輯網路配置檔案$vi /etc/sysconf

【運維管理】Nagios監控搭建與配置詳細步驟

1.基礎支援套件：gcc glibc glibc-common gd gd-devel xinetd openssl-devel httpd php 注：php和httpd均用原始碼包安裝，安裝配置方法此處不在詳述 # yum install -y gcc glibc glibc-common gd

Oracle11G r2資料庫安裝配置詳細步驟

一、 Oracle 11G 下載安裝配置(一) Oracle 11g r2下載官網連結可以在Oracle 官網下載Oracle 11g r2資料庫：解壓使用這裡下載的是for windows x64位win64_11gR2_database_1of2.

虛擬化作業系統ESXi 6.7安裝配置詳細步驟圖文

vSphere是VNware公司在2001年基於雲端計算推出的一套企業級虛擬化解決方案、核心元件為ESXi

大資料元件之----HIVE，win10下安裝以及配置hadoop詳細步驟

HIVE其本質是以Hadoop作為基礎的資料倉庫基礎設施。其中hadoop為資料的儲存和執行在商業機器上提供了可擴充套件以及容錯性的可能，其中容錯性可通過副本來進行理解。目標： HIVE是讓資料彙總更加簡單和針對大容量資料的查詢和分析，提供了SWL來使得使用者可以更簡單查詢，彙總和資料分析

Hadoop叢集配置安裝,詳細步驟及講解

**涉及linux命令一定要注意大小寫和空格,linux系統對此敏感** **hadoop叢集的安裝一定要靜下心一步一步來** 1、關閉防火牆(防火牆最好關閉,不然以後linux操作會有很多麻煩) 1)輸入命令: vi etc/selinux/config 其中改為 SELINU

Hadoop-HA配置詳細步驟

1. HA服務器配置

1.1服務器詳情

1.2配置免密登錄

1.3Hadoop配置

1.3.1 hadoop-env.sh

1.3.2 hdfs-site.xml(/etc/hadoop/hdfs-site.xml)

1.3.3 core-site.xml

1.3.4 slaves配置datanode

2啟動hdfs

3.配置mapreduce

3.1 mapred-site.xml

3.2 yarn-site.xml

4.全面啟動

相關推薦