基於zookeeper的Spark高可用叢集配置

阿新 • • 發佈：2018-12-25

首先我們這裡配置的三臺機器的叢集名稱分別為hadoop、hadoop1、hadoop2

首先是安裝Zookeeper:

（4）配置：進到conf目錄下，把zoo_sample.cfg修改成zoo.cfg（這一步是必須的，否則zookeeper不認識zoo_sample.cfg），並新增如下內容：

dataDir=/usr/local/ZooKeeper/zookeeper/data

clientPort=2181

server.0=hadoop:2888:3888

server.1=hadoop1:2888:3888

server.2=hadoop2:2888:3888

（5）在Zookeeper/data目錄下建立myid檔案，並在裡面寫0
cd /usr/local/Zookeeper/zookeeper/data
echo 0>myid
（6）把/usr/local/zookeeper/整個目錄複製到其他節點
（7）登入到hadoop1,hadoop2節點，修改myid檔案裡的值，分別將其修改為1，2
cd /usr/local/Zookeeper/zookeeper/data
echo 1>myid
cd /usr/local/Zookeeper/zookeeper/data
echo 2>myid
（8）在hadoop,hadoop1,hadoop2三個節點上分別啟動zookeeper
cd /usr/local/Zookeeper/zookeeper/
bin/zkServer.sh start 
（9）檢視程序進否啟動

通過程序檢視可以看出我們的zookeeper已經啟動 QuorumPeerMain就是zookeeper的程序

下面進行spark的配置

(1)在名為hadoop的第一臺機器上進入spark的conf目錄配置spark-env.sh檔案，配置如下：

export JAVA_HOME=/usr/java/jdk1.8.0_66
export HADOOP_HOME=/usr/local/hadoop/hadoop
export SPARK_HOME=/usr/local/spark
export YARN_CONF_DIR=$HADOOP_HOME/etc/hadoop
export SPARK_JAR=/usr/local/spark/lib/spark-assembly-1.6.1-hadoop2.6.0.jar
export PATH=$SPARK_HOME/bin:$PATH
#export SPARK_MASTER_IP=hadoop
#export SPARK_MASTER_PORT=7077

export SPARK_WORKER_CORES=1
export SPARK_WORKER_INSTANCES=1
export SPARK_WORKER_MEMORY=2g
export HADOOP_CONF_DIR=/usr/local/hadoop/hadoop/etc/hadoop
export SPARK_LOG_DIR=/usr/local/spark/logs
export SPARK_DAEMON_JAVA_OPTS="-Dspark.deploy.recoveryMode=ZOOKEEPER -Dspark.deploy.zookeeper.url=192.168.*.*:2181,192.168.*.*:2181,192.168.*.*:2181 -Dspark.deploy.zookeeper.dir=/spark"

spark-env.sh中的192.168.*.*：2181分別為名字為hadoop，hadoop1.hadoop2的地址，具體的地址根據自己的修改

很多網上的教程是將這個spark-env.sh檔案分別複製到hadoop1，hadoop2機器上就直接去啟動spark了，但是後來發現這樣是不行的，這樣就不能在後面將備用的spark master註冊成功，還需要額外的一步修改.如果說以後準備將hadoop1註冊一個備用的master那麼在hadoop1中的spark-env.sh中應該將其中的

#export SPARK_MASTER_IP=hadoop

修改為：

export SPARK_MASTER_IP=hadoop1

如果是想將hadoop2設定為備用master，同理講hadoop2中的spark-env.sh中的

#export SPARK_MASTER_IP=hadoop

修改為：

export SPARK_MASTER_IP=hadoop2

現在配置已經完成，那麼我們來啟動spark，在hadoop機器上進入spark的sbin目錄下：

spark叢集已經啟動，那麼我們進入web頁面去檢視一下：

接著在hadoop1上啟動一個備用的master：

在hadoop1機器上進入spark下的sbin目錄：

這樣備用的master已經啟動成功，進入web頁面檢視：

那麼整個的配置就已經完成了，下面通過停掉hadoop中的master，可以實現master的主備切換，在hadoop中去關閉master：

下面通過web埠檢視情況：

從上圖可以看出此時的hadoop上的master已經不能用了，接著來看看hadoop1的之前的備用master的web情況：

hadoop1中master從standby狀態變為了alive ，zookeeper已經實現了spark叢集的主備切換。

至此，整個spark叢集基於zookeeper的可自動實現主備切換的系統已經搭建完成！

基於zookeeper的Spark高可用叢集配置

首先我們這裡配置的三臺機器的叢集名稱分別為hadoop、hadoop1、hadoop2 首先是安裝Zookeeper: （4）配置：進到conf目錄下，把zoo_sample.cfg修改成z

Hadoop(25)-高可用叢集配置,HDFS-HA和YARN-HA

一. HA概述 1. 所謂HA（High Available），即高可用（7*24小時不中斷服務）。 2. 實現高可用最關鍵的策略是消除單點故障。HA嚴格來說應該分成各個元件的HA機制：HDFS的HA和YARN的HA。 3. Hadoop2.0之前，在HDFS叢集中NameNode存在單點故障（SPOF

RHCS高可用叢集配置(luci+ricci+fence)

一、關於RHCS 1. 什麼是RHCS RHCS是Red Hat Cluster Suite的縮寫，也就是紅帽子叢集套件，RHCS是一個能夠提供高可用性、高可靠性、負載均衡、儲存共享且經濟廉價的叢集工具集合，它將集群系統中三大叢集架構融合一體，可以給w

Hadoop 2.7.2 HA 自動切換高可用叢集配置詳解

1、叢集節點規劃 NameNode node1 node2 DataNode node1 node2 node3 JournalNode node1 node2 node3 zookeeper node1 node2 node3 node1:172.16.73.143

Kubernetes實戰高可用叢集搭建，配置，運維與應用

1-1 K8S導學 1-2 搭建K8S叢集步驟和要點介紹 1-3 搭建三節點Ubuntu環境 1-4 安裝容器引擎 1-5 下載Kubeadm、node元件和命令列工具 1-6 向叢集中加入worker節點 1-7 安裝dashboard和heapste

Flume NG高可用叢集搭建詳解（基於flume-1.7.0）

1、Flume NG簡述 Flume NG是一個分散式，高可用，可靠的系統，它能將不同的海量資料收集，移動並存儲到一個數據儲存系統中。輕量，配置簡單，適用於各種日誌收集，並支援 Failover和負載均衡。並且它擁有非常豐富的元件。Flume NG採用的是三層架構：Agent層，Collecto

FastDFS高可用叢集架構配置搭建

一、基本模組及高可用架構 FastDFS 是餘慶老師開發的一個開源的高效能分散式檔案系統（DFS）。它的主要功能包括：檔案儲存，檔案同步和檔案訪問，以及高容量和負載平衡。 FastDFS 系統有三個角色：跟蹤伺服器(Tracker Server)、儲存伺服器(St

配置MySQL高可用叢集MHA

配置MySQL高可用叢集+++++++++++++++++++主機角色：客戶端 client50資料庫伺服器 mysql51 到 mysql55管理主機 mgm56VIP地址 192.168.4.100拓撲結構： client50 | mysql51主 |

corosync+pacemaker配置高可用叢集

2018-03-02 18:50:21 一、環境介紹： Node1： CentOS6 192.168.9.168 192-168-9-168 CentOS6 192.168.9.176 &n

叢集概述、keepalived介紹、用keepalived配置高可用叢集

根據功能劃分為兩大類：高可用和負載均衡高可用叢集通常為兩臺伺服器，一臺工作，另外一臺作為冗餘，當提供服務的機器宕機，冗餘將接替繼續提供服務實現高可用的開源軟體有：heartbeat、keepalived 負載均衡叢集，需要有一臺伺服器作為分發器，它負責把使用者的請求分發給

RabbitMQ高可用叢集部署及配置+HAproxy負載（原始碼）

1.環境 rabbitmq-1 10.24.43.4 centos6.x rabbitmq-2 10.24.43.5 centos6.x 2.

叢集介紹、keepalived介紹、用keepalived配置高可用叢集、負載均衡叢集介紹、LVS介紹、LVS排程演算法、LVS NAT模式搭建

一、叢集介紹 Linux叢集根據功能劃分為兩大類：高可用和負載均衡。高可用叢集高可用叢集通常為2臺伺服器，一臺工作，另一臺作為冗餘，當提供服務的機器宕機時，冗餘將接替繼續提供服務。實現高可用的開源軟體有：heartbeat、Keepalived，其中hea

8節點(hadoop+yarn+hbase+storm+kafka+spark+zookeeper)高可用叢集詳細配置

配置 hadoop+yarn+hbase+storm+kafka+spark+zookeeper 高可用叢集，同時安裝相關組建：JDK，MySQL，Hive，Flume 環境介紹節點介紹虛擬機器數量：8 臺作業系統版本：CentOS-7-x8

RabbitMQ 高階指南：從配置、使用到高可用叢集搭建

博主說：在專案中，通過 RabbitMQ，咱們可以將一些無需即時返回且耗時的操作提取出來，進行非同步處理，而這種非同步處理的方式大大的節省了伺服器的請求響應時間，從而提高了系統的吞吐量。正文 1 RabbitMQ 簡介 1.1 介紹　　RabbitMQ

基於Sentinel（哨兵）搭建實現Redis高可用叢集

概述 Redis哨兵為Redis提供了高可用性。實際上這意味著你可以使用哨兵模式建立一個可以不用人為干預而應對各種故障的Redis部署。哨兵模式還提供了其他的附加功能，如監控，通知，為客戶端提供配置。下面是在巨集觀層面上哨兵模式的功能列表：監控：哨兵不斷的檢查mast

Redis高可用叢集-哨兵模式（Redis-Sentinel）搭建配置教程【Windows環境】

No cross,no crown . 不經歷風雨，怎麼見彩虹。 Redis哨兵模式，用現在流行的話可以說就是一個“哨兵機器人”，給“哨兵機器人”進行相應的配置之後，這個”機器人”可以7*24小時工作，它能能夠自動幫助你做一些事情，如監控，提醒，自動處

基於keepalived搭建MySQL的高可用叢集

MySQL的高可用方案一般有如下幾種： keepalived+雙主，MHA，MMM，Heartbeat+DRBD，PXC，Galera Cluster 比較常用的是keepalived+雙主，MHA和PXC。對於小公司，一般推薦使用keepalived+雙主，簡單。下面來部署一下配置環境：

Spring Cloud | 第七篇： Eureka叢集高可用的配置

一直在網上查閱資料，配置高可用的叢集，看完了發現還是不明白，或者按照文章的內容一步一步去實現發現根本實現不了，真的很懷疑他們寫的時候是否真的自己測試過了還是大家都是轉發來轉發去的，自己弄了好久，發現沒有一個拿來就可以用的，並且裡面很多的東西也沒有講解清楚，於是打

Hadoop-2.7.6雙namenode配置搭建（HA）高可用叢集部署教程

配置雙namenode的目的就是為了防錯，防止一個namenode掛掉資料丟失，具體原理本文不詳細講解，這裡只說明具體的安裝過程。Hadoop HA的搭建是基於Zookeeper的，關於Zookeeper的搭建可以檢視這裡 hadoop、zookeeper、hbase、spa

十五週一次課 2018.01.26 叢集介紹、keepalived介紹、用keepalived配置高可用叢集

18.1 叢集介紹18.2 keepalived介紹18.345 用keepalived配置高可用叢集1.準備兩臺機器，一個作為master，一個作為backup。兩臺都要裝上keepalived，2.然後我們把nginx作為實現高可用的物件。所以兩臺機器上都要裝nginx。

基於zookeeper的Spark高可用叢集配置

相關推薦