ZooKeeper安裝和配置
一.下載
https://zookeeper.apache.org/
二.本地模式安裝
1.安裝前準備
(1)安裝Jdk
(2)拷貝Zookeeper安裝包到Linux系統下
(3)解壓到指定目錄
tar -zxvf zookeeper-3.4.10.tar.gz -C /opt/module/
2.配置修改
(1)將/opt/module/zookeeper-3.4.10/conf這個路徑下的zoo_sample.cfg復制一份為zoo.cfg;
cp zoo_sample.cfg zoo.cfg
(2)打開zoo.cfg文件,修改dataDir路徑:
vim zoo.cfg
修改如下內容:
dataDir=/opt/module/zookeeper-3.4.10/zkData
(3)在/opt/module/zookeeper-3.4.10/這個目錄上創建zkData文件夾
mkdir zkData
(4)修改log路徑,進入到/bin目錄
vim zkEnv.sh
ZOO_LOG_DIR="/opt/module/zookeeper-3.4.10/logs"
3.操作Zookeeper
(1)啟動Zookeeper
bin/zkServer.sh start
(2)查看進程是否啟動
jps
(3)查看狀態:
bin/zkServer.sh status
(4)啟動客戶端
bin/zkCli.sh
(5)退出客戶端:
quit
(6)停止Zookeeper
bin/zkServer.sh stop
3.配置參數解讀
1.tickTime =2000:通信心跳數,Zookeeper服務器與客戶端心跳時間,單位毫秒 Zookeeper使用的基本時間,服務器之間或客戶端與服務器之間維持心跳的時間間隔,也就是每個tickTime時間就會發送一個心跳,時間單位為毫秒。 它用於心跳機制,並且設置最小的session超時時間為兩倍心跳時間。(session的最小超時時間是2*tickTime)
2.initLimit =10:LF初始通信時限 集群中的Follower跟隨者服務器與Leader領導者服務器之間初始連接時能容忍的最多心跳數(tickTime的數量),用它來限定集群中的Zookeeper服務器連接到Leader的時限。
3.syncLimit =5:LF同步通信時限 集群中Leader與Follower之間的最大響應時間單位,假如響應超過syncLimit * tickTime,Leader認為Follwer死掉,從服務器列表中刪除Follwer。
4.dataDir:數據文件目錄+數據持久化路徑 主要用於保存Zookeeper中的數據。
5.clientPort =2181:客戶端連接端口 監聽客戶端連接的端口。
三.集群安裝
1.集群規劃
在hadopp100,hadoop101,hadoop102上部署,啟動三部虛擬機
2.配置myid文件
1) 在hadoop100機器的/opt/module/zookeeper-3.4.10/zkData目錄下創建一個myid的文件,添加server的對應編號 0
echo >> 0 myid
3.配置zoo.cfg文件,在文件的最末尾添加如下內容
server.0=hadoop100:2888:3888 server.1=hadoop101:2888:3888 server.2=hadoop102:2888:3888
配置參數解讀
server.A=B:C:D。
A是一個數字,表示這個是第幾號服務器;
集群模式下配置一個文件myid,這個文件在dataDir目錄下,這個文件裏面有一個數據就是A的值,Zookeeper啟動時讀取此文件,拿到裏面的數據與zoo.cfg裏面的配置信息比較從而判斷到底是哪個server。
B是這個服務器的地址;
C是這個服務器Follower與集群中的Leader服務器交換信息的端口;
D是萬一集群中的Leader服務器掛了,需要一個端口來重新進行選舉,選出一個新的Leader,而這個端口就是用來執行選舉時服務器相互通信的端口。
4).分發配置文件到hadopp101,hadoop102上,並且修改每個機器的myid文件
xsync /opt/module/zookeeper-3.4.10/
#分別修改為1 和 2
vim myid
如何安裝虛擬機,如何配置集群,如何分發文件,請參考Hadoop系列下文章
4.集群操作
1)分別啟動Zookeeper
bin/zkServer.sh start
2)查看狀態
bin/zkServer.sh status
有兩個follower和一個leader即表示成功
如果啟動不起來,可以查看log文件
ZooKeeper安裝和配置