Hadoop叢集搭建-04安裝配置HDFS

阿新 • • 發佈：2019-07-22

HDFS是配合Hadoop使用的分散式檔案系統，分為

namenode: nn1.hadoop nn2.hadoop

datanode: s1.hadoop s2.hadoop s3.hadoop

(看不明白這5臺虛擬機器的請看前面 01前期準備 )

解壓配置檔案

[hadoop@nn1 hadoop_base_op]$ ./ssh_all.sh mv /usr/local/hadoop/etc/hadoop /usr/local/hadoop/etc/hadoop_back

[hadoop@nn1 hadoop_base_op]$ ./scp_all.sh ../up/hadoop.tar.gz /tmp/

[hadoop@nn1 hadoop_base_op]$ #批量將自定義配置 壓縮包解壓到/usr/local/hadoop/etc/

#批量檢查配置是否正確解壓
[hadoop@nn1 hadoop_base_op]$ ./ssh_all.sh head /usr/local/hadoop/etc/hadoop/hadoop-env.sh

[hadoop@nn1 hadoop_base_op]$ ./ssh_root.sh chmown -R hadoop:hadoop /usr/local/hadoop/etc/hadoop
[hadoop@nn1 hadoop_base_op]$ ./ssh_root.sh chmod -R 770 /usr/local/hadoop/etc/hadoop

初始化HDFS

流程：

啟動zookeeper
啟動journalnode
啟動zookeeper客戶端，初始化HA的zookeeper資訊
對nn1上的namenode進行格式化
啟動nn1上的namenode
在nn2上啟動同步namenode

啟動nn2上的namenode
啟動ZKFC
啟動dataname

1.檢視zookeeper狀態

[hadoop@nn1 zk_op]$ ./zk_ssh_all.sh /usr/local/zookeeper/bin/zkServer.sh status
ssh hadoop@"nn1.hadoop" "/usr/local/zookeeper/bin/zkServer.sh status"
ZooKeeper JMX enabled by default
Using config: /usr/local/zookeeper/bin/../conf/zoo.cfg
Mode: follower
OK!
ssh hadoop@"nn2.hadoop" "/usr/local/zookeeper/bin/zkServer.sh status"
ZooKeeper JMX enabled by default
Using config: /usr/local/zookeeper/bin/../conf/zoo.cfg
Mode: leader
OK!
ssh hadoop@"s1.hadoop" "/usr/local/zookeeper/bin/zkServer.sh status"
ZooKeeper JMX enabled by default
Using config: /usr/local/zookeeper/bin/../conf/zoo.cfg
Mode: follower
OK!

看到兩個follower和一個leader說明正常執行，如果沒有，就用下邊的命令啟動

[hadoop@nn1 zk_op]$ ./zk_ssh_all.sh /usr/local/zookeeper/bin/zkServer.sh start

2.啟動journalnode

這個玩意就是namenode的同步器。

#在nn1上啟動journalnode
[hadoop@nn1 zk_op]$ hadoop-daemon.sh start journalnode 

#在nn2上啟動journalnode
[hadoop@nn1 zk_op]$ hadoop-daemon.sh start journalnode

#可以分別開啟log來檢視啟動狀態
[hadoop@nn1 zk_op]$ tail /usr/local/hadoop-2.7.3/logs/hadoop-hadoop-journalnode-nn1.hadoop.log
2019-07-22 17:15:54,164 INFO org.apache.hadoop.ipc.Server: Starting Socket Reader #1 for port 8485
2019-07-22 17:15:54,190 INFO org.apache.hadoop.ipc.Server: IPC Server Responder: starting
2019-07-22 17:15:54,191 INFO org.apache.hadoop.ipc.Server: IPC Server listener on 8485: starting
#發現IPC通訊已經建立起來了，journalnode程序在8485

3.初始化HA資訊(僅第一次執行，以後不需要)

[hadoop@nn1 zk_op]$ hdfs zkfc -formatZK
[hadoop@nn1 zk_op]$ /usr/local/zookeeper/bin/zkCli.sh
[zk: localhost:2181(CONNECTED) 0] ls /
[zookeeper, hadoop-ha]
[zk: localhost:2181(CONNECTED) 1] quit
Quitting...

4.對nn1上的namenode進行格式化(僅第一次執行，以後不需要)

[hadoop@nn1 zk_op]$ hadoop namenode -format
#出現下邊的說明初始化成功
#19/07/22 17:23:09 INFO common.Storage: Storage directory /data/dfsname has been successfully formatted.

5.啟動nn1的namenode

[hadoop@nn1 zk_op]$ hadoop-daemon.sh start namenode
[hadoop@nn1 zk_op]$ tail /usr/local/hadoop/logs/hadoop-hadoop-namenode-nn1.hadoop.log
#
#2019-07-22 17:24:57,321 INFO org.apache.hadoop.ipc.Server: IPC Server Responder: starting
#2019-07-22 17:24:57,322 INFO org.apache.hadoop.ipc.Server: IPC Server listener on 9000: starting
#2019-07-22 17:24:57,385 INFO org.apache.hadoop.hdfs.server.namenode.NameNode: NameNode RPC up at: nn1.hadoop/192.168.10.6:9000
#2019-07-22 17:24:57,385 INFO org.apache.hadoop.hdfs.server.namenode.FSNamesystem: Starting services required for standby state
#2019-07-22 17:24:57,388 INFO org.apache.hadoop.hdfs.server.namenode.ha.EditLogTailer: Will roll logs on active node at nn2.hadoop/192.168.10.7:9000 every 120 seconds.
#2019-07-22 17:24:57,394 INFO org.apache.hadoop.hdfs.server.namenode.ha.StandbyCheckpointer: Starting standby checkpoint thread...
#Checkpointing active NN at http://nn2.hadoop:50070
#Serving checkpoints at http://nn1.hadoop:50070

6.在nn2機器上同步nn1的namenode狀態(僅第一次執行，以後不需要)

我們來到nn2的控制檯！

###########一定要在nn2機器上執行這個！！！！############
[hadoop@nn2 ~]$ hadoop namenode -bootstrapStandby
=====================================================
About to bootstrap Standby ID nn2 from:
           Nameservice ID: ns1
        Other Namenode ID: nn1
  Other NN's HTTP address: http://nn1.hadoop:50070
  Other NN's IPC  address: nn1.hadoop/192.168.10.6:9000
             Namespace ID: 1728347664
            Block pool ID: BP-581543280-192.168.10.6-1563787389190
               Cluster ID: CID-42d2124d-9f54-4902-aa31-948fb0233943
           Layout version: -63
       isUpgradeFinalized: true
=====================================================
19/07/22 17:30:24 INFO common.Storage: Storage directory /data/dfsname has been successfully formatted.

7.啟動nn2的namenode

還是在nn2控制檯執行！！

[hadoop@nn2 ~]$ hadoop-daemon.sh start namenode
#檢視log來看看有沒有啟動成功
[hadoop@nn2 ~]$ tail /usr/local/hadoop-2.7.3/logs/hadoop-hadoop-namenode-nn2.hadoop.log

8.啟動ZKFC

這時候在nn1和nn2分別啟動ZKFC，這時候兩臺機器的namenode，一個變成active一個變成standby！！ZKFC實現了HA高可用的自動切換！！

#############在nn1執行#################
[hadoop@nn1 zk_op]$ hadoop-daemon.sh start zkfc

#############在nn2執行####################
[hadoop@nn2 zk_op]$ hadoop-daemon.sh start zkfc

這時候在瀏覽器輸入地址訪問兩臺機器的hadoop介面

http://192.168.10.6:50070/dfshealth.html#tab-overview

http://192.168.10.7:50070/dfshealth.html#tab-overview

這兩個有一個active有一個是standby狀態。

9.啟動dataname就是啟動後三臺機器

########首先確定slaves檔案裡存放了需要配置誰為datanode
[hadoop@nn1 hadoop]$ cat slaves
s1.hadoop
s2.hadoop
s3.hadoop
###########在顯示為active的機器上執行##############
[hadoop@nn1 zk_op]$ hadoop-daemons.sh start datanode

10.檢視硬碟容量

開啟剛才hadoop網頁，檢視hdfs的硬碟格式化好了沒有。

這裡是HDFS系統為每臺實體機器的硬碟預設預留了2G(可以在配置檔案hdfs-site.xml裡更改)，然後實際用來做hdfs的是每臺機器15G，所以三臺一共45G。

如圖成功配置好HDFS。

之前寫的文章在這裡：

Hadoop叢集搭建-03編譯安裝hadoop

Hadoop叢集搭建-02安裝配置Zookeeper

Hadoop叢集搭

Hadoop叢集搭建-04安裝配置HDFS

Hadoop叢集搭建-03編譯安裝hadoop Hadoop叢集搭建-02安裝配置Zookeeper Hadoop叢集搭建-0

Hadoop叢集搭建-05安裝配置YARN

Hadoop叢集搭建-04安裝配置HDFS Hadoop叢集搭建-03編譯安裝hadoop Hadoop叢集搭建-

Hadoop叢集搭建-02安裝配置Zookeeper

Hadoop叢集搭建-05安裝配置YARN Hadoop叢集搭建-04安裝配置HDFS Hadoo

Hadoop叢集搭建通過指令碼配置hosts檔案

此指令碼需要expect命令，使用前確認一下機器收否有安裝：which expect 思路：1.編寫好要追加到hosts檔案內容的檔案（IP_hosts_test） 2.編寫指令碼檔案testRead.sh（巢狀expect，實現自動登入），讀取上面

HDFS環境搭建（單節點配置） hadoop叢集搭建（hdfs）

【參考文章】：hadoop叢集搭建（hdfs） 1. Hadoop下載　　官網下載地址：　　https://hadoop.apache.org/releases.html，進入官網根據自己需要下載具體的安裝包　　清華大學安裝包的映象檔案下載地址：　　https://mirrors.tuna.

ssh無密登入配置詳解（hadoop叢集搭建）

ssh無密登入原理注：私鑰和公鑰是每個使用者獨有的，而不是機器或者伺服器的，比如一臺電腦或者伺服器或者虛擬機器，可以同時存在多個使用者，但不同使用者需要遠端登入其他伺服器或者虛擬機器時，都必須配置各自的私鑰和公鑰，而且使用者之間的各不相同常用命令 ssh ip(遠端登入也可

本地搭建hadoop叢集--kylin的安裝（叢集部署）

kylin官方安裝文件 http://kylin.apache.org/cn/docs/install/configuration.html 總結： 1、關於麒麟高可用涉及負載均衡官網都說超出範圍了，安裝只考慮安裝的事情，其餘的先忽略 2、kylin在啟動的時候會自動檢測你本地h

本地搭建hadoop叢集--sqoop的安裝.1.4.7 使用db2

安裝 1、解壓tar包 2、進入conf目錄 3、修改配置檔案 cp -a sqoop-env-template.sh sqoop-env.sh vm sqoop-env.sh export HADOOP_COMMON_HOME=/opt/mo

Redis叢集安裝--叢集搭建及密碼配置遇到的一些問題

網上關於Redis叢集安裝配置的文章很多,也比較全面，但每個人的需求不一樣，本文搭建一個配置密碼的Redis叢集過程其中遇到的一些問題其中我見到的以這篇文章最詳細https://www.cnblogs.com/hello-daocaoren/p/843190

docker環境下搭建hadoop叢集(ubuntu16.04 LTS系統）

我的思路是這樣：安裝ubuntu系統---->下載docker---->在docker里拉取hadoop映象---->在此映象裡建立三個容器(Master、Slave1、Slave2)---->完成完全分散式 1. 安裝ubuntu系統(無論你

Liunx系統Hadoop叢集搭建配置

下面是hadoop安裝流程進入下載頁面 http://archive.apache.org/dist/ 找到hadoop點選進入 2.在這個頁面點選common進去後可以看見各種版本的hadoop 3.在這裡我選擇安裝2.7.3版本的 4.點選進入下載t

hadoop叢集搭建(一)：系統安裝（centos7+vmware12）

叢集作業系統安裝（centos7+vmware12）環境說明作業系統 CentOS-7-x86_64-DVD-1611下載地址：官網虛擬機器 VMware Workstat

Hadoop叢集搭建(HDFS和Yarn叢集)

hadoop叢集搭建(HDFS和Yarn叢集) 1.安裝hadoop2.7.4 上傳hadoop的安裝包到伺服器 hadoop-2.7.4-with-centos-6.7.tar.gz 解壓安裝包 tar zxvf hadoop-2.7.4-wit

hadoop叢集搭建HDFS、HA、 YARN

hadoop2.0已經發布了很多穩定版本，增加了很多特性，比如HDFS HA、YARN等。最新的hadoop-2.7.2又增加了YARN HA 1、環境準備修改主機名、IP地址。這些在之前部落格有提過就不再寫了。配置IP地址和主機名對映關係。 sud

Hadoop叢集搭建——環境配置

一、叢集搭建注意問題說明 1、此處叢集環境搭建我使用了三臺主機進行模擬，分別為： hadoop-series.bxp.com hadoop-series1.bxp.com hadoop-series2.bxp.com 2、叢集搭建前需要注意的問題：

Hadoop叢集搭建-03編譯安裝hadoop

Hadoop叢集搭建-05安裝配置YARN Hadoop叢集搭建-04安裝配置HDFS Hadoo

ubuntu16.04安裝配置nagios

group sent 內容 OS 重新啟動 open ln -s rpe conf 參考博文:https://www.howtoing.com/ubuntu-nagios/ 該博文真實有效可供參考，按照步驟，基本可以成功一.安裝的先決條件 sudo apt-get ins

Ubuntu16.04安裝配置和使用ctags

刪除可執行 exe path opencv 了吧 -- sta ntc Ubuntu16.04安裝配置和使用ctags by ChrisZZ ctags可以用於在vim中的函數定義跳轉。在ubuntu16.04下默認提供的ctags是很老很舊的ctags，快要發黴的版本（

Hadoop----叢集搭建指南（下卷）

前言什麼是Hadoop? Apache Hadoop is a framework for running applications on large cluster built of commodity hardware. The Hadoop framewor

Hadoop----叢集搭建指南（中卷）

前言本文的搭建基於上卷的配置，環境不再一一贅述。網路配置好的5臺節點均可相互ping通，對於節點hadoop1(192.168.20.2)可以ping同其餘四臺hadoop2(192.168.20.3)、hadoop3(192.168.20.4)、hadoop4(192.16

Hadoop叢集搭建-04安裝配置HDFS

相關推薦