BigData_A_A_01-hdfs分散式檔案系統（2）高可用

阿新 • • 發佈：2018-12-22

楔子

Hadoop 3 高可用搭建記錄

1 zookeeper叢集

zoo.cfg 檔案配置資料檔案位置等資訊

#其他使用預設
dataDir=/opt/data/zk
server.1=had2:2888:3888
server.2=had3:2888:3888
server.3=had4:2888:3888

分發到其他機器

 scp -r zookeeper-3.4.6/ had4:`pwd`
 # 使用`pwd` 會把 檔案傳送到其他機器的相同位置

dataDir目錄放置id
在這裡插入圖片描述

zkServer.sh start 啟動(我配置了環境變數)

2 Hadoop配置檔案

需要的都可以參考官方文件

2.1 hadoop-env.sh

export JAVA_HOME=/usr/local/soft/jdk
export HDFS_NAMENODE_USER=root
export HDFS_DATANODE_USER=root
#export HDFS_SECONDARYNAMENODE_USER=root
export HDFS_ZKFC_USER=root
export HDFS_JOURNALNODE_USER=root

2.2 hdfs-site.xml

<configuration> 
 
  <!--檔案副本數量  -->  
  <property> 
    <name>dfs.replication</name>  
    <value>2</value> 
  </property>  
  <property> 
    <name>dfs.nameservices</name>  
    <value>mycluster</value> 
  </property>  
  <property> 
    < 
name>dfs.ha.namenodes.mycluster</name>  
    <value>nn1,nn2</value> 
  </property>  
  <property> 
    <name>dfs.namenode.rpc-address.mycluster.nn1</name>  
    <value>had1:8020</value> 
  </property>  
  <property> 
    <name>dfs.namenode.rpc-address.mycluster.nn2</name>  
    <value>had2:8020</value> 
  </property>  
  <property> 
    <name>dfs.namenode.http-address.mycluster.nn1</name>  
    <value>had1:9870</value> 
  </property>  
  <property> 
    <name>dfs.namenode.http-address.mycluster.nn2</name>  
    <value>had2:9870</value> 
  </property>  
  <!-- JNN節點配置 -->  
  <property> 
    <name>dfs.namenode.shared.edits.dir</name>  
    <value>qjournal://had1:8485;had2:8485;had3:8485/mycluster</value> 
  </property>  
  <!-- 故障轉移代理類 -->  
  <property> 
    <name>dfs.client.failover.proxy.provider.mycluster</name>  
    <value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value> 
  </property>  
  <property> 
    <name>dfs.ha.fencing.methods</name>  
    <value>sshfence</value> 
  </property>  
  <property> 
    <name>dfs.ha.fencing.ssh.private-key-files</name>  
    <value>/root/.ssh/id_rsa</value> 
  </property>  
  <property> 
    <name>dfs.journalnode.edits.dir</name>  
    <value>/opt/data/hadoopha/journal</value> 
  </property>  
  <property> 
    <name>dfs.ha.automatic-failover.enabled</name>  
    <value>true</value> 
  </property> 
</configuration>

2.3 core-site.xml

<configuration>
    <property>
        <name>hadoop.tmp.dir</name>
        <value>/opt/data/hadoop_ha</value>
    </property>
    <property>
        <name>hadoop.http.staticuser.user</name>
        <value>root</value>
    </property>
    <property>
        <name>ha.zookeeper.quorum</name>
        <value>had2:2181,had3:2181,had4:2181</value>
    </property>
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://mycluster</value>
    </property>
</configuration>

3 啟動叢集

# 1 啟動JournalNode守護程式（在各個機器依次啟動）
hdfs --daemon start journalnode
# 2 應首先在其中一個NameNode上執行format命令（hdfs namenode -format）
hdfs namenode -format
# 2_2 格式化後繼續在本機器啟動namenode
hdfs --daemon start namenode
# 3 應該通過執行命令將NameNode元資料目錄的內容複製到其他未格式化的NameNode上
hdfs namenode -bootstrapStandby

3.2 在ZooKeeper中初始化HA狀態

在ZooKeeper中初始化所需的狀態。可以通過從其中一個NameNode主機執行以下命令來執行此操作。

hdfs zkfc -formatZK

在這裡插入圖片描述

3.3 啟動叢集

使用start-dfs.sh啟動叢集
由於配置中已啟用自動故障轉移，因此start-dfs.sh指令碼現在將在執行NameNode的任何計算機上自動啟動ZKFC守護程式。當ZKFC啟動時，它們將自動選擇其中一個NameNode變為活動狀態。

start-dfs.sh

在這裡插入圖片描述

BigData_A_A_01-hdfs分散式檔案系統（2）高可用

楔子 Hadoop 3 高可用搭建記錄 1 zookeeper叢集 zoo.cfg 檔案配置資料檔案位置等資訊 #其他使用預設 dataDir=/opt/data/zk server.1=had2:2888:3888 server.2=had3:2888:3

BigData_A_A_01-hdfs分散式檔案系統（1）全分散式

楔子學習 hadoop(基於hadoop3.1.1)，學習視訊可以參看大資料第二階段：hadoop體系之離線計算 1 前期準備 1.1 hosts修改 win10修改hosts許可權虛擬機器4 臺，分配如下

FastDFS輕量級分散式檔案系統（二）安裝

FastDFS--tracker安裝在192.168.101.3上安裝tracker。下載 tracker和storage使用相同的安裝包，下載地址：http://sourceforge.net/projects/FastDFS/ 或https://github

Linux套接字與虛擬檔案系統（2）：操作和銷燬

接上篇初始化與建立，本篇闡述Socket操作和銷燬兩部分的實現。 Socket操作系統呼叫read(v)、write(v)是使用者空間讀寫socket的一種方法，為了弄清楚它們是怎麼通過VFS將請求轉發到特定協議的實現，下面以read為例（write同理），並假定檔案描述

大資料儲存之分散式檔案系統（一）

1.Google檔案系統（GFS）使用一堆廉價的商用計算機支撐大規模資料處理。 GFSClient：應用程式的訪問介面 Master（主控伺服器）：管理節點，在邏輯上只有一個（還有一臺“影子伺服器“，在主控伺服器失效時提供元資料，但並不是完整的熱備伺服器），儲

fastdfs-安裝部署fastdfs實現分散式檔案系統（一）

在移動網際網路時代，智慧終端，包括手機，平板電腦，物聯網的發展，個人產生的圖片，視訊檔案，文件檔案，其他資料已經非常的多，那麼對於如何處理這些海量的資料，是一個非常重要的環節，一方面要保證資料的安全和完整性，同時又要能夠容易的橫向擴容的存貯系統升級。那麼就需要用到分散式檔案

java B2B2C springmvc mybatis電子商城系統-（七）高可用的分散式配置中心(Spring Cloud Config)

講述了一個服務如何從配置中心讀取檔案，配置中心如何從遠端git讀取配置檔案，當服務例項很多時，都從配置中心讀取檔案，這時可以考慮將配置中心做成一個微服務，將其叢集化，從而達到高可用，架構圖如下：一、準備工作繼續使用上一篇文章的工程，建立一個eureka-server工程，用作服務註

使用python的hdfs包操作分散式檔案系統（HDFS）

===================================================================================== 寫在前邊的話：之前做的Hadoop叢集，組合

Hadoop分散式檔案系統（HDFS）：架構和設計

HDFS被設計成能夠在一個大叢集中跨機器可靠地儲存超大檔案。它將每個檔案儲存成一系列的資料塊，除了最後一個，所有的資料塊都是同樣大小的。為了容錯，檔案的所有資料塊都會有副本。每個檔案的資料塊大小和副本系數都是可配置的。應用程式可以指定某個檔案的副本數目。副本系數可以在檔案建立的時候指定，也可以在之後改

hadoop分散式檔案系統（HDFS）常用API學習

1、org.apache.hadoop.fs.FileSystem 範圍方法返回值描述 addDelegationTokens(String renewer, Cre

hadoop分散式檔案系統（HDFS）常用操作

使用命令hadoop fs可以檢視所有的命令，基本上和linux系統命令類似 1、建立資料夾（預設使用者根目錄） hadoop fs -mkdir peom 2、檢視檔案（可以看到許可權，檔案所屬，以及組屬性） hadoop fs -ls /user/lhy 3、將

Atitit 分散式檔案系統 hdfs nfs fastfs 目錄 1. 分散式檔案系統 1 2. 什麼是FastDFS 1 2.1. FastDFS特性： 1 2.1.1. fastdfs是否可在

Atitit 分散式檔案系統 hdfs nfs fastfs 目錄 1. 分散式檔案系統 1 2. 什麼是FastDFS 1 2.1. FastDFS特性： 1 2.1.1. fastdfs是否可在windows系統下安裝?可以的話,哪位可以..._百度知道 2

Atitit 分散式檔案系統 hdfs nfs fastfs 目錄 1. 分散式檔案系統 1 2. 什麼是FastDFS 1 2.1. FastDFS特性： 1 2.1.1. fastdfs是否可在

Atitit 分散式檔案系統 hdfs nfs fastfs 目錄分散式檔案系統通過獨立檔案伺服器可以解決一些問題，如果某天儲存檔案的那臺服務突然down了怎麼辦？可能你會說，定時將檔案系統備份，這臺down機的時候，迅速切換到另一臺

FastFDS 分散式檔案系統（圖片，靜態資源之類的）

https://www.cnblogs.com/chiangchou/p/fastdfs.htmlFastDFS是由C語言編寫,輕量級開源的分散式檔案系統,在跨境通等B2C商城的專案之中作為圖片伺服器使用,用來儲存商家的Logo,商品的圖片等圖片資源,github地址: ht

在linux Ubuntu16上搭建ceph分散式檔案系統（四節點）實測有效！

特別注意：如果命令直接複製粘貼出現錯誤，則手動輸入可解決參考教程：第一步~~~.準備 4個Ubuntu 16.04 Server 虛擬機器（可以使用VMware或者VirtualBox）配置好每個虛擬機器的IP 以及hostname （很重要！）我的四臺虛擬機器配置如下：（

為什麼我們要用分散式檔案系統（經歷後的感觸）

1、為什麼分散式檔案系統要採用特定的組織結構來儲存檔案？直接按照檔案的原始路徑進行儲存和複製，這樣就可以直接通過應用服務進行靜態化訪問，從而大幅度提升效能。怎麼樣，這個主意不錯吧？等等，我們好像又繞回去了….. 這樣的一個系統，大概是一個共享檔案系統?或者是一個檔案分

雇員信息管理系統（2）管理員數據庫登錄

meta local echo connect 文件的 col orm com span 運行結果如下：　　登錄頁面loginview.php。　　按下登錄按鈕，跳轉到登錄處理頁面loginview.phploginprocess.php，進行數據庫查詢後，登錄失

斯坦福大學-自然語言處理入門筆記第二十一課問答系統（2）

一、問答系統中的總結（summarization）目標：產生一個摘要文字包含那些對使用者重要和相關的資訊總結的應用領域：任何文件的摘要和大綱，郵件摘要等等根據總結的內容，我們可以把總結分為兩類：單文件總結：給出一個單一文件的摘要、大綱、標題

Spring Cloud Config(分散式配置中心)（2）

佔位符配置URL {application}，{profile}，{label}這些佔位符除了用於標識配置檔案的規則外，還可以用於Config Server中對Git倉庫地址的URI配置。 {application}代表了應用名，Config Server會根據客戶端的spring.ap

1、HDFS分散式檔案系統

1、HDFS分散式檔案系統分散式儲存分散式計算 2、hadoop hadoop含有四個模組，分別是 common、 hdfs和yarn。 common 公共模組。 HDFS hadoop distributed file system，hadoop分散式檔案系統，負責檔案的

BigData_A_A_01-hdfs分散式檔案系統（2）高可用

楔子

1 zookeeper叢集

2 Hadoop配置檔案

2.1 hadoop-env.sh

2.2 hdfs-site.xml

2.3 core-site.xml

3 啟動叢集

3.2 在ZooKeeper中初始化HA狀態

3.3 啟動叢集

相關推薦