[轉]Quorum JournalNode作用(hadoop1.x與hadoop2.x對比)

阿新 • • 發佈：2019-01-01

轉載自:
https://blog.csdn.net/bocai8058/article/details/78843608
致謝,如轉載請附上原文出處.

文章目錄

概述
hadoop 1.x與2.x針對性對比
硬體資源要求

概述

HA(High Available)，高可用性叢集，是保證業務連續性的有效解決方案，一般有兩個或兩個以上的節點，且分為活動節點及備用節點。兩個NameNode為了資料同步，會通過一組稱作JournalNodes的獨立程序進行相互通訊。

當active狀態的NameNode的名稱空間有任何修改時，會告知大部分的JournalNodes程序。
standby狀態的NameNode有能力讀取JNs中的變更資訊，並且一直監控edit
log的變化，把變化應用於自己的名稱空間。standby可以確保在叢集出錯時，名稱空間狀態已經完全同步了。

hadoop 1.x與2.x針對性對比

\	hadoop 1.x	hadoop 2.x
節點	只有1個NameNode。HDFS叢集的NN有單點故障問題。每個叢集只有一個單獨的NN，如果NN所在叢集宕機或者程序不可用，整個叢集也將不可用，直到NN被重啟或者指定到別的主機。(如左下圖)	可以同時啟動2個NameNode。 HDFS HA特性通過提供選項，允許在同一個叢集以主動/被動方式，線上執行兩個冗餘的NN(一個處於工作狀態，另一個處於隨時待命狀態)，解決了hadoop1.x單點故障問題。這樣，當一個NameNode所在的伺服器宕機時，可以在資料不丟失的情況下，手工或者自動切換到另一個NameNode提供服務。在一個典型的HA叢集中，每個NameNode是一臺獨立的伺服器。在任一時刻，只有一個NameNode處於active狀態，另一個處於standby狀態。其中，active狀態的NameNode負責所有的客戶端操作，standby狀態的NameNode處於從屬地位，維護著資料狀態，隨時準備切換。
資料同步	將fsimage、edits檔案通過SecondaryNameNode合併。	多個NameNode之間共享資料，可以通過Network File System或者Quorum JournalNode(前者是通過linux共享的檔案系統，屬於作業系統的配置；後者是hadoop自身的東西，屬於軟體的配置)，來保持資料狀態一致。(如右下圖)
同步過程	從 NameNode上下載元資料資訊(fsimage、edits)，然後利用SecondaryNameNode把二者合併，生成新的fsimage，在本地儲存，並將其推送到NameNode，替換舊的fsimage。即是editlogs。	①兩個NameNode為了資料同步，會通過一組稱作JournalNodes的獨立程序進行相互通訊。任何執行在活動NN的editlogs，將持久地記錄到大多數JN裡。備用NN能夠在這些JN裡讀取到editlogs，並且不斷的監控記錄的改變。當備用NN讀取到這些editlogs時，就把它們執行一遍。當發現故障恢復時，備份NN在確保從JN中讀取到所有editlogs後，就將自己提升為活動NN。這就確保了再發生故障恢復前名稱空間已完全同步。②為了提供快速的故障恢復，備用NN擁有最新的塊地址資訊也是非常重要的。為了實現這個要求，DN同時配置有兩個NN的地址，並且同時向兩者傳送塊地址資訊和心跳。③在同一時間裡，保證高可用叢集中只有一個活動NN是至關重要的。否則，兩個NN的狀態將很快出現不一致，資料有丟失的風險，或者其他錯誤的結果。為了確保這種屬性、防止所謂的腦裂場景（split-brain scenario），在同一時間裡，JN只允許一個NN寫editlogs。故障恢復期間，將成為活動節點的NN簡單的獲取寫editlogs的角色，這將有效的阻止其他NN繼續處於活動狀態，允許新活動節點安全的進行故障恢復。(如中下圖)

Hadoop1.x的hdfs結構圖

hadoop 2.x的hdfs結構圖

hadoop2.x JournalNode與NN通訊互動圖

硬體資源要求

為了部署HA(High Available)叢集，需要作如下準備：

NameNode的要求：由HA的架構可知，存在兩個NameNode主機，一個為現役NameNode主機，一個為待機NameNode主機，二者的硬體配置應該相同，同時還要有執行JournalNodes的主機。
JournalNode的要求：由於JournalNode守護程序是相對輕量級的，那麼這些守護程序可與其它Hadoop守護程序，如NameNode、JobTracker或者ResourceManager，執行在相同的主機上。由於edits日誌的改變必須寫入大多數（一半以上）JNs，所以至少存在3個JournalNodes守護程序，這樣系統能夠容忍單個主機故障。當然也可以執行多於3個JournalNodes，但為了增加系統能夠容忍的故障主機的數量，應該執行奇數個JNs。當執行N個JNs時，系統最多可以接受**(N-1)/2個主機故障並能繼續正常執行**。

參與的引用：

https://my.oschina.net/u/189445/blog/661561 |
http://hadoop.apache.org/docs/r2.5.1/hadoop-project-dist/hadoop-hdfs/HDFSHighAvailabilityWithQJM.html | http://blog.csdn.net/skywalker_only/article/details/40078219

[轉]Quorum JournalNode作用(hadoop1.x與hadoop2.x對比)

轉載自: https://blog.csdn.net/bocai8058/article/details/78843608 致謝,如轉載請附上原文出處. 文章目錄概述 hadoop 1.x與2.x針對性對比硬體資源要求

Hadoop1.X 與 Hadoop2.X比較

鑑於好久沒有更新部落格，且最近開始找工作，所以對以往的相關知識進行整理一：Haddop版本介紹 0.20.x版本最後演化成了現在的1.0.x版本 0.23.x版本最後演化成了現在的2.x版本 hadoop 1.0 指的是1.x(0.20.x),0.21,0.22

hadoop1.x與hadoop2.x在HDFS和MapReduce上的區別

HDFS改進 ·hadoop1.x的HDFS體系架構在Hadoop1.x中的NameNode只可能有一個，雖然可以通過SecondaryNameNode與NameNode進行資料同步備份，但是總會存在一定的延時，如果NameNode掛掉，但是如果有部份

初識hadoop框架及hadoop1.x 與hadoop2.x的區別

今天，小編帶大家初識hadoop的相關知識及架構！第二種方式為永久改變主機名，開機不變平行計算框架：mapreduce Yarh:資源管理平臺，任務排程器（2.2.0），hdfs（2.2.0記憶體擴充套件）計算同，管理不同 Hbase：實時分佈資料庫

Hadoop1.X 與 Hadoop2.X區別及改進

一：Haddop版本介紹 0.20.x版本最後演化成了現在的1.0.x版本 0.23.x版本最後演化成了現在的2.x版本 hadoop 1.0 指的是1.x(0.20.x),0.21,0.22 hadoop 2.0 指的是2.x,0.23.x CDH3,CDH4

Hadoop入門進階步步高（六-Hadoop1.x與Hadoop2的區別

六、Hadoop1.x與Hadoop2的區別1、變更介紹Hadoop2相比較於Hadoop1.x來說，HDFS的架構與MapReduce的都有較大的變化，且速度上和可用性上都有了很大的提高，Hadoop2中有兩個重要的變更：l HDFS的NameNodes可以以叢集的方式佈署，

Hadoop入門進階步步高（六）-Hadoop1.x與Hadoop2的區別

六、Hadoop1.x與Hadoop2的區別1、變更介紹Hadoop2相比較於Hadoop1.x來說，HDFS的架構與MapReduce的都有較大的變化，且速度上和可用性上都有了很大的提高，Hadoop2中有兩個重要的變更：l HDFS的NameNodes可以以叢集的方式佈署

Hadoop1.x與Hadoop2的區別

六、Hadoop1.x與Hadoop2的區別 1、變更介紹 Hadoop2相比較於Hadoop1.x來說，HDFS的架構與MapReduce的都有較大的變化，且速度上和可用性上都有了很大的提高，Hadoop2中有兩個重要的變更： l HDFS的NameNodes可以以叢

大資料Hadoop2.x與Hadoop3.x相比較有哪些變化

在這篇文章中，我們將討論Hadoop 2.x與Hadoop 3.x之間的比較。 Hadoop3版本中添加了哪些新功能，Hadoop3中相容的Hadoop 2程式，Hadoop 2和Hadoop 3有什麼區別？我們希望Hadoop 2和Hadoop 3之間的這個功能的區別將幫助回答上述問題。

大資料入門基礎系列之Hadoop1.X、Hadoop2.X和Hadoop3.X的多維度區別詳解（博主推薦）

　　不多說，直接上乾貨！在前面的博文裡，我已經介紹了　　見下面我寫的微信公眾號博文歡迎大家，加入我的微信公眾號：大資料躺過的坑免費給分享同時，大家可以關注我的個人部

Spark2.x 與 Spark1.x 關系

性能提升 courses structure tex data frame datasets spark1.x 基本 Spark2.x 引入了很多優秀特性，性能上有較大提升，API 更易用。在“編程統一”方面非常驚艷，實現了離線計算和流計算 API 的統一，實現了 Spar

MyBatis 學習總結 05 Mybatis3.x與Spring3.x整合 OLD

into 包括 mybatis 方法成對 nec 自動化工具 tty red 　　本文通過加載mybatis-configuration.xml 文件來產生SqlSessionFactory，然後通過SqlSessionFactory去產生sqlSession，然後在通過

python2.X與python3.X爬蟲常用的模塊變化對應

lib req lencod jar pan erro 變化 size -s python2 python3 import urllib2 import urllib.request,urllib.error import urllib.request,url

[轉]System Verilog的概念以及與verilog的對比

層次 req put 我們 gre case語句重定義寬度 pro 原文地址； http://blog.csdn.net/gtatcs/article/details/8970489 SystemVerilog語言簡介 SystemVerilog是一種硬

Python2.X與Python3.X的區別

blog 還在 height 很多 2.7 基本使用所有只能輸入數字 asc 　　2014年11月，Python2.7將在2020年停止的消息發布，並且不會再發布2.8版本，建議用戶盡量升級至3.4以，上版本，原因是Python在最初發布時，在某些設計上存在一些缺陷，比

Python2.x與3??.x版本區別

改變 2.7 兩種 long 取消高端 utf-8 默認 for 循環中文原文：http://www.runoob.com/python/python-2x-3x.html Unicode Python 2 有 ASCII str() 類型，unicode() 是單

當 Xadmin 插件編寫遇到 Django2.x與Pyhton3.x

就是 .com lse tran instance bubuko color 令牌 one 主要的問題是來自於慕課網的（Python升級3.6 強力Django+殺手級Xadmin打造在線教育平臺）需求：給xadmin添加一個導入csv的插件環境：python3.6.5

Python2.x與Python3.x的不同

Python3.x與Python2.x的不同　　我喜歡Python語言，不僅僅是因為人們所說的Python具有簡單易上手、具有強大的庫，更是感覺這是一個有個性的語言，傳統的語言以及應用程式每次的版本更新和升級都是向下相容的，而Python強制縮排的語法更是使得整

GDAL2.x與1.x的主要變化比較（以C++為例說明）

GDAL2.x與1.x的主要變化比較（以C++為例說明） 1、前言 GDAL庫在2015年6月開始釋出了2.0.0版本，同時與1.x的版本保持同步更新，GDAL2.x的最新版本已經發布到2.2.0（2017年4月釋出），並且1.x的最後釋出的版本是在2016年7月1.11.

Python 2.x 與3.x的版本區別介紹

Python因其開源與其語言簡潔優美等優點，受到很多人的喜愛與使用，所以Python的更新換代也很快，這裡就簡單介紹一下2.x 與3.x的版本區別，這些資訊在官網上也都是可以找到的，因為就是官網更改，我們使用的，對於這個資訊我們都是傳遞者。 Python 2.x 與3.x的版本區別介紹

[轉]Quorum JournalNode作用(hadoop1.x與hadoop2.x對比)

文章目錄

概述

hadoop 1.x與2.x針對性對比

硬體資源要求

相關推薦