Hadoop選舉以及副本策略

阿新 • • 發佈：2018-12-18

17.Hadoop選舉以及副本策略

預設是採用投票數大於半數則勝出的邏輯。

選舉流程簡述

目前有5臺伺服器，每臺伺服器均沒有資料，它們的編號分別是1,2,3,4,5,按編號依次啟動，它們的選擇舉過程如下：

伺服器1啟動，給自己投票，然後發投票資訊，由於其它機器還沒有啟動所以它收不到反饋資訊，伺服器1的狀態一直屬於Looking。

伺服器2啟動，給自己投票，同時與之前啟動的伺服器1交換結果，由於伺服器2的編號大所以伺服器2勝出，但此時投票數沒有大於半數，所以兩個伺服器的狀態依然是LOOKING。

伺服器3啟動，給自己投票，同時與之前啟動的伺服器1,2交換資訊，由於伺服器3的編號最大所以伺服器3勝出，此時投票數正好大於半數，所以伺服器3成為領導者，伺服器1,2成為小弟。

伺服器4啟動，給自己投票，同時與之前啟動的伺服器1,2,3交換資訊，儘管伺服器4的編號大，但之前伺服器3已經勝出，所以伺服器4只能成為小弟。

伺服器5啟動，後面的邏輯同伺服器4成為小弟。

HDFS的副本放置策略的基本思想是：

第一種：

一般情況下副本系數為3，HDFS的副本放置策略是：

將第一個副本放在本地節點，

將第二個副本放在本地機架上的另一個節點，

而第三個副本放到不同機架上的節點。

這種方式減少了機架間的寫流量，從而提高了寫的效能。機架故障的機率遠小於節點故障。這種方式並不影響資料可靠性和可用性的限制，並且它確實減少了讀操作的網路聚合頻寬，因為檔案塊僅存在兩個不同的機架，而不是三個。檔案的副本不是均勻的分佈在機架當中，1/3的副本在同一個節點上，1/3副本在同一個機架上，另外1/3個副本均勻地分佈在其他機架上。

第二種副本放置策略：

第一副本：放置在上傳檔案的DataNode上；如果是叢集外提交，則隨機挑選一臺磁碟不太慢，CPU不太忙的節點上；

第二副本：放置在於第一個副本不同的機架節點上；

第三副本：與第二個副本相同機架的不同節點上；

如果還有更多的副本，則隨機放在節點中。

下圖為三副本配置示意圖

Hadoop選舉以及副本策略

17.Hadoop選舉以及副本策略預設是採用投票數大於半數則勝出的邏輯。選舉流程簡述目前有5臺伺服器，每臺伺服器均沒有資料，它們的編號分別是1,2,3,4,5,按編號依次啟動，它們的選擇舉過程如下：伺服器1啟動，給自己投票

Hadoop介紹、儲存模型、副本策略、架構模型（一）

Hadoop簡介 Hadoop 的作者 Doug cutting， Google 在2003年-2004年公開了部分 GFS 和 Mapreduce 思想的細節，以此為基礎 Doug Cutting 等人用了2年業餘時間實現了 DFS 和 Maperduce機制，一個微縮版：Nutc

[Hadoop]HDFS機架感知策略

地址屬性 pipeline repo 傳輸全部信息 node節點得到 HDFS NameNode對文件塊復制相關所有事物負責，它周期性接受來自於DataNode的HeartBeat和BlockReport信息，HDFS文件塊副本的放置對於系統整體的可靠性和性能

【完全分散式Hadoop】（四）新建hadoop使用者以及使用者組，並賦予sudo免密碼許可權

搭建hadoop叢集環境不僅master和slaves安裝的hadoop路徑要完全一樣，也要求使用者和組也要完全一致。因此第一步就是新建使用者以及使用者組。對於新手來言，新建使用者使用者組，並賦予適當的許可權無疑是最大的問題。下面請跟隨我來新建使用者以及使用者組並賦予root許可權。

hibernate三種物件狀態以及載入策略和併發控制

對於物件狀態大家先看這張圖當你的session會話去資料庫中get一個物件也就代表去資料庫裡面查了一次,獲得到的物件也就是資料庫中的資料,當你用get獲取的物件狀態為持久態,也就是你對這個物件進行刪除或者修改的話資料庫中對應的資料也會相應的改變持久狀態的物件也會根據不同的操作變成臨時狀

【HDFS】hadoop的機架感知策略是啥？

瞭解hadoop的或多或少都聽說過機架感知策略，無論是balancer還是jobtracker分配作業、資料副本放置策略都會用到機架感知。那什麼叫機架感知？首先故名思意機架感知就是感知機架，誰感知？就是hadoop系統嘛，更確切地說是hadoop能在系統內部建立一套伺服器

ListView卡頓的原因以及優化策略

重用converView：通過複用converview來減少不必要的view的建立，另外Infalte操作會把xml檔案例項化成相應的View例項，屬於IO操作，是耗時操作。減少findViewB

記憶體管理和GC演算法以及回收策略

記憶體管理和垃圾回收 JVM記憶體組成結構 JVM棧由堆、棧、本地方法棧、方法區等部分組成，結構圖如下所示： JVM記憶體回收 Sun的JVMGenerationalCollecting(垃圾回收)原理是這樣的：把物件分為年青代(Young)、年老代(

Hadoop——HDFS以及MapReduce的一些總結

1、HDFS API簡單操作檔案 package cn.ctgu.hdfs; import java.io.IOException; import java.io.InputStream; import java.net.URL; import java

Hadoop的磁碟寫入策略引發的問題

DataNode掛載的磁碟或者DataNode節點掛載多個磁碟，如果存在一些磁碟大小不一樣，資料在落盤時就可能會出現磁碟使用率不均勻的情況，容量較小的盤容易被寫滿，而容量大的盤還剩很多空間。磁碟寫滿後，影響Hadoop叢集的正常工作。國慶第一天，線上叢集就報出了

hive的資料傾斜以及優化策略

1. hive的資料傾斜介紹：只要在分散式一定有shuffle，避免不了出現數據傾斜，在混淆資料的過程中出現數據分佈不均勻。比如：在MR程式設計中reducetask階中的資料的大小不一致，即很多的資料集中到了一個reducetask中，hive的資料傾斜就是mapreduce的資料傾斜 maptask

hive的數據傾斜以及優化策略

set 創建 sel 並不是 ipc 並排 case exe 經驗 1. hive的數據傾斜介紹：只要在分布式一定有shuffle，避免不了出現數據傾斜，在混淆數據的過程中出現數據分布不均勻。比如：在MR編程中reducetask階中的數據的大小不一致，即很多

快取Memcached以及快取策略

1.什麼是memcached 快取是一種常駐與記憶體的記憶體資料庫，記憶體的讀取速度遠遠快於程式在磁碟讀取資料的速度。我們在設計程式的時候常常會考慮使用快取，將經常訪問的資料放到記憶體上面這樣可以提高訪問資料的速度，同時可以降低磁碟或資料庫的壓力。 memcached就

hadoop知識點總結（一）hadoop架構以及mapreduce工作機制

１，為什麼需要hadoop 資料分析者面臨的問題資料日趨龐大，讀寫都出現效能瓶頸；使用者的應用和分析結果，對實時性和響應時間要求越來越高；使用的模型越來越複雜,計算量

vue-resource與axios和javascript請求資料以及同源策略的

vue-resource：官方提供外掛：github 1、安裝 :cnpm install vue-resource --save 2、引入 :main.裡面引入import VueResource from 'vue-resource'; 3、呼叫:Vue.use

從零開始搭建hadoop分散式叢集環境：（一）新建hadoop使用者以及使用者組

搭建hadoop叢集環境不僅master和slaves安裝的hadoop路徑要完全一樣，也要求使用者和組也要完全一致。因此第一步就是新建使用者以及使用者組。對於新手來言，新建使用者使用者組，並賦予適當的許可權無疑是最大的問題。下面請跟隨我來新建使用者以及使用者組

Unity Socket傳輸 TCP粘包和拆包原因以及解決策略

3. 乙太網的payload大於MTU進行IP分片。MTU指：一種通訊協議的某一層上面所能通過的最大資料包大小。如果IP層有一個數據包要傳，而且資料的長度比鏈路層的MTU大，那麼IP層就會進行分片，把資料包分成若干片，讓每一片都不超過MTU。注意，IP分片可以發生在原始傳送端主機上，也可以發生在中間路由器上

cassandra的資料分佈和副本策略

由於cassandra叢集的每個節點是對等的，所以資料的分佈和副本是在一起的。資料是通過表組織起來的，通過行鍵（主鍵）標識，主鍵決定了資料儲存在哪個節點。每一行會有多個副本(replica)，注意第一份資料也被稱為副本。當建立一個叢集時，必須指定以下內容：虛擬節點：把

新建hadoop使用者以及使用者組

搭建hadoop叢集環境不僅master和slaves安裝的hadoop路徑要完全一樣，也要求使用者和組也要完全一致。因此第一步就是新建使用者以及使用者組。對於新手來言，新建使用者使用者組，並賦予適當的許可權無疑是最大的問題。下面請跟隨我來新建使用者以及使用者組並賦予r

最全面的Hadoop框架以及整個大資料生態介紹

1. hadoop 生態概況Hadoop是一個由Apache基金會所開發的分散式系統基礎架構。使用者可以在不瞭解分散式底層細節的情況下，開發分散式程式。充分利用叢集的威力進行高速運算和儲存。具有可靠、高

Hadoop選舉以及副本策略

相關推薦