HDFS基本原理

阿新 • • 發佈：2018-09-05

狀態 rep 定期兩個 report 硬盤空間返回文件上傳時間間隔

1． NameNode概述
a、 NameNode是HDFS的核心。
b、 NameNode也稱為Master。
c、 NameNode僅存儲HDFS的元數據：文件系統中所有文件的目錄樹，並跟蹤整個集群中的文件。
d、 NameNode不存儲實際數據或數據集。數據本身實際存儲在DataNodes中。
e、 NameNode知道HDFS中任何給定文件的塊列表及其位置。使用此信息NameNode知道如何從塊中構建文件。
f、 NameNode並不持久化存儲每個文件中各個塊所在的DataNode的位置信息，這些信息會在系統啟動時從數據節點重建。
g、 NameNode對於HDFS至關重要，當NameNode關閉時，HDFS / Hadoop集群無法訪問。

h、 NameNode是Hadoop集群中的單點故障。
i、 NameNode所在機器通常會配置有大量內存（RAM）。
技術分享圖片

技術分享圖片

2． DataNode概述
a、 DataNode負責將實際數據存儲在HDFS中。
b、 DataNode也稱為Slave。
c、 NameNode和DataNode會保持不斷通信。
d、 DataNode啟動時，它將自己發布到NameNode並匯報自己負責持有的塊列表。
e、當某個DataNode關閉時，它不會影響數據或群集的可用性。NameNode將安排由其他DataNode管理的塊進行副本復制。
f、 DataNode所在機器通常配置有大量的硬盤空間。因為實際數據存儲在DataNode中。

g、 DataNode會定期（dfs.heartbeat.interval配置項配置，默認是3秒）向NameNode發送心跳，如果NameNode長時間沒有接受到DataNode發送的心跳， NameNode就會認為該DataNode失效。
h、 block匯報時間間隔取參數dfs.blockreport.intervalMsec,參數未配置的話默認為6小時.

3． HDFS的工作機制
NameNode負責管理整個文件系統元數據；DataNode負責管理具體文件數據塊存儲；Secondary NameNode協助NameNode進行元數據的備份。
HDFS的內部工作機制對客戶端保持透明，客戶端請求訪問HDFS都是通過向NameNode申請來進行。

技術分享圖片

3.1． HDFS寫數據流程
詳細步驟解析：
1、 client發起文件上傳請求，通過RPC與NameNode建立通訊，NameNode檢查目標文件是否已存在，父目錄是否存在，返回是否可以上傳；
2、 client請求第一個 block該傳輸到哪些DataNode服務器上；
3、 NameNode根據配置文件中指定的備份數量及機架感知原理進行文件分配，返回可用的DataNode的地址如：A，B，C；
註：Hadoop在設計時考慮到數據的安全與高效，數據文件默認在HDFS上存放三份，存儲策略為本地一份，同機架內其它某一節點上一份，不同機架的某一節點上一份。
4、 client請求3臺DataNode中的一臺A上傳數據（本質上是一個RPC調用，建立pipeline），A收到請求會繼續調用B，然後B調用C，將整個pipeline建立完成，後逐級返回client；
5、 client開始往A上傳第一個block（先從磁盤讀取數據放到一個本地內存緩存），以packet為單位（默認64K），A收到一個packet就會傳給B，B傳給C；A每傳一個packet會放入一個應答隊列等待應答。
6、數據被分割成一個個packet數據包在pipeline上依次傳輸，在pipeline反方向上，逐個發送ack（命令正確應答），最終由pipeline中第一個DataNode節點A將pipeline ack發送給client;
7、當一個block傳輸完成之後，client再次請求NameNode上傳第二個block到服務器。

3.2． HDFS讀數據流程
詳細步驟解析：
1、 Client向NameNode發起RPC請求，來確定請求文件block所在的位置；
2、 NameNode會視情況返回文件的部分或者全部block列表，對於每個block，NameNode都會返回含有該block副本的DataNode地址；
3、這些返回的DN地址，會按照集群拓撲結構得出DataNode與客戶端的距離，然後進行排序，排序兩個規則：網絡拓撲結構中距離Client近的排靠前；心跳機制中超時匯報的DN狀態為STALE，這樣的排靠後；
4、 Client選取排序靠前的DataNode來讀取block，如果客戶端本身就是DataNode,那麽將從本地直接獲取數據；
5、底層上本質是建立Socket Stream（FSDataInputStream），重復的調用父類DataInputStream的read方法，直到這個塊上的數據讀取完畢；
6、當讀完列表的block後，若文件讀取還沒有結束，客戶端會繼續向NameNode獲取下一批的block列表；
7、讀取完一個block都會進行checksum驗證，如果讀取DataNode時出現錯誤，客戶端會通知NameNode，然後再從下一個擁有該block副本的DataNode繼續讀。
8、 read方法是並行的讀取block信息，不是一塊一塊的讀取；NameNode只是返回Client請求包含塊的DataNode地址，並不是返回請求塊的數據；
9、最終讀取來所有的block會合並成一個完整的最終文件。

HDFS基本原理

【圖文詳解】HDFS基本原理

合並操作 ear 系統性能重要 logs 允許積累帶寬文件系統本文主要詳述了HDFS的組成結構，客戶端上傳下載的過程，以及HDFS的高可用和聯邦HDFS等內容。若有不當之處還請留言指出。當數據集大小超過一臺獨立的物理計算機的存儲能力時，就有必要對它進行分區，並存

HDFS基本原理

狀態 rep 定期兩個 report 硬盤空間返回文件上傳時間間隔 1． NameNode概述a、 NameNode是HDFS的核心。b、 NameNode也稱為Master。c、 NameNode僅存儲HDFS的元數據：文件系統中所有文件的目錄樹，並跟蹤整個集群中

HDFS基本原理與工作機制（一）——初識HDFS

HDFS簡介 HDFS 源於 Google 在2003年10月份發表的GFS（Google File System）論文。是 GFS 的一個克隆版本 HDFS（Hadoop Distributed File System）是Hadoop專案的核心子專案，是分散式計算中資料

hadoop之hdfs基本原理（二）

一 HDFS基本概念 hdfs檔案被分成塊進行儲存，預設64M，塊是檔案儲存處理的邏輯單元 hdfs有兩個節點，NameNode和DataNode NameNode存放檔案元資料：分別是檔案與資料塊的對映表，資料塊與資料節點的對映表。配置副本策略和處理客戶

HDFS基本原理及資料存取實戰

--------------------------------------------------------------------------------------------------------------- [版權申明：本文系作者原創，轉載請註明出處]

hadoop入門十一（HDFS基本原理和操作）

Hadoop 2.x HDFS新特性 HDFS聯邦 HDFS HA(要用到Zookeeper) HDFS快照解決了namenode單點得問題高可用性我有一個3000個主機，是不是得寫3000個hosts檔案，3000兩兩面密碼，所以在企業級應用

貝葉斯算法的基本原理和算法實現

utf shape less 流程我們 def .sh 詞向量貝葉斯算法一. 貝葉斯公式推導　　樸素貝葉斯分類是一種十分簡單的分類算法，叫它樸素是因為其思想基礎的簡單性：就文本分類而言，它認為詞袋中的兩兩詞之間的關系是相互獨立的，即一個對象的特征向量

JAVA語言開發基本原理

源文件 cli lips font 實現環境 java字節碼類庫 java開發工具 1.java編譯運行過程　　java源文件（.java）經過編譯，編譯為java字節碼文件（.class），JVM來加載.class文件並運行.class文件。 2.JVM 　　不同系

哈希(Hash)與加密(Encrypt)的基本原理、區別及工程應用

class 區別自己裏的 lpad returns .net 角度 table 0、摘要今天看到吉日嘎拉的一篇關於管理軟件中信息加密和安全的文章，感覺非常有實際意義。文中作者從實踐經驗出發，討論了信息管理軟件中如何通過哈希和加密進行數據保護。但是從文章評論

計算機程序的思維邏輯 17 - 繼承實現的基本原理

pass his aoe bin 原理 aer and 思維 bit %E8%AE%A1%E7%AE%97%E6%9C%BA%E7%A8%8B%E5%BA%8F%E7%9A%84%E6%80%9D%E7%BB%B4%E9%80%BB%E8%BE%91%2017%20-%20

計算機程序的思維邏輯 12 - 函數調用的基本原理

san emd insight msm cgo xiang pri car 程序 spring%E6%9C%8D%E5%8A%A1%E5%AE%9A%E4%BD%8D%E5%99%A8%EF%BC%8C%E5%8F%AF%E5%9C%A8%E4%BB%BB%E4%BD%95

防盜鏈的基本原理與實現

rec eal limit ole 站點 new exceptio stub text 1．我的實現防盜鏈的做法，也是參考該位前輩的文章。基本原理就是就是一句話：通過判斷request請求頭的refer是否來源於本站。（當然請求頭是來自於客戶端的，是可偽造的，暫不在本文

Objection基本原理

navi dex https jsb logs implement efault 默認 center 1，Objection 的簡介就是一個依賴註入框架，github地址：https://github.com/atomicobject/objection 2，Objec

【SSH進階之路】Struts基本原理 + 實現簡單登錄（二）

target doctype 掌握 pack insert enter snippet file manage 上面博文，主要簡單的介紹了一下SSH的基本概念，比較宏觀。作為剛開始學習的人可以有一個總體上的認識，個人覺得對學習有非常好的輔助功能，它不不過

【轉】哈希(Hash)與加密(Encrypt)的基本原理、區別及工程應用

phy 理論靈活運用十分實際應用廣泛 tle 多網站 net 0、摘要今天看到吉日嘎拉的一篇關於管理軟件中信息加密和安全的文章，感覺非常有實際意義。文中作者從實踐經驗出發，討論了信息管理軟件中如何通過哈希和加密進行數據保護。但是從文章評論中也可以

Kafka 基本原理

本地 fix streams 均衡 fig rgs exception format 公司簡介 Apache Kafka是分布式發布-訂閱消息系統。它最初由LinkedIn公司開發，之後成為Apache項目的一部分。Kafka是一種快速、可擴展的、設計內在就是分布式的

API Hook基本原理和實現

use 概率缺省後綴 origin gif object cati mov API Hook基本原理和實現 2009-03-14 20:09 windows系統下的編程，消息message的傳遞是貫穿其始終的。這個消息我們可以簡單理解為一個有特定

分布式事務處理基本原理

分布式系統保存 idt 用戶新的標準 nbsp 對數兩個事務是有一系列對系統中數據進行訪問與更新的操作組成的一個基本的程序邏輯執行單元。引入事務的概念有兩個目的，第一，事務對多個並發訪問的應用程序進行隔離，防止彼此幹擾，第二，事務為數據庫操作序列提供了一個失敗回復

zookeeper基本原理

基於同步服務集群設計服務高性能官方可靠需要服務集群對外提供服務的過程中，有很多的配置需要隨時更新，服務間需要協調工作，這些信息如何推送到各個節點？並且保證信息的一致性和可靠性？用Zookeeper實現了一個配置管理中心，利用Zookeeper將配置信

交換機的基本原理與配置

mac地址 console 以太網幀 securecrt 楊書凡交換機工作在數據鏈路層，負責網絡相鄰節點之間的數據通信，並進行流量控制，主要通過幀在對等層間數據傳輸。在物理線路上提供可靠的數據傳輸，對網絡層而言為一條無差錯的線路。 MAC地址計算機聯網的必備硬件是網卡，每