HDFS寫資料詳細流程

阿新 • • 發佈：2019-02-11

1、 client 發起檔案上傳請求，通過 RPC 與 NameNode 建立通訊，NameNode
檢查目標檔案是否已存在，父目錄是否存在，返回是否可以上傳；
2、 client 請求第一個 block 該傳輸到哪些 DataNode 伺服器上；
3、 NameNode 根據配置檔案中指定的備份數量及機架感知原理進行檔案分
配，返回可用的 DataNode 的地址如：A，B，C；
注：Hadoop 在設計時考慮到資料的安全與高效，資料檔案預設在 HDFS 上存放
三份，儲存策略為本地一份，同機架內其它某一節點上一份，不同機架的某一
節點上一份。
4、 client 請求 3 臺 DataNode 中的一臺 A 上傳資料（本質上是一個 RPC 調
用，建立 pipeline），A 收到請求會繼續呼叫 B，然後 B 呼叫 C，將整個
pipeline 建立完成，後逐級返回 client；
5、 client 開始往 A 上傳第一個 block（先從磁碟讀取資料放到一個本地內
存快取），以 packet 為單位（預設 64K），A 收到一個 packet 就會傳給 B，
B 傳給 C；A 每傳一個 packet 會放入一個應答佇列等待應答。
6、資料被分割成一個個 packet 資料包在 pipeline 上依次傳輸，在
pipeline 反方向上，逐個傳送 ack（命令正確應答），最終由 pipeline
中第一個 DataNode 節點 A 將 pipeline ack 傳送給 client;
7、當一個 block 傳輸完成之後，client 再次請求 NameNode 上傳第二個
block 到伺服器。

HDFS寫資料詳細流程

HDFS寫資料詳細流程

hadoop原始碼解析之hdfs寫資料全流程分析---客戶端處理

HDFS寫資料的詳細流程

HDFS寫資料和讀資料流程

大資料筆記--hadoop中的hdfs寫資料流程詳解

大資料筆記 1--hadoop中的hdfs寫資料流程詳解

hdfs寫操作的流程

HDFS寫資料詳解

hdfs中namenode及DataNode，源資料資訊，讀寫檔案的流程等

三十六、HDFS的寫資料流程及網路拓撲概念

【圖文詳細】HDFS面試題：hdfs 的資料壓縮演算法？

Zookeeper監聽器原理和寫資料流程

大資料筆記 2--hdfs讀資料流程

三十七、機架感知（副本節點選擇）及HDFS讀資料流程

OBS視訊資料輸出流程（模組載入，編碼，推流）詳細說明

hbase 讀寫資料流程----文字簡介

hbase 寫資料，存資料，讀資料的詳細過程

Hadoop分散式檔案系統——HDFS概念以及hdfs讀寫資料

HBase讀寫詳細流程

hadoop put內部呼叫，hdfs寫檔案流程

HDFS寫資料詳細流程

相關推薦