畫圖詳解HDFS檔案上傳流程

阿新 • • 發佈：2020-12-30

HDFS檔案上傳流程

客戶端向NameNode傳送資料上傳請求，這個請求當中包含一個重要的資訊就是檔案的長度資訊。假設該檔案的大小為207M.
```
hadoop fs -put /test.txt /data
```
NameNode接收到客戶端的請求之後會做一系列的檢查
- 檔案是否存在，如果存在，報錯
- 上傳檔案的父目錄是否存在，如果存在，報錯
- 許可權等其他內容檢查
NameNode在檢查通過之後會向客戶端返回儲存節點資訊，返回節點的原則如下：
- 優先返回客戶端所在節點
- 然後返回同客戶端相同機架的節點
- 再返回不同機架的節點
這裡假設返回給test.txt檔案的塊編號為blk_1,blk_2,並且

blk_1所有副本對應的節點是hadoop01,hadoop02,hadoop03

blk_2所有副本對應的節點是hadoop01,hadoop02,hadoop04
客戶端接收到NameNode返回的響應之後，會先對資料進行邏輯切片。即，

blk_1 儲存前128M的資料, 0-127

blk_2 儲存剩餘的資料, 128-206
開始準備上傳檔案，構建上傳通道pipeline。儲存同一個塊的所有節點構建一個數據流通道。

即blk_1 對應一個通道，blk_2 對應一個通道。
開始真正上傳檔案，上傳時以package為單位進行上傳，並且在上傳的過程中對檔案進行物理切片。對於第一個塊，上傳的時候會先上傳到hadoop01,上傳到hadoop01時會先寫到快取中，快取中每接收到一個package的資料就會向下傳遞，同時快取中的資料會持續寫到磁碟中。
當第一個塊的資料上傳完成。即，hadoop01,hadoop02,hadoop03三個節點都上傳完畢之後，上傳通道關閉。
開始上傳第二個塊，重複5，6，7步。
所有資料上傳成功後，會向客戶端返回上傳結果。
客戶端向NameNode返回資訊，告知資料上傳成功

上傳過程中的異常

檔案上傳過程中，如果有一個節點上傳失敗，怎麼辦？hdfs會立即進行一次重試，如果還失敗，會將失敗的節點從pipeline中剔除，並將失敗的節點報告給NameNode。

比如原始的pipeline是：hadoop01--hadoop02--hadoop04，假如hadoop02節點上傳失敗，那麼會將hadoop02節點剔除，上傳通道就變成hadoop01-hadoop04。

hdfs最大的忍受度為至少有一個節點上傳成功，如果所有節點都上傳失敗，那麼這個時候NameNode會重新申請節點，重新構建pipeline。

畫圖詳解HDFS檔案上傳流程

HDFS檔案上傳流程客戶端向NameNode傳送資料上傳請求，這個請求當中包含一個重要的資訊就是檔案的長度資訊。假設該檔案的大小為207M.

畫圖詳解HDFS元資料合併流程

合併元資料的原因首先要知道磁碟和記憶體中都儲存有元資料，磁碟中的原資料是由正在編輯的日誌檔案(edits_inprogress)和映象檔案(fsimage)組成。

FastAPI（24）- 詳解 File，上傳檔案

FastAPI（24）- 詳解 File，上傳檔案前言可以使用 FastAPI 提供的 File 定義客戶端要上傳的檔案

基於python的selenium兩種檔案上傳操作實現詳解

方法一、input標籤上傳如果是input標籤，可以直接輸入路徑，那麼可以直接呼叫send_keys輸入路徑，這裡不做過多贅述，前文有相關操作方法。

TP3.2.3框架檔案上傳操作例項詳解

本文例項講述了TP3.2.3框架檔案上傳操作。分享給大家供大家參考，具體如下：

ssm框架Springmvc檔案上傳實現程式碼詳解

一、上傳： 1）編寫前臺檔案上傳表單。Method必須為post,enctype為mutipart/form-data <body>

python中Django檔案上傳方法詳解

Django上傳檔案最簡單最官方的方法 1.配置media路徑在settings.py中新增如下程式碼：

PHP 實現base64編碼檔案上傳出現問題詳解

一、場景領導：小A同學，我們要做一個樣本上傳進行分析的功能，你看下是否使用base64編碼加進去，這樣客戶端的同學就不需要用form-data方式來上傳了，直接使用json格式就可以上報，可以讓格式上報統一。

node.js express框架實現檔案上傳與下載功能例項詳解

本文例項講述了node.js express框架實現檔案上傳與下載功能。分享給大家供大家參考，具體如下：

詳解Django自定義圖片和檔案上傳路徑(upload_to)的2種方式

最近在做一個仿知乎網站的專案了，裡面涉及很多圖片和檔案上傳。趁此機會我給大家總結下Django自定義圖片和檔案上傳路徑的2種方式吧。

java處理csv檔案上傳示例詳解

前言：示例只是做了一個最最基礎的上傳csv的示例，如果要引用到程式碼中去，還需要根據自己的業務自行新增一些邏輯處理。

JavaScript 使用Ckeditor+Ckfinder檔案上傳案例詳解

目錄一、準備工作二、解壓三、開始整合一、準備工作 Ckeditor_4.5.7_full + Ckfinder__2.6.0

Ajax 檔案上傳進度監聽之upload.onprogress案例詳解

$.ajax實現 <!DOCTYPE html> <html lang=\"en\"> <head> <meta charset=\"UTF-8\" />

php安全攻防利用檔案上傳漏洞與繞過技巧詳解

目錄前言檔案上傳漏洞的一些場景場景一：前端程式碼白名單判斷.jpg|.png|.gif字尾場景二：後端程式碼檢查Content-type欄位場景三：程式碼黑名單判斷.asp|.aspx|.php|.jsp字尾場景四：程式碼擴大黑名單判斷繞過方式—

詳解JavaWeb如何實現檔案上傳和下載功能

目錄1. 檔案傳輸原理及介紹2. Web檔案上傳2.1我們用一個新的方式建立專案2.2 導包2.3 實用類介紹2.4 pom.xml匯入需要的依賴2.5 index.p2.6 info.jsp2.7 FileServlet2.8 配置Servlet2.9 測試結果3. SpringMVC檔案上傳

檔案上傳伺服器-jupyter 中python解壓及壓縮方式

由於並不清楚伺服器具體地址，只有jupyter 連線的情況下，上傳檔案。方法一：用Linux命令

Python連線HDFS實現檔案上傳下載及Pandas轉換文字檔案到CSV操作

1. 目標通過hadoop hive或spark等資料計算框架完成資料清洗後的資料在HDFS上爬蟲和機器學習在Python中容易實現

Springmvc檔案上傳實現流程解析

SpringMVC 中對檔案上傳做了封裝，我們可以更加方便的實現檔案上傳。從 Spring3.1

如何基於js管理大檔案上傳及斷點續傳詳析

目錄前言前端結構後端結構(node + express)基於FormData實現檔案上傳基於BASE64實現檔案上傳BASE64具體方法前端生成檔名傳給後端上傳進度管控大檔案上傳服務端程式碼(大檔案上傳+斷點續傳)總結前言

javaWeb學習總結——檔案上傳、下載

嘿，熊dei，你不得不知道在Web開發中，檔案上傳和下載功能是非常常用的功能，關於檔案上傳，瀏覽器上傳【檔案以流的形式傳輸】——>伺服器端——>Servlet獲取上傳檔案的輸入流——>解析請求引數，這一系列過