Hadoop基礎-HDFS的讀取與寫入過程剖析

阿新 • • 發佈：2018-09-09

簡要介紹 ron data 訪問如果上傳數據 4.2 客戶端訪問文件寫入

　　　　　　　　　　　　　　　　Hadoop基礎-HDFS的讀取與寫入過程剖析

　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　作者：尹正傑

　　本篇博客會簡要介紹hadoop的寫入過程，並不會設計到源碼，我會用圖和文字來描述hdfs的寫入過程。

一.hdfs寫數據流程

技術分享圖片

　　如上圖所示，想要把一個4.2G的文件寫入到hdfs集群中，它是怎麽實現的呢？其步驟簡要如下：

1>.客戶端向NameNode請求在"/user/yinzhengjie/movies/"目錄下上傳一個名稱叫“蒼老師.rmvb”的視頻；

2>.NameNode檢查客戶端是否有權限上傳，如果有返回客戶端可以上傳，否則返回權限被拒絕。

3>.客戶端請求第一個block上傳到哪幾個DataNode服務器上；

4>.NameNode返回3個DataNode節點，分別為DataNode1，DataNode2，DataNode3（如上圖所示）；

5>.客戶端請求DataNode1上傳數據，DataNode1收到請求會繼續調用DataNode2，然後DataNode2再調用DataNode3，將這個同學管道簡歷完成；

6>.DataNode1，DataNode2，DataNode3逐級應答客戶端

7>.客戶端開始往DataNode1上傳第一個block（先從磁盤讀取數據存放到一個本地內存緩沖區），以package為單位，DataNode1收到一個package就會傳給DataNode2，DataNode2傳給DataNode3；DataNode1每傳一個packet會放入一個應答隊列等待應答；

8>.當一個block傳輸完成後，客戶端再次請求NameNode上傳第二個block的服務器。（重復執行3~7步）

二.hdfs讀數據流程

　　如上圖所示，想要把一個4.2G的文件從hdfs集群中讀取，它是怎麽實現的呢？其步驟簡要如下：

1>.客戶端向NameNode請求下載"/user/yinzhengjie/movies/蒼老師.rmvb"的文件；

2>.NameNode通過查詢元數據，如果找到文件塊所在的DataNode地址列表就返回給客戶端，如果沒有找到元數據信息就返回客戶端訪問的資源不存在；

3>.客戶端拿到NameNode的數據之後，挑選一臺DataNode服務器（就近原則，然後隨機）請求讀取數據；

4>.DataNode開始傳輸數據給客戶端（從磁盤裏面讀取數據放入流，以package為單位來做實驗）；

5>.客戶端以package為單位接收，現在本地緩存，然後寫入目標文件；

Hadoop基礎-HDFS的讀取與寫入過程剖析

Hadoop基礎-HDFS遞歸列出文件系統-FileStatus與listFiles兩種方法

AI nag sys package 手動通過 keepal 是否代碼執行　　　　　　　　　　　　Hadoop基礎-HDFS遞歸列出文件系統-FileStatus與listFiles兩種方法　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　

java文件讀取與寫入

文件 public color exc cnblogs 循環 pack delet 根據 package com.myjava; import java.io.*; import java.util.ArrayList; import java.util.Collect

iOS開發WKWebView Cookie的讀取與寫入,與UIWebView的Cookie共享

conf 網絡請求 err trie 引入 mes article app fetch NSHTTPCookieStorage和NSHttpCookie NSHTTPCookieStorage 實現了一個管理Cookie的單例對象(只有一個實例)，每個Cookie都是NSH

Java中XML文件的讀取與寫入

讀取聯系過程樹形樹形結構 java 以及 ade 文件的表現：以 “.xml”為文件擴展名的文件；存儲：樹形結構；用途：存儲以及傳遞信息；利用相同的XML文件將不同的系統聯系起來；在Java程序中如何獲取XML文件的內容？在Java程序中讀取XML文

c++對txt文件的讀取與寫入

lin 一個離開 term file 例子內容存儲 turn 轉自：http://blog.csdn.net/lh3325251325/article/details/4761575 1 #include <iostream> 2 #incl

byte[]讀取與寫入

FileStream fs1 = new FileStream(@"E:\tenp\doc\111.txt", FileMode.Open, FileAccess.Read, FileShare.Read); FileStream fs2 = new FileStream(@"E:\temp\doc

angular1 開啟檔案並另存為（檔案的讀取與寫入）

最近有個需求，在頁面上有個按鈕可以選取檔案然後在匯出到其它地方，說明白點就是檔案的讀取與寫入，下面是例子（例子中用到了fileSave.js github地址：https://github.com/eligrey/FileSaver.js）首先引入fileSave.js i

檔案內容的讀取與寫入

檔案讀取： <f>.read(【size 】) ----- 如果size未給定或為負，則讀入檔案全部內容，若給出size為正，則讀入前size長度 <f>.readline(【size 】) ----- 如果si

文件內容的讀取與寫入

當前位置文件操作全部字節流寫入文件字符串文件內容 see line 文件讀取： <f>.read(【size 】) ----- 如果size未給定或為負，則讀入文件全部內容，若給出size為正，則讀入前size長度 <f>.read

iOS HTTP網路請求Cookie的讀取與寫入(NSHTTPCookieStorage)

當你訪問一個網站時，NSURLRequest都會幫你主動記錄下來你訪問的站點設定的Cookie，如果 Cookie 存在的話，會把這些資訊放在 NSHTTPCookieStorage 容器中共享，當你下次再訪問這個站點時，NSURLRequest會拿著上次儲存下來了的Cookie繼續去請求。同樣適

Scala檔案的讀取與寫入，從控制檯輸入內容

2015年07月07日 16:27:24 kaiseu 閱讀數：15709 標籤： java scala

Unity 檔案讀取與寫入

Resources.LoadAssetAtPath()；僅限於在編輯器內使用 Build後出來的的所有AssetDatabase.LoadAssetAtPath()；的返回值都為null;不建議使用。呼叫路徑為：Assets\Resources\A.FBXRes

Unity3d+Json多物件資料讀取與寫入+JsonUtility實現

這幾天做自己的培訓班的畢業專案，涉及到Json的讀取與寫入，本來想用LitJson的，後來發現5.3以後的版本有自帶的實現，而且很方便，配合System.IO就可以方便的實現，網上這方面資料也不少，但這裡給出更具體的實現，例如Json檔案中不只有一個物件，涉及

Revit二次開發—引數的讀取與寫入

注：本文轉自公眾號：BIMCoder樑老師一、前言在Revit二次開發中，引數是非常重要的組成部分，那麼我們該如何從構件獲取引數並修改該引數。二、方法首先得到一個Element後，有如下

Java讀取與寫入圖片檔案

// FileImageInputStream fis = new FileImageInputStream(new File("timg.jpg")); // File

使用python讀取與寫入資料到excel表

讀取資料 # -*- coding: utf-8 -*- # @File : 讀取資料.py # @Date : 2019-01-05 # @Author : 派森帶你學python # 1.xlrd主要是用來讀取excel檔案 import xlrd # 開啟一個工作

java檔案內容：讀取與寫入

對於java檔案讀取一直比較迷糊，整理了下，日後可以直接翻看。 package baixiaosheng; import java.io.BufferedReader; import java.io.File; import java.io.FileInputStream; import ja

opencv 圖片的讀取與寫入

import org.opencv.core.Core; import org.opencv.core.Mat; import org.opencv.imgcodecs.Imgcodecs; import org.opencv.imgcodecs.*; public clas

Hadoop基礎-HDFS的讀取與寫入過程剖析

相關推薦