hadoop 元件 hdfs架構及讀寫流程

阿新 • • 發佈：2020-10-20

hadoop 元件 hdfs架構及讀寫流程

一 . Namenode

Namenode 是整個系統的管理節點就像一本書的目錄，儲存檔案資訊，地址，接受使用者請求，等

二 . Datanode

提供真實的檔案資料，儲存服務

檔案塊（block）是基礎的最基本的儲存單元

2.1塊儲存原理

hdfs為什麼分塊而不是分檔案

大小不一

io不均衡：負載不均衡

一般預設為64或者128M

多副本預設為三個

Client 端，同一機架一個，另一機架一個

三 . 讀寫原理

有一個檔案FileA，100M大小。Client將FileA寫入到HDFS上。

HDFS按預設配置。

HDFS分佈在三個機架上Rack1，Rack2，Rack3。

a.Client將FileA按64M分塊。分成兩塊，block1和Block2;

b.Client向nameNode傳送寫資料請求，如圖藍色虛線①------>。

c.NameNode節點，記錄block資訊。並返回可用的DataNode，如粉色虛線②--------->。

Block1: host2,host1,host3

Block2: host7,host8,host4

原理：

NameNode具有RackAware機架感知功能，這個可以配置。

若client為DataNode節點，那儲存block時，規則為：副本1，同client的節點上；副本2，不同機架節點上；副本3，同第二個副本機架的另一個節點上；其他副本隨機挑選。

若client不為DataNode節點，那儲存block時，規則為：副本1，隨機選擇一個節點上；副本2，不同副本1，機架上；副本3，同副本2相同的另一個節點上；其他副本隨機挑選。

d.client向DataNode傳送block1；傳送過程是以流式寫入。

流式寫入過程，

1>將64M的block1按64k的package劃分;

2>然後將第一個package傳送給host2;

3>host2接收完後，將第一個package傳送給host1，同時client想host2傳送第二個package；

4>host1接收完第一個package後，傳送給host3，同時接收host2發來的第二個package。

5>以此類推，如圖紅線實線所示，直到將block1傳送完畢。

6>host2,host1,host3向NameNode，host2向Client傳送通知，說“訊息傳送完了”。如圖粉紅顏色實線所示。

7>client收到host2發來的訊息後，向namenode傳送訊息，說我寫完了。這樣就真完成了。如圖黃色粗實線

8>傳送完block1後，再向host7，host8，host4傳送block2，如圖藍色實線所示。

9>傳送完block2後，host7,host8,host4向NameNode，host7向Client傳送通知，如圖淺綠色實線所示。

10>client向NameNode傳送訊息，說我寫完了，如圖黃色粗實線。。。這樣就完畢了。

分析，通過寫過程，我們可以瞭解到：

①寫1T檔案，我們需要3T的儲存，3T的網路流量貸款。

②在執行讀或寫的過程中，NameNode和DataNode通過HeartBeat進行儲存通訊，確定DataNode活著。如果發現DataNode死掉了，就將死掉的DataNode上的資料，放到其他節點去。讀取時，要讀其他節點去。

③掛掉一個節點，沒關係，還有其他節點可以備份；甚至，掛掉某一個機架，也沒關係；其他機架上，也有備份。

讀操作：

讀操作就簡單一些了，如圖所示，client要從datanode上，讀取FileA。而FileA由block1和block2組成。

那麼，讀操作流程為：

a.client向namenode傳送讀請求。

b.namenode檢視Metadata資訊，返回fileA的block的位置。

block1:host2,host1,host3

block2:host7,host8,host4

c.block的位置是有先後順序的，先讀block1，再讀block2。而且block1去host2上讀取；然後block2，去host7上讀取；

上面例子中，client位於機架外，那麼如果client位於機架內某個DataNode上，例如,client是host6。那麼讀取的時候，遵循的規律是：

優選讀取本機架上的資料。

posted @ 2017-07-31 10:43 菜鳥的進擊閱讀(...) 評論(...) 編輯收藏

hadoop 元件 hdfs架構及讀寫流程

hadoop 元件 hdfs架構及讀寫流程一 . Namenode Namenode 是整個系統的管理節點就像一本書的目錄，儲存檔案資訊，地址，接受使用者請求，等

hbase架構及讀寫流程

1. 整體架構各角色之間的關係叢集部署架構 flowchart TB A[Master] & B[zookeeper] --> C[RegionServer] & D[RegionServer] & E[RegionServer]

hdfs架構以及讀寫流程

前言 HDFS 是一個能夠面向大規模資料使用的，可進行擴充套件的檔案儲存與傳遞系統。是一種允許檔案通過網路在多臺主機上分享的檔案系統，可讓多機器上的多使用者分享檔案和儲存空間。讓實際上是通過網路來訪問

Ceph 細節原理及讀寫流程

目錄 Ceph 細節原理 OSD daemon PG 的概念 PG 中 OSD 組長是如何建立的 PG 的狀態 PG 內 OSD 的資料校驗方式

DAY.1-Ceph元件、資料讀寫流程、叢集搭建及RBD使用

一、Ceph元件：　　1.OSD（Object Storage Daemon）　　功能：Ceph OSDs（物件儲存守護程式ceph-osd）：提供資料儲存，作業系統上的一個磁碟就是一個OSD守護程式，用於處理ceph叢集資料複製、回覆、重新平衡，並通

大資料基石之 Hadoop 的讀寫流程與 2.X 架構

Hadoop 讀寫流程與 2.X 架構安全模式叢集啟動時的一個狀態，處於安全模式的狀態下，只向客戶端提供檔案的只讀檢視

hadoop入門(12)：hdfs的讀寫流程

hdfs的寫入流程檔案具體上傳流程如下：建立檔案： HDFS client向HDFS寫資料先呼叫DistributedFileSystem.create()

帶你入坑大資料（二） --- HDFS的讀寫流程和一些重要策略

前言前情回顧如果說上一篇是在闡述HDFS最基礎的理論知識，這一篇就是HDFS的主要工作流程，和一些較為有用的策略

HDFS讀寫流程（重點）

@ 目錄一、寫資料流程舉例：二、異常寫流程讀資料流程一、寫資料流程 ①服務端啟動HDFS中的NN和DN程式

HDFS的讀寫流程

HDFS的讀寫流程 HDFS寫流程（上傳流程）需要的東西：要上傳的檔案、客戶端Client、NameNode首先，需要在客戶端Client上建立一個分散式檔案系統的物件（DistributedFileSystem），然後客戶端申請向NameNod

HDFS04 HDFS的讀寫流程

HDFS的讀寫流程(面試重點) HDFS寫資料流程客服端把D://ss.avi檔案傳送到叢集 1.首先需要建立一個Distributed FileSystem（分散式檔案系統）客服端。向NameNode請求上傳檔案。上傳到/user/atguigu/ss.avi路徑。

HDFS讀寫流程

兩個重要概念： NameNode：領導級別。管理資料塊對映；處理客戶端的讀寫請求；配置副本策略；管理HDFS的名稱空間；

hdfs的塊大小以及hdfs的讀寫流程

hdfs上的檔案是以塊為單位進行儲存的大小一般設定為128m，不能太小，也不能太大。

Docker實現Mariadb分庫分表及讀寫分離功能

一、簡介本文使用docker實現mysql主從配置，讀寫分離、分庫分表等功能。二、環境準備

PHP檔案開啟關閉及讀寫操作示例解析

前言 PHP支援檔案上傳功能，因此學習PHP檔案的相關操作是必須的，這篇筆記會去記錄PHP檔案系統的相關知識。

【osd】ceph讀寫流程

概述 OSD是RADOS叢集的基本儲存單元。 PG(placement group)從名字可理解為放置策略組，它是物件的集合，該集合裡的所有物件都具有相同的放置策略：物件的副本都分佈在相同的OSD列表上。一個物件只能屬於一個PG，一

Python讀寫csv檔案流程及異常解決

逗號分隔值（Comma-Separated Values，CSV，有時也稱為字元分隔值，因為分隔字元也可以不是逗號），其檔案以純文字形式儲存表格資料（數字和文字）。純文字意味著該檔案是一個字元序列，不含必須像二進位制數字那樣被

HDFS讀寫資料流程

HDFS寫資料流程資料寫入流程客戶端向namenode請求上傳檔案，namenode檢查目標檔案是否已存在，父目錄是否存在。

1.5.5 HDFS讀寫解析-hadoop-最全最完整的保姆級的java大資料學習資料

目錄 1.5.5 HDFS讀寫解析 1.5.5.1 HDFS讀資料流程 1.5.5.2 HDFS寫資料流程 1.5.5 HDFS讀寫解析

HDFS的讀寫機制

本篇部落格講解了HDFS的讀機制和寫機制，通過一個例項演示了HDFS的檔案儲存過程，非常通俗易懂。

hadoop 元件 hdfs架構及讀寫流程

一 . Namenode

二 . Datanode

2.1塊儲存原理

三 . 讀寫原理

相關推薦