hdfs讀寫檔案核心流程詳解巧說

阿新 • • 發佈：2019-02-07

一.hdfs寫資料流程（面試重點） 1）客戶端（fs）向namenode請求上傳檔案，namenode檢查目標檔案是否已存在，父目錄是否存在。 2）namenode返回是否可以上傳。 3）客戶端請求第一個 block上傳到哪幾個datanode伺服器上。 4）namenode返回3個datanode節點，分別為dn1、dn2、dn3。 5）客戶端請求dn1上傳資料，dn1收到請求會繼續呼叫dn2，然後dn2呼叫dn3，(本質上是一個RPC呼叫，建立pipeline)將這個通訊管道建立完成 6）dn1、dn2、dn3逐級應答客戶端 7）客戶端開始往dn1上傳第一個block（先從磁碟讀取資料放到一個本地記憶體快取），以packet為單位，dn1收到一個packet就會傳給dn2，dn2傳給dn3；dn1每傳一個packet會放入一個應答佇列等待應答

8）當一個block傳輸完成之後，客戶端再次請求namenode上傳第二個block的伺服器。（重複執行3-7步） 補充注意： 1.namenode實際客戶端只上傳一個datanode,其餘兩個是namenode完成的。讓datenote自己複製的。然後複製完成以後逐級返回結果給namenode.如果2,3datanode複製失敗，再有namenode分配新的datanode地址。對於客戶端來說預設上傳一個datanode就可以了，其餘的由datanode自己複製。 2.datanode切片是由客戶端完成的。datanode第二三個副本的上傳和第一個上傳是非同步的。 二：hdfs讀出資料流程

1）客戶端向namenode請求下載檔案，namenode通過查詢元資料，找到檔案塊所在的datanode地址。 2）挑選一臺datanode（就近原則，然後隨機）伺服器，請求讀取資料。 3）datanode開始傳輸資料給客戶端（從磁盤裡面讀取資料放入流，以packet為單位來做校驗）。 4）客戶端以packet為單位接收，先在本地快取，然後寫入目標檔案。 三：一致性模型 1）debug除錯如下程式碼

@Test public void writeFile() throws Exception{ // 1建立配置資訊物件 Configuration configuration = new Configuration();

fs = FileSystem.get(configuration); // 2建立檔案輸出流 Path path = new Path("hdfs://hadoop102:8020/user/robot/hello.txt"); FSDataOutputStream fos = fs.create(path); // 3寫資料 fos.write("hello".getBytes()); // 4一致性重新整理 fos.hflush(); fos.close(); }

2）總結寫入資料時，如果希望資料被其他client立即可見，呼叫如下方法 FsDataOutputStream. hflush (); //清理客戶端緩衝區資料，被其他client立即可見

hdfs讀寫檔案核心流程詳解巧說

hdfs讀寫檔案核心流程詳解巧說

笨方法學python16習題【讀寫檔案】最詳解

Hadoop框架：HDFS讀寫機制與API詳解

HDFS 讀寫檔案流程詳解

hdfs中namenode及DataNode，源資料資訊，讀寫檔案的流程等

HDFS讀寫檔案的具體流程

HDFS讀寫檔案

HDFS讀寫檔案中涉及到的幾個思想

sharding-jdbc讀寫分離的使用詳解

Java讀寫鎖ReentrantReadWriteLock原理詳解

HDFS讀寫檔案的過程

讀寫鎖——ReentrantReadWriteLock原理詳解

C++通過jsoncpp類庫讀寫JSON檔案-json用法詳解

大資料筆記--hadoop中的hdfs寫資料流程詳解

解析用PHP讀寫音訊檔案資訊的詳解(支援WMA和MP3)

大資料筆記 1--hadoop中的hdfs寫資料流程詳解

探祕Hadoop生態5：Hbase讀寫流程詳解

HDFS讀寫流程簡介

Hadoop_08_客戶端向HDFS讀寫（上傳）數據流程

postgres預寫式日誌的核心實現詳解-wal記錄讀取

hdfs讀寫檔案核心流程詳解巧說

相關推薦