【Hadoop】HDFS開發手冊（JavaAPI）

阿新 • • 發佈：2018-11-09

文章目錄

前言
準備
Core Code

建立資料夾
建立新檔案
讀取檔案
檔案是否存在
下載檔案從指定目錄
上傳檔案到指定目錄
刪除檔案或資料夾
追加內容
重新命名檔案或資料夾
列出指定資料夾的檔案以及資料夾資訊
列出指定路徑所有檔案資訊

Github
總結

前言

在這裡插入圖片描述

Hadoop家族有很多重要成員,下面列出來的是準備去搞的。

hdfs
hbase
hive
sqoop
zookper

flume

原理的東西，說簡單很簡單，說複雜很複雜。

小編不跟大神比拼，但是會寫一些遇到的坑，思考，總結。

步入正題，HDFS是什麼。HDFS是一個分散式檔案系統。

針對技術學習上的總結方法，我一般持有這幾個點：

來歷、特點、解決的問題、應用場景

維基百科解析：是一種允許檔案透過網上在多臺主機上分享的檔案系統，可讓多機器上的多使用者分享檔案和儲存空間

這篇部落格主要是寫一下Java API的操作，後續更新在伺服器上的HDFS Shell命令。

同步更新Spark。

深入到原始碼和原理，我希望另外寫文章。先把程式碼敲起來，後面就會好奇原始碼和實現的原理了。

大家可以關注程式碼和小編的總結點。

準備

開發環境
依賴引入
瞭解一下HDFS基本操作

既然是檔案系統，開啟你的WIN10系統，看看最常用的操作是什麼呢？

Core Code

建立資料夾

/**
     * 建立資料夾.
     *
     * @throws IOException the io exception
     * @since hui_project 1.0.0
     */
    @Test
    public void testMakeDir() throws IOException {
        fileSystem. 
mkdirs(new Path("D:\\test\\test"));
    }

建立新檔案

/**
     * 建立檔案，引數二true代表存在即覆蓋.
     *
     * @throws IOException the io exception
     * @since hui_project 1.0.0
     */
    @Test
    public void testCreateFile() throws IOException {
        fileSystem.create(new Path("D:\\test\\test\\demo.txt"), true);
    }

    /**
     * 建立新檔案 .
     * 不同於create是 先執行 exists方法檢視檔案是否存在，不存在才建立
     * @throws IOException the io exception
     * @since hui_project 1.0.0
     */
    @Test
    public void testCreateNewFile() throws IOException {
        fileSystem.createNewFile(new Path("D:\\test\\test\\demo.txt"));
    }

讀取檔案

/**
     * 讀取檔案並列印
     *
     * @throws IOException the io exception
     * @since hui_project 1.0.0
     */
    @Test
    public void testReadFile() throws IOException {
        FSDataInputStream fsDataInputStream = fileSystem.open(new Path("D:\\test\\test.txt"));
        IOUtils.copyBytes(fsDataInputStream, System.out, configuration);
    }

檔案是否存在

/**
     * 檔案是否存在.
     *
     * @throws IOException the io exception
     * @since hui_project 1.0.0
     */
    @Test
    public void testExist() throws IOException {
        boolean exists = fileSystem.exists(new Path("D:\\test"));
        System.out.println(exists);
    }

下載檔案從指定目錄

 /**
     * 下載檔案從指定目錄.
     *
     * @throws IOException the io exception
     * @since hui_project 1.0.0
     */
    @Test
    public void downLoadFile() throws IOException {
        fileSystem.copyFromLocalFile(new Path("D:\\test\\distance-final.txt"), new Path("D:\\test\\test\\"));
    }

上傳檔案到指定目錄

/**
     * 上傳檔案到指定目錄.
     *
     * @throws IOException the io exception
     * @since hui_project 1.0.0
     */
    @Test
    public void uploadFile() throws IOException {
        fileSystem.copyFromLocalFile(new Path("D:\\test\\demo.txt"), new Path("D:"));
    }

刪除檔案或資料夾

/**
     * 刪除檔案或資料夾.
     * 引數二的true代表 遞迴刪除
     * @throws IOException the io exception
     * @since hui_project 1.0.0
     */
    @Test
    public void deleteFile() throws IOException {
        fileSystem.delete(new Path("D:/test/test"), true);
    }

追加內容

/**
     * 追加內容.
     *
     * @throws IOException the io exception
     * @since hui_project 1.0.0
     */
    @Test
    public void testAppendContent() throws IOException {
        configuration.set("dfs.support.append", "true");
        FSDataOutputStream fsDataOutputStream = fileSystem.append(new Path("D:/test/test/demo.txt"));
        fsDataOutputStream.write(new String("test something ").getBytes());
    }

重新命名檔案或資料夾

 /**
     * 重新命名檔案或資料夾.
     *
     * @throws IOException the io exception
     * @since hui_project 1.0.0
     */
    @Test
    public void testRename() throws IOException {
        fileSystem.rename(new Path("D:/test/test/demo.txt"), new Path("D:/test/test/demo1.txt"));
    }

列出指定資料夾的檔案以及資料夾資訊

/**
     * 列出指定資料夾的檔案以及資料夾資訊.
     *
     * @throws IOException the io exception
     * @since hui_project 1.0.0
     */
    @Test
    public void testListStatus() throws IOException {
        FileStatus[] fileStatuses = fileSystem.listStatus(new Path("D:/test"));
        for (FileStatus fileStatus : fileStatuses) {
            System.out.println(fileStatus.getPath().toString());
        }
    }

列出指定路徑所有檔案資訊

/**
     * 列出指定路徑所有檔案資訊.
     * listFiles第二個引數 true 遞迴查詢 會把子資料夾的檔案資訊也查找出來
     *
     * @throws IOException the io exception
     * @since hui_project 1.0.0
     */
    @Test
    public void testListFile() throws IOException {
        RemoteIterator<LocatedFileStatus> fileStatusRemoteIterator = fileSystem.listFiles(new Path("D:/test"), true);
        while (fileStatusRemoteIterator.hasNext()) {
            LocatedFileStatus next = fileStatusRemoteIterator.next();
            System.out.println(next.getPath());
        }
    }

Github

github更新了HDFS常用操作

常用操作在com.hui.bigdata.hadoop.hdfs.HDFSTest

https://github.com/ithuhui/hui-bigdata-hadoop

總結

針對技術學習上的總結方法，我一般持有這幾個點：

來歷、特點、解決的問題、應用場景

為什麼會出現他：常說大資料分析，分析的前提是你有資料，那那麼多資料總得找地方存吧。

資料越來越大了，存哪裡？一臺機器不夠，那就多臺。

主要理念就是：分塊，不管檔案本身多大，分塊之後都會變得更易於儲存。

應用場景不用多說了：就是應用在資料的儲存（資料量大）。

特點：

儲存量大（儲存空間）
可執行在廉價通用的伺服器上（降低成本）
不適合訪問要求低延遲的系統（HDFS是為高資料吞吐量應用而設計的，必然以高延遲為代價）
儲存小檔案（分塊儲存，小檔案同樣佔用一塊，儘管不滿一塊）

小博主更新很累的…，由簡單入手，我進步一點，深入一點，就更新更深入的內容，

深入到原始碼和原理，我希望另外寫文章。先把程式碼敲起來，後面就會好奇原始碼和實現的原理了。

請求不多，有錯誤指出來，有問題一起討論。轉載就標註一下作者謝謝~

【Hadoop】HDFS開發手冊（JavaAPI）

文章目錄前言準備 Core Code 建立資料夾建立新檔案讀取檔案檔案是否存在下載檔案從指定目錄上傳檔案到指定目錄刪除檔案或資料夾追加內容重新命名檔案或資

【Spark】SparkRDD開發手冊（JavaAPI函數語言程式設計）

文章目錄前言遇到的大坑！裝備 Core Github 總結前言不用怕，問題不大~ github已更新 scala版過段時間會再更新自誇一下… 老實說,相比那些抄襲來抄襲去的

【20171115】BugFree使用手冊（三）Bugfree界面和後臺管理

結果所有 idt 重新 case 系統切換 cal define 三、Bugfree界面 1. 登錄界面　　如圖所示：　　 2. 主界面　　輸入系統提供的默認管理員用戶名：admin，密碼（原始）：123456；語言選擇默認“簡體中文”。點擊“登錄”按鈕，來到

【20171116】BugFree使用手冊（四）Bugfree的使用：Bug、Test Case和Test Result管理

設定如圖所示關閉 nbsp 管理全部很快自己的解決五、Bug的狀態在BugFree中，一個Bug只有3種狀態：Active、Resolved、Closed。實踐中經常有不熟悉的用戶通過“編輯 (Edit)”來改變所有的狀態，那是不合適的。正確的狀態轉換方法應

【轉】Android開發筆記（序）寫在前面的目錄

animator 進程間通信 scrip cst 調用 receiver 手勢打包數據庫基礎原文：http://blog.csdn.net/aqi00/article/details/50012511 知識點分類一方面寫寫自己走過的彎路掉進去的坑，避免以後

【原創】快速開發MQTT（二）初識MQTT

文章首發於同名微信公眾號：DigCore 歡迎關注同名微信公眾號：DigCore，及時獲取最新技術博文。基本介紹在上篇文章《【原創】快速開發MQTT（一）電子工程師眼中的MQTT》中，對比了串列埠連線和TCP連線，我們知道實現了連線和資料收發之後，接下來就

【Swift】iOS開發筆記（二）

前言　　這個系列主要是一些開發中遇到的坑記錄分享，有助於初學者跨過這些坑，攢夠 7 條發一篇。宣告　　歡迎轉載，但請保留文章原始出處:) 　　部落格園：http://www.cnblogs.com　　農民伯伯： http://over140.cnblogs.com 正文　　1、用

【Swift】iOS開發筆記（一）

前言　　邊開發邊學習，邊攢經驗，彙總一下記錄到這裡宣告　　歡迎轉載，但請保留文章原始出處:) 　　部落格園：http://www.cnblogs.com　　農民伯伯： http://over140.cnblogs.com 1、隱藏/顯示密碼功能　　光設定secureTextEntr

【自考】——軟體開發工具（一）

《軟體開發工具》粗略的看完了一遍，總體的瀏覽嘛，大概瞭解了這本書到底講了些什麼。在拿到這本書之前我也想過這本書可能會有哪些內容，當時認為既然書名為《軟體開發工具》，那書中應該講解

opentcs 夜光開發手冊（四）【針對最新4.12版本】

夜光序言：我是人間惆悵客, 知君何事淚縱橫, 斷腸聲裡憶平生。正文：新特性: 為車輛引入一個顯式整合級別屬性，該屬性表示車輛應該整合到系統中的程度。(將整合級別設定為TO_BE_UTILIZED，取代了以前用於整合車輛的手動

【Hadoop學習之四】HDFS HA搭建（QJM）

環境　　虛擬機器：VMware 10 　　Linux版本：CentOS-6.5-x86_64 　　客戶端：Xshell4　　FTP：Xftp4 　　jdk8 　　hadoop-3.1.1 由於NameNode對於整個HDFS叢集重要性，為避免NameNode單點故障，在叢集裡建立2個或以上NameNode（不

Python自動化開發課堂筆記【Day06】 - Python進階（類）

擴展性程序 lex 類名人物優點 ini 參數 self. 類與對象面向過程的程序設計：　　優點：極大的降低了程序的復雜度　　缺點：一套流水線或者流程就是用來解決一個問題，生產汽水的流水線無法生產汽車，即使能，也是得大改，改一個組件，牽一發而動全身面向對象的程序設計

【轉】Nodejs學習筆記（一）--- 簡介及安裝Node.js開發環境

ack 目錄 javascrip 難度時間網站開發 clas jetbrains 常用目錄學習資料簡介安裝Node.js npm簡介開發工具 Sublime Node.js開發環境配置擴展：安裝多版本管理器學習資料　　1.深入淺出Node.j

【Hadoop】HDFS的執行原理

【Hadoop】HDFS的執行原理一部落格轉自–http://www.daniubiji.cn/archives/596 簡介 HDFS（Hadoop Distributed File System

【Hadoop】HDFS分散式檔案系統

HDFS分散式檔案系統 HDFS基本知識前言目標侷限性 HDFS相關概念塊(Block) HDFS架構名稱節點(NameNode) 資料

【譯】Optaplanner開發手冊本地化: (0)

　　在此之前，針對APS寫了一些理論性的文章；而對於Optaplanner也寫了一些介紹性質，幾少量入門級的幫助初學者走近Optaplanner。在此以後，老農將會按照Optaplanner官方的使用者手冊的結構，按章節地對其進行翻譯，併成型一系列的操作說明文章。在文章中，為了降低對原文的理解難度，有些地方我

循序漸進學.Net Core Web Api開發系列【13】：中介軟體（Middleware）

系列目錄一、概述本篇介紹如何使用中介軟體（Middleware）。二、初步演練先寫幾個中介軟體 public class DemoAMiddleware { private readonly RequestDelegate _next;

【Swift 2.2】iOS開發筆記（三）

　　1、UITableView 中呼叫 UIButton 的 setTitle 會閃　　　　滾動列表時比較明顯，解決辦法： buttonType 改成 custom 即可，但是這樣一來 UIButton 的高亮效果也沒了，但可以自己手動配置 State Config 　　　　2018-

【Swift 3.1】iOS開發筆記（四）

　　一、唱片旋轉效果（360°無限順時針旋轉） func animationRotateCover() { coverImageView.layer.removeAllAnimations() let animation = CABasicAnim

【VSCode】配置完全手冊（編寫中）

前言 VSCode是一個開源的強大程式碼編寫器，但是如果沒有好好的配置使用，會適得其反。這裡總結VSCode的一些配置，方便自己查詢，也方便網友。 1. 編輯器配置 1.1 功能為特定型別檔案指定縮排大小、縮排型別（空格，或tab），是否自動插

【Hadoop】HDFS開發手冊（JavaAPI）

文章目錄

前言

準備

Core Code

建立資料夾

建立新檔案

讀取檔案

檔案是否存在

下載檔案從指定目錄

上傳檔案到指定目錄

刪除檔案或資料夾

追加內容

重新命名檔案或資料夾

列出指定資料夾的檔案以及資料夾資訊

列出指定路徑所有檔案資訊

Github

總結

相關推薦