第三課：java開發hdfs

阿新 • • 發佈：2018-08-07

node 執行需要 public conf iss import lean logging

(1)關於hdfs小結

hadoop由hdfs + yarn + map/reduce組成，

hdfs是數據庫存儲模塊，主要由1臺namenode和n臺datanode組成的一個集群系統，

datanode可以動態擴展，文件根據固定大小分塊（默認為128M），

每一塊數據默認存儲到3臺datanode，故意冗余存儲，防止某一臺datanode掛掉，數據不會丟失。

HDFS = NameNode + SecondaryNameNode + journalNode + DataNode

hdfs的典型應用就是：百度雲盤

（2）修改hadoop.tmp.dir默認值

hadoop.tmp.dir默認值為/tmp/hadoop-${user.name}，由於/tmp目錄是系統重啟時候會被刪除，所以應該修改目錄位置。
修改core-site.xml（在所有節點上都修改）

[root@master ~]#  vim core-site.xml

技術分享圖片

修改完namenode和datanode上的hadoop.tmp.dir參數後，需要格式化namenode，在master上執行：

[root@master ~]# hdfs namenode -format

（4）測試期間關閉權限檢查

為了簡單起見，需要關閉權限檢查，需要在namenode的hdfs-site.xml上，添加配置：

<property>
    <name>dfs.permissions.enabled</name>
    <value>false</value>
</property>

重新啟動namenode:

[root@master ~]# hadoop-daemon.sh stop namenode
[root@master ~]# hadoop-daemon.sh start namenode

(5) 使用FileSyste類來讀寫hdfs

package com.hadoop.hdfs;

import java.io.FileInputStream;
import org.apache.commons.logging.Log;
import org.apache.commons.logging.LogFactory;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.FSDataOutputStream;
import org.apache.hadoop.fs.FileStatus;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.Path;

public class HelloHDFS {

    public static Log log =  LogFactory.getLog(HelloHDFS.class);
    
    public static void main(String[] args) throws Exception {

        Configuration conf = new Configuration();
        conf.set("fs.defaultFS", "hdfs://192.168.56.100:9000");
        conf.set("dfs.replication", "2");//默認為3
        FileSystem fileSystem = FileSystem.get(conf);
        
        boolean success = fileSystem.mkdirs(new Path("/yucong"));
        log.info("創建文件是否成功:" + success);
        
        success = fileSystem.exists(new Path("/yucong"));
        log.info("文件是否存在:" + success);
        
        success = fileSystem.delete(new Path("/yucong"), true);
        log.info("刪除文件是否成功：" + success);
        
        /*FSDataOutputStream out = fileSystem.create(new Path("/test.data"), true);
        FileInputStream fis = new FileInputStream("c:/test.txt");
        IOUtils.copyBytes(fis, out, 4096, true);*/
        
        FSDataOutputStream out = fileSystem.create(new Path("/test2.data"));
        FileInputStream in = new FileInputStream("c:/test.txt");
        byte[] buf = new byte[4096];
        int len = in.read(buf);
        while(len != -1) {
            out.write(buf,0,len);
            len = in.read(buf);
        }
        in.close();
        out.close();
        
        FileStatus[] statuses = fileSystem.listStatus(new Path("/"));
        log.info(statuses.length);
        for(FileStatus status : statuses) {
            log.info(status.getPath());
            log.info(status.getPermission());
            log.info(status.getReplication());
        }
    }
 
}

這是一個maven項目，pom.xml文件為：

  <dependencies>

    <dependency>
      <groupId>org.apache.hadoop</groupId>
      <artifactId>hadoop-common</artifactId>
      <version>2.7.3</version>
    </dependency>
    
    <dependency>
        <groupId>org.apache.hadoop</groupId>
        <artifactId>hadoop-hdfs</artifactId>
       <version>2.7.3</version>
    </dependency>
    
  </dependencies>

第三課：java開發hdfs

node 執行需要 public conf iss import lean logging (1)關於hdfs小結 hadoop由hdfs + yarn + map/reduce組成， hdfs是數據庫存儲模塊，主要由1臺namenode和n臺datanode組成的一個集

hadoop第五課：java開發Map/Reduce

pla tool @override val code 項目 ssp ava ram 配置系統環境變量HADOOP_HOME，指向hadoop安裝目錄（如果你不想招惹不必要的麻煩，不要在目錄中包含空格或者中文字符）把HADOOP_HOME/bin加到PATH環境變量（非必要

“全棧2019”Java第三章：安裝開發工具IntelliJ IDEA

難度初級學習時間 10分鐘適合人群零基礎開發語言 Java 開發環境 JDK v11 IntelliJ IDEA v2018.3 文章原文連結 “全棧2019”Java第三章：安裝開發工具IntelliJ IDEA 下一章 “全棧2019”Java第四章：建立

【Linux探索之旅】第一部分第三課：測試並安裝Ubuntu

u盤 nco 過程 sans ubunt windows u盤啟動盤系統 .com 內容簡單介紹 1、第一部分第三課：測試並安裝Ubuntu 2、第一部分第四課預告：磁盤分區測試並安裝Ubuntu 大家好，經過前兩個比較偏理論（是否

【Linux探索之旅】第四部分第三課：文件傳輸，瀟灑同步

命令行上傳文件文件夾 images lsh wget命令 ace 目標 wechat 內容簡單介紹 1、第四部分第三課：文件傳輸。瀟灑同步 2、第四部分第四課：分析網絡。隔離防火文件傳輸。瀟灑同步這一課的內容相

微信小程序自學第三課：文件作用域，模塊化

數據變量 span data ava 有效函數方法 oba 一、文件作用域　　在 JavaScript 文件中聲明的變量和函數只在該文件中有效；不同的文件中可以聲明相同名字的變量和函數，不會互相影響。通過全局函數 getApp() 可以獲取全局的應用實例，如果需要

第三課：線段

www blank 圖片分享圖片 nbsp ech image mage png http://www.52investing.com/jpkecheng/payRoom_31_109.html 第三課：線段

元學習-Learning How to Learn-第三課：學習新知識的一般過程

自主註意找到專註閱讀集中 ear 針對性練習第三課：學習新知識的一般過程一、建立組塊：整理新的知識 1.前提——排除幹擾，集中註意力：創意的基礎是專註； 2.找到建立組塊的位置——通讀材料，抓住標題類信息，掌握知識分布的情況：自頂向下，而不是從前往後；

第三課：模擬器裏安裝手遊APK安裝

HR .cn border width image 分享 IT 雷電 http 1 ：雷電_安裝應用 (“2”, “F:\征途手遊APK\征途手遊.apk”) 註意： “2” 表示模擬器的索引源模擬器的索引是 0 開始的第三課：模擬器裏安裝手遊APK安裝

爬蟲第三課：互聯網中網頁的解析

iso 來看指向應該 pri tro conn 路徑獲取基本步驟這節課們們的目的就是使用Requests模塊+BeautifulSoup模塊爬取網站上的信息首先爬取一個網站主要分兩步 1、第一步我們要了解服務器與本地交換機制，選擇正確的辦法我們才能獲取正確的信息

C#程式設計基礎第三課：C#中的運算子和分支語句

知識點：運算子、if結構、if-else語句一、運算子運算子用於執行程式程式碼運算，會針對一個以上運算元專案來進行運算。例如：2+3，其運算元是2和3，而運算子則是“+”。在vb2005中運算子大致可以分為5種類型：算術運算子、連線運算子、關係運算符、賦值運算子和邏輯運算子。。

HTML+CSS第三課：表格標籤的使用

知識點：表格標籤、表格標籤的屬性、單元格的跨行與跨列、單元格屬性 1、表格的基本結構表格是由指定的數目的行和列組成的。單元格：表格的最小單位，一個表格由一個或多個單元格組成。行：表格是由一個或多個行堆疊而成。列：表格是由一個或多個列堆疊而成。 2、表格的基本

mysql篇第三課：庫的建立和表的詳解

這節課我們講講怎麼建庫，以及對錶的建立詳細分析一下: 建庫特別簡單: create database dbname; 來試試接下來講建表,先把建表語句粘一下:

第6課：Java Spring Boot 2.0實戰MyBatis與優化(Java面試題)

《阿里巴巴Java Spring Boot 2.0開發實戰課程》06課本期分享專家：徐雷—阿里巴巴特邀Java講師，MongoDB講師本期分享主題：Spring Boot2.0實戰MyBatis與優化 (Java面試題)Java Spring Boot 2.0是最新的開發平臺，Mybatis是高效能ORM

第1篇：Java開發環境搭建

這裡僅以windows為例 1. 下載安裝JDK 下載地址：https://www.oracle.com/technetwork/java/javase/downloads/index.html 2. 配置環境變數右鍵 “我的電腦” --> 屬性 --

人工智慧第三課：資料科學中的Python

我用了兩天左右的時間完成了這一門課《Introduction to Python for Data Science》的學習，之前對Python有一些基礎，所以在語言層面還是比較順利的，這門課程的最大收穫是讓我看到了在資料科學中Python的真正威力（也理解了為什麼Python這麼流行），同時本次課程的互動式練

第7課：Java Spring Boot 2.0安全機制、漏洞與MVC身份驗證實戰

《阿里巴巴Java Spring Boot 2.0開發實戰課程》07課本期分享專家：徐雷—阿里巴巴特邀Java講師，MongoDB講師本期分享主題：Java Spring Boot2.0實戰MyBatis與優化 (Java面試題)Java Spring Boot 2.0是最新的開發平臺，深入介紹Sprin

鬱金香驅動學習>第三課：新增裝置物件

#include <ntddk.h> //定義個INITCODE巨集，這個巨集表示初始化的時候載入記憶體，然後可以從記憶體中解除安裝掉 #define INITCODE code_seg("INIT") //;注意這裡是不能加分號的 #define PAGECODE code_

javaweb基礎第三課：tomcat伺服器初探

這節課我們來講講tomcat伺服器首先，為什麼我們需要一個伺服器？大家都知道，我們可以在瀏覽器裡直接開啟一個html頁面，而且有js可以進行一定的邏輯處理，有css搭配js可以做出很絢麗的視覺效果，那麼為什麼我們需要伺服器呢？其實很簡單

第三課：js函式

這節課開始我們來學jsa的函式 //這個用來寫js函式相關的教學 /** * js函式的定義語法: * 語法1: * function 函式名(引數名1,引數名2,引數名3,...) * { &nbs

第三課：java開發hdfs

相關推薦