Java實現HadoopHA叢集的hdfs控制

阿新 • • 發佈：2018-12-05

一、HadoopHA的搭建：https://www.cnblogs.com/null-/p/10000309.html

二、pom檔案依賴：

<dependencies>
        <dependency>
            <groupId>org.apache.hadoop</groupId>
            <artifactId>hadoop-common</artifactId>
            <version>2.7.4</version> 

        </dependency>
        <dependency>
            <groupId>org.apache.hadoop</groupId>
            <artifactId>hadoop-hdfs</artifactId>
            <version>2.7.4</version>
        </dependency>
        <dependency>
            < 
groupId>org.apache.hadoop</groupId>
            <artifactId>hadoop-client</artifactId>
            <version>2.7.4</version>
        </dependency>
        <dependency>
            <groupId>org.apache.hadoop</groupId>
            <artifactId 
>hadoop-mapreduce-client-core</artifactId>
            <version>2.7.2</version>
        </dependency>

        <!-- https://mvnrepository.com/artifact/org.slf4j/slf4j-api -->
        <dependency>
            <groupId>org.slf4j</groupId>
            <artifactId>slf4j-api</artifactId>
            <version>1.7.25</version>
        </dependency>
        <!-- https://mvnrepository.com/artifact/junit/junit -->
        <dependency>
            <groupId>junit</groupId>
            <artifactId>junit</artifactId>
            <version>4.12</version>
            <scope>test</scope>
        </dependency>

    </dependencies>

三、控制程式碼：

package com.hdfs.demo;


import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.*;
import org.apache.hadoop.fs.FileStatus;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IOUtils;

import java.io.IOException;
import java.net.URI;
import java.net.URISyntaxException;
import java.util.Iterator;
import java.util.Map;
import java.util.Set;

/**
 * @author 王傳禮
 */
public class HdfsDemo {

    /**
     * 根據配置獲取HDFS檔案作業系統
     *
     * @return FileSystem
     */
    public static FileSystem getHadoopFileSystem() {
        FileSystem fs = null;
        Configuration conf = null;
        //方法：本地沒有hadoop系統，但可以遠端訪問。根據給定的URI和使用者名稱，訪問hdfs的配置引數
        conf = new Configuration();
        //Hadoop的使用者名稱
        String hdfsUserNmae = "root";
        URI hdfsUri = null;
        try {
            hdfsUri = new URI("hdfs://192.168.182.135:8020");
            // HDFS的訪問路徑
        } catch (URISyntaxException e) {
            e.printStackTrace();
        }
        try {
            //根據遠端的NN節點，獲取配置資訊，建立HDFS物件
            fs = FileSystem.get(hdfsUri, conf, hdfsUserNmae);
        } catch (IOException e) {
            e.printStackTrace();
        } catch (InterruptedException e) {
            e.printStackTrace();
        }
        return fs;
    }

    /**
     * 這裡的建立資料夾同shell中的mkdir -p 語序前面的資料夾不存在
     * 跟java中的IO操作一樣，也只能對path物件做操作；但是這裡的Path物件是hdfs中的
     *
     * @param fs,filepath
     * @return
     */
    public static boolean myCreatePath(FileSystem fs,String filepath) {
        boolean b = false;
        Path path = new Path(filepath);
        try {
            // even the path exist,it can also create the path.
            b = fs.mkdirs(path);
        } catch (IOException e) {
            e.printStackTrace();
        } finally {
            try {
                fs.close();
            } catch (IOException e) {
                e.printStackTrace();
            }
        }
        return b;
    }

    /**
     * 刪除檔案，實際上刪除的是給定path路徑的最後一個
     * 跟java中一樣，也需要path物件，不過是hadoop.fs包中的。
     * 實際上delete(Path p)已經過時了，更多使用delete(Path p,boolean recursive)
     * 後面的布林值實際上是對檔案的刪除，相當於rm -r
     *
     * @param fs
     * @return
     */
    public static boolean myDropHdfsPath(FileSystem fs, String filepath) {
        boolean b = false;
        // drop the last path
        Path path = new Path(filepath);
        try {
            b = fs.delete(path, true);
        } catch (IOException e) {
            e.printStackTrace();
        } finally {
            try {
                fs.close();
            } catch (IOException e) {
                e.printStackTrace();
            }
        }
        return b;
    }


    /**
     * 重新命名資料夾
     *
     * @param hdfs
     * @return
     */
    public static boolean myRename(FileSystem hdfs, String oldname, String newname) {
        boolean b = false;
        Path oldPath = new Path(oldname);
        Path newPath = new Path(newname);

        try {
            b = hdfs.rename(oldPath, newPath);
        } catch (IOException e) {
            e.printStackTrace();
        } finally {
            try {
                hdfs.close();
            } catch (IOException e) {
                e.printStackTrace();
            }
        }
        return b;
    }

    /**
     * 遍歷資料夾
     * public FileStatus[] listStatus(Path p)
     * 通常使用HDFS檔案系統的listStatus(path)來獲取改定路徑的子路徑。然後逐個判斷
     * 值得注意的是：
     * 1.並不是總有資料夾中有檔案，有些資料夾是空的，如果僅僅做是否為檔案的判斷會有問題，必須加檔案的長度是否為0的判斷
     * 2.使用getPath()方法獲取的是FileStatus物件是帶URL路徑的。使用FileStatus.getPath().toUri().getPath()獲取的路徑才是不帶url的路徑
     *
     * @param hdfs
     * @param listPath 傳入的HDFS開始遍歷的路徑
     * @return
     */
    public static Set<String> recursiveHdfsPath(FileSystem hdfs, Path listPath) {

                /*FileStatus[] files = null;
                try {
                    files = hdfs.listStatus(listPath);
                    Path[] paths = FileUtil.stat2Paths(files);
                    for(int i=0;i<files.length;i++){
                        if(files[i].isFile()){
                            // set.add(paths[i].toString());
                            set.add(paths[i].getName());
                        }else {
                            recursiveHdfsPath(hdfs,paths[i]);
                        }
                    }
                } catch (IOException e) {
                    e.printStackTrace();
                    logger.error(e);
                }*/

        FileStatus[] files = null;
        Set<String> set = null;
        try {
            files = hdfs.listStatus(listPath);
            // 實際上並不是每個資料夾都會有檔案的。
            if (files.length == 0) {
                // 如果不使用toUri()，獲取的路徑帶URL。
                set.add(listPath.toUri().getPath());
            } else {
                // 判斷是否為檔案
                for (FileStatus f : files) {
                    if (files.length == 0 || f.isFile()) {
                        set.add(f.getPath().toUri().getPath());
                    } else {
                        // 是資料夾，且非空，就繼續遍歷
                        recursiveHdfsPath(hdfs, f.getPath());
                    }
                }
            }
        } catch (IOException e) {
            e.printStackTrace();
        }
        return set;
    }

    /**
     * 檔案簡單的判斷
     * 是否存在
     * 是否是資料夾
     * 是否是檔案
     *
     * @param fs
     */
    public static void myCheck(FileSystem fs, String filepath) {
        boolean isExists = false;
        boolean isDirectorys = false;
        boolean isFiles = false;

        Path path = new Path(filepath);

        try {
            isExists = fs.exists(path);
            isDirectorys = fs.isDirectory(path);
            isFiles = fs.isFile(path);
        } catch (IOException e) {
            e.printStackTrace();
        } finally {
            try {
                fs.close();
            } catch (IOException e) {
                e.printStackTrace();
            }
        }

        if (!isExists) {
            System.out.println("The path is not exist.");
        } else {
            System.out.println("The path is exist.");
            if (isDirectorys) {
                System.out.println("This is a Directory");
            } else if (isFiles) {
                System.out.println("This is Files");
            }
        }
    }

    /**
     * 獲取配置的所有資訊
     * 首先，我們要知道配置檔案是哪一個
     * 然後我們將獲取的配置檔案用迭代器接收
     * 實際上配置中是KV對，我們可以通過java中的Entry來接收
     */
    public static void showAllConf() {
        Configuration conf = new Configuration();
        conf.set("fs.defaultFS", "hdfs://node1:8020");
        Iterator<Map.Entry<String, String>> it = conf.iterator();
        while (it.hasNext()) {
            Map.Entry<String, String> entry = it.next();
            System.out.println(entry.getKey() + "=" + entry.getValue());
        }
    }

    /**
     * 檔案下載
     * 注意下載的路徑的最後一個地址是下載的檔名
     * copyToLocalFile(Path local,Path hdfs)
     * 下載命令中的引數是沒有任何布林值的，如果添加了布林是，意味著這是moveToLocalFile()
     *檔案下載有許可權要求 要有寫的許可權
     * @param fs
     */
    public static void getFileFromHDFS(FileSystem fs, String dfsFile, String locPath) {
        Path HDFSPath = new Path(dfsFile);
        Path localPath = new Path(locPath);
        try {
            fs.copyToLocalFile(HDFSPath, localPath);
            System.out.println("File download.");
        } catch (IOException e) {
            e.printStackTrace();
        } finally {
            try {
                fs.close();
            } catch (IOException e) {
                e.printStackTrace();
            }
        }
    }

    /**
     * 檔案的上傳
     * 注意事項同文件的上傳
     * 注意如果上傳的路徑不存在會自動建立
     * 如果存在同名的檔案，會覆蓋
     *
     * @param fs
     */
    public static void myPutFile2HDFS(FileSystem fs, String localFile, String dfsPath) {

        boolean pathExists = false;
        // 如果上傳的路徑不存在會建立
        // 如果該路徑檔案已存在，就會覆蓋
        Path localPath = new Path(localFile);
        Path hdfsPath = new Path(dfsPath);

        try {
            fs.copyFromLocalFile(localPath, hdfsPath);
            System.out.println("File upload.");
        } catch (IOException e) {
            e.printStackTrace();
        } finally {
            try {
                fs.close();
            } catch (IOException e) {
                e.printStackTrace();
            }
        }

    }

    /**
     * hdfs之間檔案的複製
     * 使用FSDataInputStream來開啟檔案open(Path p)
     * 使用FSDataOutputStream開建立寫到的路徑create(Path p)
     * 使用 IOUtils.copyBytes(FSDataInputStream,FSDataOutputStream,int buffer,Boolean isClose)來進行具體的讀寫
     * 說明：
     * 1.java中使用緩衝區來加速讀取檔案，這裡也使用了緩衝區，但是隻要指定緩衝區大小即可，不必單獨設定一個新的陣列來接受
     * 2.最後一個布林值表示是否使用完後關閉讀寫流。通常是false，如果不手動關會報錯的
     *
     * @param hdfs
     */
    public static void copyFileBetweenHDFS(FileSystem hdfs, String in, String out) {
        Path inPath = new Path(in);
        Path outPath = new Path(out);

        // byte[] ioBuffer = new byte[1024*1024*64];
        // int len = 0;

        FSDataInputStream hdfsIn = null;
        FSDataOutputStream hdfsOut = null;

        try {
            hdfsIn = hdfs.open(inPath);
            hdfsOut = hdfs.create(outPath);

            IOUtils.copyBytes(hdfsIn, hdfsOut, 1024 * 1024 * 64, false);

        } catch (IOException e) {
            e.printStackTrace();

       } finally {
            try {
                hdfsOut.close();
                hdfsIn.close();
            } catch (IOException e) {
                e.printStackTrace();
            }

        }

    }
}

四、測試程式碼

package com.hdfs.demo;

import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.Path;
import org.junit.Test;

import java.util.Scanner;
import java.util.Set;

import static org.junit.Assert.*;

public class HdfsTest {

    Scanner sc = new Scanner(System.in);
    FileSystem fs = HdfsDemo.getHadoopFileSystem();

    @Test
    public void myCreatePath() {
        //目錄建立測試
        String path = "/usr/test/input";
        System.out.println(HdfsDemo.myCreatePath(fs,path));
    }

    @Test
    public void myDropHdfsPath() {
        // 目錄刪除
        String path = "/usr/test/output";
        System.out.println(HdfsDemo.myDropHdfsPath(fs,path));
    }

    @Test
    public void myRename() {
        //檔案重新命名
        String oldName = "/usr/test/input";
        String newName = "/usr/test/renameInput";
        System.out.println(HdfsDemo.myRename(fs,oldName,newName));
    }

    @Test
    public void recursiveHdfsPath() {
        //遍歷資料夾
        Path path = new Path("/usr/test/");
        Set<String> set = HdfsDemo.recursiveHdfsPath(fs, path);
        for (String str :
                set) {
            System.out.println(str);
        }
    }

    @Test
    public void myCheck() {
        //檔案簡單的判斷 是否存在 是否是資料夾 是否是檔案
        String path = "/usr/test/input/file.txt";
        HdfsDemo.myCheck(fs,path);
    }

    @Test
    public void showAllConf() {
        //獲取配置的所有資訊
        HdfsDemo.showAllConf();
    }

    @Test
    public void getFileFromHDFS() {
        //檔案下載 檔案下載有許可權要求 要有寫的許可權 0644error
        String dfsFile = "/usr/test/input/file.txt";
        String locPath = "e://temp/data/";
        HdfsDemo.getFileFromHDFS(fs,dfsFile,locPath);
    }

    @Test
    public void myPutFile2HDFS() {
        //檔案的上傳
        String localFile = "e://temp/file.txt";
        String dfsPath = "/usr/test/input";
        HdfsDemo.myPutFile2HDFS(fs,localFile,dfsPath);
    }

    @Test
    public void copyFileBetweenHDFS() {
        //hdfs之間檔案的複製
        String in = "/usr/test/output";
        String out = "/usr/test/input";
        HdfsDemo.copyFileBetweenHDFS(fs,in,out);
    }
}

Java實現HadoopHA叢集的hdfs控制

一、HadoopHA的搭建：https://www.cnblogs.com/null-/p/10000309.html 二、pom檔案依賴： <dependencies> <dependency> &

java 實現oracle VPD 許可權控制

實現思路和步驟: 業務資料有組織機構欄位 ORACLE VPD 實現條件拼接 JAVA 攔截器實現那些方法需要實現VPD行資料過濾利用OracleConnection setEndToEndMetrics() 傳遞使用者許可權,後臺用userenv 獲取

java實現列印功能並控制列印方向

AttributeSet方法，其實就是列印屬性的設定，其實在一個列印過程中子介面有四個，其對應的實現類也有四個（貌似有5個，一個是總類）。詳細見連線。這裡需要提一下需要這麼多列印屬性設定介面的原因： a. 包含 DocAttribute 的 DocAttributeSet 指定單個文件的特徵和應用到單個文件

java操作樹莓派GPIO控制LED燈--結合springboot實現介面呼叫

1、概述本文使用java結合springboot實現了對樹莓派GPIO介面的操作以達到控制LED燈的功能 2、pom檔案如下： <project xmlns="http://maven.apache.org/POM/4.0.0" &nb

zookeeper和java實現的統一配置管理和叢集節點管理簡單案例

1.首先談談對zookeeper的認識，以下簡稱zk zk做為服務存在，是以三個或者三個以上存在的。服務節點啟動不分先後，他會自動選取出leader和follower。服務奇數個更有利於容錯，資料一致性可以谷歌下paxos演算法。 2.其次是我們自己開發

8皇后以及N皇后演算法探究，回溯演算法的JAVA實現，非遞迴，迴圈控制及其優化

研究了遞迴方法實現回溯，解決N皇后問題，下面我們來探討一下非遞迴方案實驗結果令人還是有些失望，原來非遞迴方案的效能並不比遞迴方案效能高程式碼如下： package com.newflypig.eightqueen; import java.util.Date; /**

叢集HDFS檔案操作（客戶端開發java）

叢集HDFS檔案操作（客戶端開.發java） 1 環境 1.1 ==win10專業版下編譯過的hadoop jar包== 1.2 配置HADOOP_HOME環境變數 1.3 配置Path環境變數 2.測試程式

Hadoop---Java實現HDFS的新增、刪除、上傳、下載功能

Java實現HDFS的新增、刪除、上傳、下載功能 package com.kevin.hdfs; import java.io.File; import java.io.FileOutputStream; import java.io.IOExcepti

java實現流量控制

java實現流量控制有些時候我們的服務負載有限，這時候就需要限制對其的併發訪問，常見的應用場景是開放api。下面介紹兩種流量控制的方式。 1.訊號量semaphore 一個計數訊號量。從概念上講，訊號量維護了一個許可集。如有必要，在許可可用前會阻塞每一個 acquire()

Java 實現 HDFS 文件基本操作

pan client dfs art nbsp comm pre 實現 clas 1. pom <hadoop.version>2.7.3</hadoop.version> <dependency&

Java 實現 HDFS 檔案基本操作

1. pom <hadoop.version>2.7.3</hadoop.version> <dependency> <groupId>org.apache.hadoop</grou

基於memcached for java 實現通用分散式快取和叢集分散式快取

前提：基於memcached client for java 的基礎進行的二次封裝，實現快取儲存的兩種模式：通用分散式快取和叢集分散式快取。以下是對於memcached client for Java 二次封裝的UML圖。對於memcached的客戶端初始化在Ca

用java實現控制小球的移動（監聽機制）

效果圖如下：通過上下左右來控制小球的移動，用到監聽機制，如果監聽機制不知道的話，可以看看這篇部落格https://blog.csdn.net/doubleguy/article/details/85198107 完整程式碼如下： package node; i

Java Web中使用JSPSmartUpload控制元件實現檔案的上傳和下載（解決了中文亂碼問題）（JSP頁面採用GBK編碼）

package edu.uestc.updown; import java.io.IOException; import java.io.PrintWriter; import javax.servlet.ServletConfig; import javax.servlet.ServletException

部署kafka+zookeeper叢集，java實現生產和消費

很長一段時間沒有寫部落格了。最近單位系統升級，鑑於activemq+redis構架存在的一些我沒有能力解決的問題。考慮再三，決定換kafka+zookeeper。選用的是多節點多boker叢集。先說一下我的伺服器歡迎：編號伺服器名內網IP 0

Java 實現系統許可權控制思路

首先介紹下思路： 1、使用者表 user; 2、角色表 role; 3、選單 menu; 4、角色選單許可權表 role_menu; 5、使用者選單許可權表 user_menu; 如圖：根據使用者角色取出該角色所有許可權，並對使用者進行許可權分配；注意選單的按鈕（新

Java框架SSH結合Easyui控制元件實現省市縣三級聯動示例解析

Easyui呼叫資料庫實現省市縣區三級聯動的效果如果下 1、首先要設計資料庫，如圖所示。一個有4個欄位code，note，pycode。code：行政區劃程式碼，note：中文註釋，pycode：拼音縮寫。其中code是由6個欄位組成。如果是省級最後4位是

Android使用webview控制元件載入本地html，通過Js與後臺Java實現資料的傳遞

1.在佈局檔案中加WebView控制元件，在java中獲取WebView物件。 2.載入本地html檔案。 3.開啟js功能。 webView.getSettings().setJa

java實現HDFS增刪改查

環境：Hadoop 2.7.3 import org.apache.commons.lang.StringUtils; import org.apache.hadoop.conf.Configuration; import org.apache.hadoo

Hadoop:本地檔案（window系統）定時獲取檔案並上傳至HDFS檔案(兩個虛擬機器)系統 Java 實現

實現功能：定時日誌採集並上傳至HDFS檔案系統的Java API實現環境+工具：windows + 虛擬機器Centos * 2 + eclipse + windows下編譯的Hadoop jar包 + Hadoop叢集一、流程 1）啟

Java實現HadoopHA叢集的hdfs控制

相關推薦