使用JavaAPI進行HDFS檔案系統的增刪改查

阿新 • • 發佈：2019-02-06

0、事前準備。

0.1 完成HADOOP的叢集安裝，完成HDFS的配置和初始化。

0.2 配置好Linux或Win環境下的Java開發環境。

本文環境為WIN10 + Java1.8 + Eclipse。

0.3 有一定Java基礎。

1、HDFS的基本工作原理簡介。

你現在需要知道的是：

1、HDFS是一套集群系統。叢集內機器數量可多可少，由Hadoop框架約束。

2、HDFS系統至少有1個Namenode機（可認為是主機），以及若干Datanode機（可認為是算機）。

3、HDFS系統的最基本功能是分散式儲存檔案，其命令與Shell命令類似。如 ls，cat， mkdir，rm，mv等等。

4、HDFS系統在正常情況下不會隨便被你玩垮！因為存在裡面的檔案通常有2個甚至更多的備份！

2、HDFS系統的配置載入順序：

①hadoop.hdfs程式包中hdfs-default.xml預設配置

②Java專案中的hdfs-default.xml配置

③Java檔案中，通過Hadoop客戶端提供的API進行改寫。例如def.replication配置：

//Configuration為org.apache.hadoop.conf.Configuration

Configuration conf = new Configuration();
conf.set("dfs.replication", "5");

三種配置由①→②→③依次讀取，優先度依次升高（即③最高）。

3、HDFS的Jar包依賴匯入

對於Linux開發者而言，從hadoop.apache.org下載的binary版本，直接匯入Java專案即可。

對於Windows開發者，hadoop專案顯得並不友好。

我們首先需要下載所需hadoop版本的source版（例如hadoop-2.6.5-src.tar.gz），然後進行source版本本地化編譯。

個人推薦根據自身的作業系統和所需Hadoop版本情況，從網上直接下載編譯好的程式包。

附win10 x64環境編譯好的hadoop_2.6.5網盤：

連結：https://pan.baidu.com/s/1Q4DSur-lvnuX4UJCqA-URA 密碼：ao8g

4、HDFS系統通過JavaAPI進行操作

先附上程式碼：

package cn.test.hadoop.hdfs;

import java.io.IOException;
import java.net.URI;
import java.util.Iterator;
import java.util.Map.Entry;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.LocatedFileStatus;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.fs.RemoteIterator;
import org.junit.Before;
import org.junit.Test;

public class UserTestHdfsClient {

	Configuration conf = null;
	FileSystem fs = null;
	
	@Before
	public void init() throws Exception {
		
		conf = new Configuration();
//		conf.set("dfs.replication", "5");
//		fs = FileSystem.get(conf);
		fs = FileSystem.get(new URI("hdfs://hadoop.mini01:9000"), conf, "hadoop");
	}
		
	/**
	 *	遍歷conf中所有屬性 
	 */
	@Test
	public void testConf() {
		
		Iterator<Entry<String, String>> it = conf.iterator();
		while(it.hasNext()) {
			Entry<String, String> entry = it.next();
			System.out.println("The "+ entry.getKey()+" is :" + entry.getValue() + ".\n");
		}
		
	}
	
	/**
	 * 	刪除某目錄下所有檔案
	 */
	@Test
	public void testDelete() throws Exception {
		boolean delete = fs.delete(new Path("/testMkdirs"), true);
		System.out.println(delete);
	}
	
	/**
	 * 	顯示檔案清單
	 * @throws Exception 
	 */
	@Test
	public void testLs() throws Exception {
		RemoteIterator<LocatedFileStatus> listFiles = fs.listFiles(new Path("/"), true);
		while(listFiles.hasNext()){
			LocatedFileStatus fileStatus = listFiles.next();
			System.out.println("FileName: " + fileStatus.getPath().getName());
			System.out.println("FilePath: " + fileStatus.getPath());
			System.out.println("FileOwner: " + fileStatus.getOwner());
			System.out.println(fileStatus.getReplication());
			System.out.println("********************************");
		}
	}
	
	/**
	 * 上傳檔案
	 * @throws IllegalArgumentException
	 * @throws IOException
	 */
	public void testUpload() throws IllegalArgumentException, IOException {
		
		fs.copyFromLocalFile(new Path("local"), new Path("dst"));
		fs.close();
	}
	
	/**
	 * 	下載
	 * @throws IOException 
	 * @throws IllegalArgumentException 
	 */
	public void testDownload() throws IllegalArgumentException, IOException {
		fs.copyToLocalFile(new Path("src"), new Path("dst"));
		fs.close();
	}
	

}

須注意的點：

1、增刪查均可通過API簡單實現，但改檔案並不能直接通過HDFS實現。在HDFS檔案系統中，改檔案的方式是Append。

2、程式碼中的Path需要自行修改。

3、進行執行前，請確保以有權身份登入HDFS系統。

另附流方式實現HDFS檔案操作的程式碼：

package cn.test.hadoop.hdfs;

import java.io.FileInputStream;
import java.io.FileOutputStream;
import java.io.IOException;
import java.net.URI;

import org.apache.commons.io.IOUtils;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.FSDataInputStream;
import org.apache.hadoop.fs.FSDataOutputStream;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.Path;
import org.junit.Before;
import org.junit.Test;

/**
 * 用stream方式管理hdfs的檔案，
 * 可以實現讀取指定偏移量範圍的檔案內容
 * @author Henry
 *
 */

public class HdfsStreamAccess {
	FileSystem fs = null;
	Configuration conf = null;

	@Before
	public void init() throws Exception {
		conf = new Configuration();
		fs = FileSystem.get(new URI("hdfs://hadoop.mini01:9000"),conf,"hadoop");
	}
	
	/**
	 * 	從本地寫到hdfs
	 * @throws Exception
	 */
	@Test
	public void testUpload() throws Exception {
		FSDataOutputStream outputStream = fs.create(new Path("/testabc.txt"), true);
		FileInputStream inputStream = new FileInputStream("d:/kms10.log");
		
		IOUtils.copy(inputStream, outputStream);
	}
	
	@Test
	public void testDownload() throws Exception {
		FSDataInputStream inputStream = fs.open(new Path("/testabc.txt"));
		FileOutputStream outputStream = new FileOutputStream("d:/inputstream.txt");
		
		IOUtils.copy(inputStream, outputStream);
	}
	
	/**
	 * 	使用流隨機讀取檔案
	 * @throws Exception
	 */
	@Test
	public void testRandomAccess() throws Exception {
		FSDataInputStream inputStream = fs.open(new Path("/testabc.txt"));
		inputStream.seek(12); //此處 “12” 代表從12位元組後開始抓取流。可自行實現隨機讀取。
		FileOutputStream outputStream = new FileOutputStream("d:/inputstream2.txt");
		
		IOUtils.copy(inputStream, outputStream);
	}
	
	/**
	 *	從檔案系統進行讀取
	 * @throws IllegalArgumentException
	 * @throws IOException
	 */
	@Test
	public void testCat() throws IllegalArgumentException, IOException {
		
		FSDataInputStream inputStream = fs.open(new Path("/testabc.txt"));
		
		IOUtils.copy(inputStream, System.out);
	}
	

}

以上程式碼的執行方式均為Junit直接執行。

5、參考的文件：

連結：https://pan.baidu.com/s/14tdGH--fDjVnV57UV-NSpw 密碼：xeo0

使用JavaAPI進行HDFS檔案系統的增刪改查

0、事前準備。 0.1 完成HADOOP的叢集安裝，完成HDFS的配置和初始化。 0.2 配置好Linux或Win環境下的Java開發環境。本文環境為WIN10 + Java1.8 + Eclipse。 0.3 有一定Java基礎。

Java API實現Hadoop文件系統增刪改查

代碼實現 java api cee 其他 mon prop com null -c Java API實現Hadoop文件系統增刪改查 Hadoop文件系統可以通過shell命令hadoop fs -xx進行操作，同時也提供了Java編程接口 maven配置 <proj

java --圖書管理系統增刪改查

import java.util.Scanner; public class Task1 { public static void main(String[] args) { int id=0;//初始化id。 String[][] books = new String[3][5

Hibernate的入門之配置檔案和增刪改查

首先使用maven匯入jar包,然後配置主xml檔案 <?xml version="1.0" encoding="UTF-8"?> <!DOCTYPE hibernate-configuration PUBLIC "-//Hibernate/Hibernate Confi

mybatis3.1-[topic-16-17]-對映檔案_增刪改查_insert_獲取自增主鍵的值

筆記要點出錯分析與總結 /**測試第16章的增,刪,改的內容 * 錯誤1: <insert id="addEmp" parameterType="com.bean.Employee"> ,注意選取資料型別是parameterType,不是Map * 錯誤2: 按順序查詢全部

C# 用Linq的方式實現對Xml檔案的基本操作（建立xml檔案、增刪改查xml檔案節點資訊）

1 private static void GetXmlNodeInforOld( string xmlPath) 2 { 3 try 4 { 5

C#實現簡單的學生管理系統增刪改查

1.Programs.cs using System; using System.Collections; using System.Collections.Generic; using System.Linq; using System.Text; using Syste

基於SpringMVC的檔案（增刪改查）上傳、下載、更新、刪除

一、專案背景　　　摘要：最近一直在忙著專案的事，3個專案過去了，發現有一個共同的業務，那就是附件的處理，附件包括各種文件，當然還有圖片等特殊檔案，由於時間的關係，每次都是匆匆忙忙的搞定上線，稱這專案的空檔，整理了一份附件上傳、下載、刪除的專案，主要就是附件的處理，情況包含以下幾種：　　1. 表單個附件共存

Mybatis環境搭建和進行簡單的CRUD增刪改查操作

1：首先引入所需要的jar包。包括mybatis-3.2.8.jar、mysql-connector-java-3.1.12-bin.jar、junit4.4.jar、log4j-1.2.17.jar。其中後面2個不是必須需要的。只需要mybatis的和mysql驅動包就行

Java解析xml檔案之增刪改查

XML是什麼: 可擴充套件的標記語言 XML能幹什麼: 描述資料、儲存資料、傳輸（交換）資料。 XML文件節點型別： u 文件(document) u 元素(element) u 屬性(attribu

Android+伺服器上資料進行操作+mysql的增刪改查

我們都知道我們的資料都在資料庫上我們同樣要對我們的資料進行操作，我們怎麼搞呢我們首先要知道mysql.db這個東西，這是我們連結資料庫的包然而我們發現這個東西一直報錯，經過編者的仔細尋找，終於解決了這裡：我只說mac本的方法第一步我們需要下載一個brew,開啟終端

iOS Plist檔案，增刪改查

- (void)deletePlistWithName:(NSString *)name{ NSString * plistPath = [[NSSearchPathForDirectoriesInDomains(NSDocumentDirectory, NSUserDomainMask, YES)

ElasticSearch初體驗之使用Java進行最基本的增刪改查

好久沒寫博文了，最近專案中使用到了ElaticSearch相關的一些內容，剛好自己也來做個總結。現在自己也只能算得上入門，總結下自己在工作中使用Java操作ES的一些小經驗吧。本文總共分為三個部分：一：ES相關基本概念及原理二：ES使用場景介紹三：使用Java進行ES的增刪改查及程式碼講解

Python中對檔案的增刪改查,多行字元的刪除

# Author Richard_Kong # !/usr/bin/env python # --*-- encoding:utf-8 --*-- """ 修改檔案中的字元，並儲存 """ def alter(file,old_str,new_str): '''

JavaAPI實現hdfs檔案增刪改查

package com.aimuti.hadoop.hdfs; import java.io.FileNotFoundException; import java.io.IOException; import java.net.URI; import java

【Mac系統 + Python + Django】之開發一個釋出會系統【Django模型（二）】【Mac系統 + Mysql】之安裝Mysql資料庫【Python + Mysql】之用pymysql庫連線Mysql資料庫並進行增刪改查操作

上一部分給大家介紹Django的檢視。接下來繼續來了解Django框架，來看第二部分，此部分是對資料庫的操作。目錄：一、設計系統表二、admin後臺管理三、基本資料訪問(SQLite資料庫) 四、Django配置MySQL &

Zookeeper JavaAPI對節點進行增刪改查（詳細步驟）

import java.io.IOException; import java.util.List; import org.apache.zookeeper.CreateMode; import org.apache.zookeeper.KeeperException; import org.ap

對haproxy檔案進行增刪改查

1、檔案內容 global log 127.0.0.1 local2 daemon maxconn 256 log 127.0.0.1 local2 info defaults log global mod

Python--綜合練習--對檔案進行增刪改查

知識點應用：strip() 　tag 　　　　　　函式封裝　　　　　　檔案操作　　　　　　for迴圈　　　　　　os模組　　　　　　程式碼解耦例項 tag = True while tag: print('level') choice = input('level1

（一）solr 7.31版本window系統全程安裝搭建，涵蓋專案用到的大部分配置，常用查詢，solr多條件查詢、排序，配置資料庫，定時同步，全量與增量更新，使用solrJ在java程式進行增刪改查

前言：由於專案最近在做淘寶客商品資訊查詢這一塊，做搜尋引擎，離不開全文搜尋伺服器，我這裡選擇了solr。solr的好處可以自行百科，這裡主要是講解技術。這篇文章主要講解window的安裝和使用。若大家感興趣或者專案用到，希望你能跟著我的步驟進行下去，如果遇到問題，可以後續看下我在最底下的問題

使用JavaAPI進行HDFS檔案系統的增刪改查

相關推薦