使用Maven搭建Hadoop2開發環境

阿新 • • 發佈：2019-02-06

關於Maven的使用會在另外分享中說明，這裡僅介紹怎麼搭建Hadoop的開發環境。

1. 首先建立工程

mvn archetype:generate -DgroupId=my.hadoopstudy -DartifactId=hadoopstudy -DarchetypeArtifactId=maven-archetype-quickstart -DinteractiveMode=false

2. 然後在pom.xml檔案裡新增hadoop的依賴包hadoop-common, hadoop-client, hadoop-hdfs，新增後的pom.xml檔案如下

<project xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns="http://maven.apache.org/POM/4.0.0"
         xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/maven-v4_0_0.xsd">
    <modelVersion>4.0.0</modelVersion>
    <groupId>my.hadoopstudy</groupId>
    <artifactId>hadoopstudy</artifactId>
    <packaging>jar</packaging>
    <version>1.0-SNAPSHOT</version>
    <name>hadoopstudy</name>
    <url>http://maven.apache.org</url>
 
    <dependencies>
        <dependency>
            <groupId>org.apache.hadoop</groupId>
            <artifactId>hadoop-common</artifactId>
            <version>2.5.1</version>
        </dependency>
        <dependency>
            <groupId>org.apache.hadoop</groupId>
            <artifactId>hadoop-hdfs</artifactId>
            <version>2.5.1</version>
        </dependency>
        <dependency>
            <groupId>org.apache.hadoop</groupId>
            <artifactId>hadoop-client</artifactId>
            <version>2.5.1</version>
        </dependency>
 
        <dependency>
            <groupId>junit</groupId>
            <artifactId>junit</artifactId>
            <version>3.8.1</version>
            <scope>test</scope>
        </dependency>
    </dependencies>
</project>

3. 測試
3.1 首先我們可以測試一下hdfs的開發，這裡假定使用本博上一篇Hadoop文章中的hadoop偽分散式，類程式碼如下

package my.hadoopstudy.dfs;
 
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.FSDataOutputStream;
import org.apache.hadoop.fs.FileStatus;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IOUtils;
 
import java.io.InputStream;
import java.net.URI;
 
public class Test {
    public static void main(String[] args) throws Exception {
        String uri = "hdfs://192.168.1.140:9000/";
        Configuration config = new Configuration();
        FileSystem fs = FileSystem.get(URI.create(uri), config);
 
        // 列出hdfs上/根目錄下的所有檔案和目錄
        FileStatus[] statuses = fs.listStatus(new Path("/"));
        for (FileStatus status : statuses) {
            System.out.println(status);
        }
 
        // 在hdfs的/user根目錄下建立一個檔案，並寫入一行文字
        FSDataOutputStream os = fs.create(new Path("/user/fkong/test.log"));
        os.write("Hello World!".getBytes());
        os.flush();
        os.close();
 
        // 顯示在hdfs的/user/fkong下指定檔案的內容
        InputStream is = fs.open(new Path("/user/test.log"));
        IOUtils.copyBytes(is, System.out, 1024, true);
    }
}

3.2 測試MapReduce作業
測試程式碼比較簡單，如下：

package my.hadoopstudy.mapreduce;
 
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.Mapper;
import org.apache.hadoop.mapreduce.Reducer;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;
import org.apache.hadoop.util.GenericOptionsParser;
 
import java.io.IOException;
 
public class EventCount {
 
    public static class MyMapper extends Mapper<Object, Text, Text, IntWritable>{
        private final static IntWritable one = new IntWritable(1);
        private Text event = new Text();
 
        public void map(Object key, Text value, Context context) throws IOException, InterruptedException {
            int idx = value.toString().indexOf(" ");
            if (idx > 0) {
                String e = value.toString().substring(0, idx);
                event.set(e);
                context.write(event, one);
            }
        }
    }
 
    public static class MyReducer extends Reducer<Text,IntWritable,Text,IntWritable> {
        private IntWritable result = new IntWritable();
 
        public void reduce(Text key, Iterable<IntWritable> values, Context context) throws IOException, InterruptedException {
            int sum = 0;
            for (IntWritable val : values) {
                sum += val.get();
            }
            result.set(sum);
            context.write(key, result);
        }
    }
 
    public static void main(String[] args) throws Exception {
        Configuration conf = new Configuration();
        String[] otherArgs = new GenericOptionsParser(conf, args).getRemainingArgs();
        if (otherArgs.length < 2) {
            System.err.println("Usage: EventCount <in> <out>");
            System.exit(2);
        }
        Job job = Job.getInstance(conf, "event count");
        job.setJarByClass(EventCount.class);
        job.setMapperClass(MyMapper.class);
        job.setCombinerClass(MyReducer.class);
        job.setReducerClass(MyReducer.class);
        job.setOutputKeyClass(Text.class);
        job.setOutputValueClass(IntWritable.class);
        FileInputFormat.addInputPath(job, new Path(otherArgs[0]));
        FileOutputFormat.setOutputPath(job, new Path(otherArgs[1]));
        System.exit(job.waitForCompletion(true) ? 0 : 1);
    }
}

執行“mvn package”命令產生jar包hadoopstudy-1.0-SNAPSHOT.jar，並將jar檔案複製到hadoop安裝目錄下

這裡假定我們需要分析幾個日誌檔案中的Event資訊來統計各種Event個數，所以建立一下目錄和檔案

/tmp/input/event.log.1

/tmp/input/event.log.2

/tmp/input/event.log.3

因為這裡只是要做一個列子，所以每個檔案內容可以都一樣，假如內容如下
JOB_NEW ...

JOB_NEW ...

JOB_FINISH ...

JOB_NEW ...

JOB_FINISH ...

然後把這些檔案複製到HDFS上

$ bin/hdfs dfs -put /tmp/input /user/fkong/input

執行mapreduce作業

$ bin/hadoop jar hadoopstudy-1.0-SNAPSHOT.jar my.hadoopstudy.mapreduce.EventCount /user/input /user/output

檢視執行結果

$ bin/hdfs dfs -cat /user/output/part-r-00000

使用Maven搭建Hadoop2開發環境

關於Maven的使用會在另外分享中說明，這裡僅介紹怎麼搭建Hadoop的開發環境。 1. 首先建立工程 mvn archetype:generate -DgroupId=my.hadoopstudy -DartifactId=hadoopstudy -DarchetypeArtifactId=maven-

maven搭建webapp開發環境

mirror ont setting 開發環境搭建啟動 tomcat 分享 world gpo maven作為jar包管理工具在開發中是非常重要的。通過maven連接的倉庫，只需要增加配置就可以自動從倉庫中下載jar包並添加至工程，而不需要一個個去搜索，找到官網下載到本地

【甘道夫】Eclipse+Maven搭建HBase開發環境及HBaseDAO代碼演示樣例

into disable ner except depend strong condition lena esc 環境： Win764bit Eclipse Version:

IDEA下使用Maven搭建spark開發環境WordCount示例

一、建立Maven專案二、新增相關依賴（配置pom.xml檔案） <?xml version="1.0" encoding="UTF-8"?> <project xmlns="http://maven.apache.org/POM/4.0.0"

使用Maven搭建Hadoop開發環境

關於Maven的使用就不再囉嗦了，網上很多，並且這麼多年變化也不大，這裡僅介紹怎麼搭建Hadoop的開發環境。1. 首先建立工程mvn archetype:generate -DgroupId=my.hadoopstudy -DartifactId=hadoopstudy -

eclipse maven 搭建hadoop開發環境

1 建立一個maven專案 2 引入 hadoop依賴包 <properties> <hadoop.version>2.7.3</hadoop.ver

【Maven】Eclipse 開發環境搭建

1.下載maven安裝包。 2.配置環境變數。新建變數名：MAVEN_HOME 變數值：D:\maven\apache-maven-3.5.0（這是我的MAVEN路徑）編輯變數名：Path 在最前面加上：%MAVEN_HOME%\bin;（

mac下搭建java開發環境：eclipse+tomcat+maven

一、安裝eclipse 直接下載二、安裝JDK 確認java使用的版本：開一個終端，輸入java -version，確認jvm的版本號是jdk1.7.0 修改eclipse中的jre: 開啟首選項->Java->Installed JREs，看

搭建IntelliJ IDEA+maven+jetty+SpringMVC 開發環境（一）

以前一直使用的是eclipse，偶爾使用myeclipse，現在由於工作需要，正在使用idea。因為也是剛接觸這個開發工具，處於摸索階段，趁著學習寫了一篇環境搭建部落格，與大家一起分享一下。一、新建專案 1、開啟idea工具，選擇新建專案file-> new -> project。選擇ma

Linux伺服器搭建Java開發環境（jdk+mysql+tomcat+maven）

1、安裝mysql服務（1）、更新軟體源，命令:apt-get update （2）、依次使用命令： sudo apt-get install mysql-server sudo apt install mysql-client sudo apt install libm

Jenkins搭建Maven專案整合開發環境（原始碼庫 Gitlab）

安裝Jenkins 注意：安裝路徑最好選擇沒有空格和特殊符號的路徑，以避免後面踩坑附：Jenkins官網下載配置Jenkins 安裝完成後開啟瀏覽器輸入http:

在Windows下搭建Android開發環境

c51 公司智能單獨 window 引用 ssp 管理第一個　隨著移動互聯網的迅速發展，前端的概念已發生很大的變化，已不僅僅局限在網頁端。而Android系統作為智能機市場的老大，作為前端開發工程師，非常有必要了解和學習。但面對眾多學習資料，站在前端開發工程

Python開發入門Windows下搭建python開發環境

python開發入門 Python是一種高級計算機程序設計語言。舉個例子C語言要寫1000行代碼，Java只需要寫100行，而Python可能只要20行。 Python基本概念 Python（英語發音：/?pa?θ?n/）, 是一種面向對象、解釋型計算機程序設計語言，由Guido van R

01. Eclipse for PHP + phpStudy 搭建php開發環境

alt img lips 編譯器 phpstudy 服務 border php編譯 -1 配置php編譯器配置phpStudy服務器項目發布目錄修改hosts文件127.0.0.1 www.350zx.cn 新建項目啟動的你的phpStudy

eclipse 搭建salesforce開發環境

master other creat blank 4.3 osi str png none Launch Eclipse and click Help > Install New Software.... Click Add.... In the A

用Html5/CSS3做Winform，一步一步教你搭建CefSharp開發環境（附JavaScript異步調用C#例子，及全部源代碼）上

轉載界面設計右鍵異步一個由於編寫 scrip 調用本文為雞毛巾原創，原文地址：http://www.cnblogs.com/jimaojin/p/7077131.html，轉載請註明 CefSharp說白了就是Chromium瀏覽器的嵌入式核心，我們用此開發W

ActiveReports 9實戰教程（1）：手把手搭建好開發環境Visual Studio 2013 社區版

line tool mmu tin style textbox ble mil nts ActiveReports 9剛剛公布3天。微軟就公布了 Visual Studio Community 2013 開發環境。Visual Studio Community 2013

vscode 搭建go開發環境的13個插件的安裝

gop 第三方 git 但是由於開發教程最簡 uil 由於網的問題大家都不能直接go get 這裏從易到難按難度給大家推薦幾種方法最簡單的FQ 但是能FQ你還不能裝請問是假的FQ嗎？第一用git 直接git反而能從那邊趴下代碼但是要自己go in

在mac下搭建java開發環境

$path java ide new 版本 word-wrap 開發工具 profile data- 剛剛從windows系統轉到使用mac系統。感覺不是特別熟悉，須要一定的適應時間。以下簡介一下mac下搭建主要的java開發環境。 1.安裝jdk 安裝jdk1

Linux學習之在搭建java開發環境

inux 添加 linux java開發環境搭建包名開發 alt 環境首先，在官網上下載你需要的JDK 然後解壓包　　tar -zxvf 包名配置環境變量　　　　vim /etc/profile 如果權限不夠，就使用sudo vim /etc/profil

使用Maven搭建Hadoop2開發環境

相關推薦