eclipse上搭建hadoop開發環境

阿新 • • 發佈：2017-09-07

hadoop

一、概述

1.實驗使用的Hadoop集群為偽分布式模式，eclipse相關配置已完成；

2.軟件版本為hadoop-2.7.3.tar.gz、apache-maven-3.5.0.rar。

二、使用eclipse連接hadoop集群進行開發

1.在開發主機上配置hadoop

①將hadoop-2.7.3.tar.gz解壓到本地主機上

技術分享

②使用windows版本的hadoop中的bin替換目標中的bin文件夾

技術分享

③配置windows上的hadoop環境變量

2.在eclipse上配置hadoop集群信息

①在eclipse中添加hadoop路徑

技術分享

②配置hadoop集群訪問信息

技術分享

3.在hadoop集群中取消權限驗證

hdfs-site.xml
<property>
    <name>dfs.permissions</name>
    <value>false</value>
</property>

4.創建一個文件測試連接權限

5.安裝maven

①將maven解壓到開發主機上

②在eclipse上添加maven路徑

技術分享

5.新建maven工程

6.修改maven配置文件（maven/pom.xml）

  <dependencies>
    <dependency>
    	<groupId>org.apache.hadoop</groupId>
    	<artifactId>hadoop-client</artifactId>
    	<version>2.7.3</version>
	</dependency>
    <dependency>  
      	<groupId>junit</groupId>
      	<artifactId>junit</artifactId>
      	<version>3.8.1</version>
      	<scope>test</scope>
    </dependency>
  </dependencies>

7.新建一個類用於測試（WordCount）

import java.io.IOException;
import java.util.StringTokenizer;
 
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.Mapper;
import org.apache.hadoop.mapreduce.Reducer;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;
import org.apache.hadoop.util.GenericOptionsParser;
 
public class WordCount {
 
  public static class TokenizerMapper
       extends Mapper<Object, Text, Text, IntWritable>{
   
    private final static IntWritable one = new IntWritable(1);
    private Text word = new Text();
     
    public void map(Object key, Text value, Context context
                    ) throws IOException, InterruptedException {
      StringTokenizer itr = new StringTokenizer(value.toString());
      while (itr.hasMoreTokens()) {
        word.set(itr.nextToken());
        context.write(word, one);
      }
    }
  }
 
  public static class IntSumReducer
       extends Reducer<Text,IntWritable,Text,IntWritable> {
    private IntWritable result = new IntWritable();
 
    public void reduce(Text key, Iterable<IntWritable> values,
                       Context context
                       ) throws IOException, InterruptedException {
      int sum = 0;
      for (IntWritable val : values) {
        sum += val.get();
      }
      result.set(sum);
      context.write(key, result);
    }
  }
 
  public static void main(String[] args) throws Exception {
    Configuration conf = new Configuration();
    String[] otherArgs = new GenericOptionsParser(conf, args).getRemainingArgs();
    if (otherArgs.length < 2) {
      System.err.println("Usage: wordcount <in> [<in>...] <out>");
      System.exit(2);
    }
    Job job = Job.getInstance(conf, "word count");
    job.setJarByClass(WordCount.class);
    job.setMapperClass(TokenizerMapper.class);
    job.setCombinerClass(IntSumReducer.class);
    job.setReducerClass(IntSumReducer.class);
    job.setOutputKeyClass(Text.class);
    job.setOutputValueClass(IntWritable.class);
    for (int i = 0; i < otherArgs.length - 1; ++i) {
      FileInputFormat.addInputPath(job, new Path(otherArgs[i]));
    }
    FileOutputFormat.setOutputPath(job,
      new Path(otherArgs[otherArgs.length - 1]));
    System.exit(job.waitForCompletion(true) ? 0 : 1);
  }
}

8.配置WordCount

①將log4j.properties移動到WordCount類下

②設置WordCount的運行自變量

技術分享

8.運行測試

技術分享

三、jar包的導出與提交執行

1.導出WordCount

2.將導出的jar包上傳到hadoop集群

[[email protected] ~]$ ls
wc.jar

3.運行

[[email protected] ~]$ hadoop jar wc.jar WordCount /user/hadoop/input/* /user/hadoop/output/out
17/09/06 22:36:56 INFO client.RMProxy: Connecting to ResourceManager at hadoop/192.168.100.141:8032
17/09/06 22:36:57 INFO input.FileInputFormat: Total input paths to process : 1
17/09/06 22:36:58 INFO mapreduce.JobSubmitter: number of splits:1
17/09/06 22:36:58 INFO mapreduce.JobSubmitter: Submitting tokens for job: job_1504744740212_0001
17/09/06 22:36:59 INFO impl.YarnClientImpl: Submitted application application_1504744740212_0001
17/09/06 22:36:59 INFO mapreduce.Job: The url to track the job: http://hadoop:8088/proxy/application_1504744740212_0001/
17/09/06 22:36:59 INFO mapreduce.Job: Running job: job_1504744740212_0001
17/09/06 22:37:36 INFO mapreduce.Job: Job job_1504744740212_0001 running in uber mode : false
17/09/06 22:37:36 INFO mapreduce.Job:  map 0% reduce 0%
17/09/06 22:38:26 INFO mapreduce.Job:  map 100% reduce 0%
17/09/06 22:38:42 INFO mapreduce.Job:  map 100% reduce 100%
17/09/06 22:38:46 INFO mapreduce.Job: Job job_1504744740212_0001 completed successfully

4.查看運行結果

[[email protected] ~]$ hdfs dfs -cat /user/hadoop/output/out/part-r-00000
"AS              1
"GCC        1
"License");     1
&            1
‘Aalto       1
‘Apache         4
‘ArrayDeque‘,    1
‘Bouncy         1
‘Caliper‘,       1
‘Compress-LZF‘,   1
……

本文出自 “lullaby” 博客，請務必保留此出處http://lullaby.blog.51cto.com/10815696/1963352

eclipse上搭建hadoop開發環境

hadoop一、概述1.實驗使用的Hadoop集群為偽分布式模式，eclipse相關配置已完成；2.軟件版本為hadoop-2.7.3.tar.gz、apache-maven-3.5.0.rar。二、使用eclipse連接hadoop集群進行開發1.在開發主機上配置hadoop①將hadoop-2.7.3.

Windows系統下Eclipse上搭建Python開發環境

acl ora .com sdn down win ava ecp http 參考網站： https://blog.csdn.net/zhangphil/article/details/78962159 1、先安裝JDK ，參考網站:https://www.cnblog

Windows7作業系統下使用Eclipse來搭建hadoop開發環境

[main] WARN org.apache.hadoop.util.NativeCodeLoader- Unable to load native-hadoop library for your platform... using builtin-javaclasses where applicable

Hadoop 在Windows7作業系統下使用Eclipse來搭建hadoop開發環境

2014-12-16 15:34:01,303 INFO [main] Configuration.deprecation (Configuration.java:warnOnceIfDeprecated(996)) - session.id is deprecated. Instead, use dfs.m

Windows上搭建hadoop開發環境

前言 Windows下執行Hadoop，通常有兩種方式：一種是用VM方式安裝一個Linux作業系統，這樣基本可以實現全Linux環境的Hadoop執行；另一種是通過Cygwin模擬Linux環境。後者的好處是使用比較方便，安裝過程也簡單，本篇文章是介紹第二種方式

window下在Eclipse上搭建perl開發環境

Eclipse是著名的跨平臺的自由整合開發環境（IDE）。最初主要用來Java語言開發，目前亦有人通過外掛使其作為C++、Python、PHP等其他語言的開發工具。Eclipse的本身只是一個框架平臺，但是眾多外掛的支援，使得Eclipse擁有較佳的靈活性。許多軟

在eclipse上搭建mapreduce開發環境及執行wordcount

1.先說明我的實驗環境： win7, eclipse版本是Neon.2 Release (4.6.2), hadoop2.7.3部署在1master，3slave的叢集上 2.需要下載winutils

eclipse maven 搭建hadoop開發環境

1 建立一個maven專案 2 引入 hadoop依賴包 <properties> <hadoop.version>2.7.3</hadoop.ver

MAC上搭建Java開發環境 eclipse+maven3.5.0+jdk1.8+tomcat8.5.20

1、安裝eclipse，下載連結 4、開啟eclipse,需要配置如下資訊 Eclipse –>偏好設定–> Maven–> Installations的路徑，選擇我們存放的位置就ok了 5、配置環境變數 //1、

在ubuntu下使用Eclipse搭建Hadoop開發環境

http://www.cnblogs.com/linjiqin/archive/2013/06/21/3147902.html http://m.blog.csdn.net/blog/designpc/22757379

在mac上搭建完成開發環境之後跑android 項目模擬器連接不上的問題模擬器是genymotion

lib 環境 bubuko platform AS 設置 and sdk 開發 cd /Users/songzhiqiang/Library/Android/sdk/platform-tools ls adb devices 報錯 adb server version

【甘道夫】Eclipse+Maven搭建HBase開發環境及HBaseDAO代碼演示樣例

into disable ner except depend strong condition lena esc 環境： Win764bit Eclipse Version:

mac下idea搭建Hadoop開發環境

%0A%0A%20%20%20%20%20%20%0A%20%20%20%20%20%20%0A%0A%20%20%20%20%20%20%0A%20%20%20%20%20%20%20%20%3Ch2%20id%3D%22What%22%3E%3Ca%20href%3D%22%23What%22%20cla

在Android Studio上搭建OpenCV 開發環境

這裡預設你已經成功安裝了Android Studio IDE；我這裡使用的AS版本是3.0.1；截止目前，AS穩定版本已經升級至3.2.1，至於版本間的區別，這裡不多做區分和說明。如果對於AS的下載和安裝有問題也可以參加我的關於AS介紹的部落格

Flutter入門學習：Flutter簡介以及在macOS上搭建Flutter開發環境

前言眾所周知，一個移動客戶端一般都會有iOS和Android兩個版本，作為一個移動端的開發人員你肯定有過這樣的想法：能不能有個程式語言直接寫一套程式碼可以直接在iOS和Android系統上執行呢？現在這個問題已經得到解決，Google推出的Flutter，可以快速在iOS和Android上構建高質量的原生

linux上搭建javaweb開發環境

工欲善事實，必先利其器。在做javaweb開發之前，我們需要搭建好伺服器環境。系統：centos 7.3；目標：搭建javaweb開發環境（jdk,tomcat,maven,nginx,mysql,git）；一：jdk安裝 1.1 jdk網址，下載合適的版本http

eclipse+tomcat搭建javaweb開發環境

相關文章我用的jdk是1.7，eclipse是luna版本，tomcat8.0。都是64位工具下載 eclipse配置tomcat jdk安裝及配置環境變數，網上很多，不再贅述 eclipse和tomcat下載後是一個壓縮包

EOS系列四：Ubuntu上搭建EOS開發環境（原始碼編譯）

步驟： 1、git下載原始碼 $ git clone https://github.com/EOSIO/eos --recursive 2、編譯原始碼：下載完成之後會在home目錄建立eos

在Ubuntu上搭建Android開發環境（Android Studio）

五一放假，閒著沒事，裝了最新的ubutun16.04，然後打算順道把android開發環境移植到ubuntu上來體驗一下。 1.首先下載了Android studio 2.1 之前使用的提供改host 翻牆的網站今天掛了。。。只能在國內網站下了。。。 http://w

在Windows上搭建Go開發環境

Go語言是由谷歌開發的一個高效能、跨平臺的程式語言。安裝Go 首先先來安裝一下Go語言的SDK，目前Go語言的最新版本為Go 1.8.3 。Go下載頁面列出了各種作業系統的安裝包。如果選擇Windows MSI安裝包的話，會將Go安裝到C:\Go。如果

eclipse上搭建hadoop開發環境

相關推薦