eclipse配置hadoop2.7.2開發環境

阿新 • • 發佈：2017-05-13

amt res project star ast text package fin super

　　先安裝並啟動hadoop，怎麽弄見上文http://www.cnblogs.com/wuxun1997/p/6847950.html。這裏說下怎麽設置IDE來開發hadoop代碼。首先要確保你本地裝了eclipse，再下個eclipse的hadoop插件就完事了。下面細說一下：

　　1、到http://download.csdn.net/detail/wuxun1997/9841487下載eclipse插件並丟到eclipse的pulgin目錄下，重啟eclipse，Project Explorer出現DFS Locations；

　　2、點擊Window->點Preferences->點Hadoop Map/Reduce->填D:\hadoop-2.7.2並OK；

　　3、點擊Window->點Show View->點MapReduce Tools下的Map/Reduce Locations->點右邊角一個帶+號的小象圖標"New hadoop location"->eclipse已填好默認參數，但以下幾個參數需要修改以下，參見上文中的兩個配置文件core-site.xml和hdfs-site.xml：

　　General->Map/Reduce(V2) Master->Port改為9001

　　General->DSF Master->Port改為9000

　　Advanced paramters->dfs.datanode.data.dir改為ffile:/hadoop/data/dfs/datanode

　　Advanced paramters->dfs.namenode.name.dir改為file:/hadoop/data/dfs/namenode

　　4、點擊Finish後在DFS Locations右鍵點擊左邊三角圖標，出現hdsf文件夾，可以直接在這裏操作hdsf，右鍵點擊文件圖標選"Create new Dictionery"即可新增，再次右鍵點擊文件夾圖標選Reflesh出現新增的結果；此時在localhost:50070->Utilities->Browse the file system也可以看到新增的結果；

　　5、新建hadoop項目：File->New->Project->Map/Reduce Project->next->輸入自己取的項目名如hadoop再點Finish

　　6、這裏的代碼演示最常見的分詞例子，統計的是中文小說裏的人名並降序排列。為了分詞需要導入一個jar，在這裏下載http://download.csdn.net/detail/wuxun1997/9841659。項目結構如下:

hadoop

|--src

|--com.wulinfeng.hadoop.wordsplit

|--WordSplit.java

|--IKAnalyzer.cfg.xml

|--myext.dic

|--mystopword.dic

WordSplit.java

package com.wulinfeng.hadoop.wordsplit;

import java.io.IOException;
import java.io.StringReader;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.io.WritableComparable;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.Mapper;
import org.apache.hadoop.mapreduce.Reducer;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.input.SequenceFileInputFormat;
import org.apache.hadoop.mapreduce.lib.map.InverseMapper;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;
import org.apache.hadoop.mapreduce.lib.output.SequenceFileOutputFormat;
import org.wltea.analyzer.core.IKSegmenter;
import org.wltea.analyzer.core.Lexeme;

public class WordSplit {
    
    /**
     * map實現分詞
     * @author Administrator
     *
     */
    public static class TokenizerMapper extends Mapper<Object, Text, Text, IntWritable> {
        private static final IntWritable one = new IntWritable(1);
        private Text word = new Text();

        public void map(Object key, Text value, Mapper<Object, Text, Text, IntWritable>.Context context)
                throws IOException, InterruptedException {
            StringReader input = new StringReader(value.toString());
            IKSegmenter ikSeg = new IKSegmenter(input, true); // 智能分詞
            for (Lexeme lexeme = ikSeg.next(); lexeme != null; lexeme = ikSeg.next()) {
                this.word.set(lexeme.getLexemeText());
                context.write(this.word, one);
            }
        }
    }

    /**
     * reduce實現分詞累計
     * @author Administrator
     *
     */
    public static class IntSumReducer extends Reducer<Text, IntWritable, Text, IntWritable> {
        private IntWritable result = new IntWritable();

        public void reduce(Text key, Iterable<IntWritable> values,
                Reducer<Text, IntWritable, Text, IntWritable>.Context context)
                throws IOException, InterruptedException {
            int sum = 0;
            for (IntWritable val : values) {
                sum += val.get();
            }
            this.result.set(sum);
            context.write(key, this.result);
        }
    }

    public static void main(String[] args) throws Exception {
        Configuration conf = new Configuration();
        String inputFile = "/input/people.txt"; // 輸入文件
        Path outDir = new Path("/out"); // 輸出目錄
        Path tempDir = new Path("/tmp" + System.currentTimeMillis()); // 臨時目錄

        // 第一個任務：分詞
        System.out.println("start task...");
        Job job = Job.getInstance(conf, "word split");
        job.setJarByClass(WordSplit.class);
        job.setMapperClass(TokenizerMapper.class);
        job.setCombinerClass(IntSumReducer.class);
        job.setReducerClass(IntSumReducer.class);
        job.setOutputKeyClass(Text.class);
        job.setOutputValueClass(IntWritable.class);
        FileInputFormat.addInputPath(job, new Path(inputFile));
        FileOutputFormat.setOutputPath(job, tempDir);

        // 第一個任務結束，輸出作為第二個任務的輸入，開始排序任務
        job.setOutputFormatClass(SequenceFileOutputFormat.class);
        if (job.waitForCompletion(true)) {
            System.out.println("start sort...");
            Job sortJob = Job.getInstance(conf, "word sort");
            sortJob.setJarByClass(WordSplit.class);
            sortJob.setMapperClass(InverseMapper.class);
            sortJob.setInputFormatClass(SequenceFileInputFormat.class);

            // 反轉map鍵值，計算詞頻並降序
            sortJob.setMapOutputKeyClass(IntWritable.class);
            sortJob.setMapOutputValueClass(Text.class);
            sortJob.setSortComparatorClass(IntWritableDecreasingComparator.class);
            sortJob.setNumReduceTasks(1);

            // 輸出到out目錄文件
            sortJob.setOutputKeyClass(IntWritable.class);
            sortJob.setOutputValueClass(Text.class);
            FileInputFormat.addInputPath(sortJob, tempDir);

            // 如果已經有out目錄，先刪再創建
            FileSystem fileSystem = outDir.getFileSystem(conf);
            if (fileSystem.exists(outDir)) {
                fileSystem.delete(outDir, true);
            }
            FileOutputFormat.setOutputPath(sortJob, outDir);

            if (sortJob.waitForCompletion(true)) {
                System.out.println("finish and quit....");
                // 刪掉臨時目錄
                fileSystem = tempDir.getFileSystem(conf);
                if (fileSystem.exists(tempDir)) {
                    fileSystem.delete(tempDir, true);
                }
                System.exit(0);
            }
        }
    }

    /**
     * 實現降序
     * 
     * @author Administrator
     *
     */
    private static class IntWritableDecreasingComparator extends IntWritable.Comparator {
        public int compare(WritableComparable a, WritableComparable b) {
            return -super.compare(a, b);
        }

        public int compare(byte[] b1, int s1, int l1, byte[] b2, int s2, int l2) {
            return -super.compare(b1, s1, l1, b2, s2, l2);
        }
    }
}

IKAnalyzer.cfg.xml

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE properties SYSTEM "http://java.sun.com/dtd/properties.dtd">
<properties>
    <comment>IK Analyzer 擴展配置</comment>
    <!--用戶可以在這裏配置自己的擴展字典 -->
    <entry key="ext_dict">myext.dic</entry>
    <!--用戶可以在這裏配置自己的擴展停止詞字典 -->
    <entry key="ext_stopwords">mystopword.dic</entry>
</properties>

myext.dic

高育良
祁同偉
陳海
陳巖石
侯亮平
高小琴
沙瑞金
李達康
蔡成功

mystopword.dic

你
我
他
是
的
了
啊
說
也
和
在
就

　　這裏直接在eclipse跑WordSplit類，右鍵選擇Run as -> Run on hadoop。因為在類裏寫死了輸入文件，所以需要在D盤建一個input目錄，裏面放個文件名叫people.txt的小說，是網上蕩下來的熱劇《人民的名義》，為了分詞的需要把people.txt去Notepad++裏打開，點編碼->以UTF-8以無BOM格式編碼。在myext.dic裏輸入一些不想拆分的人名，在mystopword.dic輸入想要過濾掉的一些謂詞和助詞，跑完去D:\out裏看part-r-00000文件即可知道誰是豬腳。

eclipse配置hadoop2.7.2開發環境

amt res project star ast text package fin super 　　先安裝並啟動hadoop，怎麽弄見上文http://www.cnblogs.com/wuxun1997/p/6847950.html。這裏說下怎麽設置IDE來開發hadoop

IntelliJ IDEA2018配置Hadoop2.7.2閱讀環境並執行偽分散式

1. 下載hadoop原始碼並編譯 $ sudo tar -zxvf hadoop-2.7.2-src.tar.gz 將解壓縮的原始碼包，複製到/usr/local目錄下： $ sudo cp -r

基於Hadoop2.7.2分散式環境，安裝HBase

1. 下載HBase並解壓縮 ① 到官網下載HBase，下載連結HBase官網下載，1.4.8版本是stable版本，可以選擇下載該版本，本人下載的是hbase-1.4.6-bin.tar.gz 。也有映象下載地址：HBase映象下載 ② 解壓縮HBase

myeclipse下搭建hadoop2.7.3開發環境

感謝分享：http://www.cnblogs.com/duking1991/p/6056923.html 需要下載的檔案：連結：http://pan.baidu.com/s/1i5yRyuh 密碼：ms91 一下載並編譯 hadoop-eclipse-plu

Windows 7(64位) 配置Eclipse+Hadoop2.5.1開發環境

本文承接《CentOS 7 快速架設hadoop 2.5.1叢集》一文。 1.增加hadoop使用者並登陸。使用者名稱hadoop,密碼 hadoop （使用者要與master上一樣,為測試方便可以直接放入管理員群組），同hadoop登陸系統 2.安裝JDK。安裝與叢集ma

整理不易，且整且珍惜 2.開發環境的搭建 3.Eclipse的相關配置 4.使用maven建立web專案 5.Spring+Mybatis+SpringMVC整合 6.mybatis自動生成程式碼 7.spring與mybatis整合中Junit的測試 8.maven專案的啟動 9.Restful

整理不易，且整且珍惜 2.開發環境的搭建 3.Eclipse的相關配置 4.使用maven建立web專案 5.Spring+Mybatis+SpringMVC整合 6.mybatis自動生成程式碼

Hadoop2.7.2高可用(HA)環境下Hbase高可用(HA)環境的搭建（在Ubuntu14.04下以root使用者進行配置）

Hadoop2.7.2高可用(HA)環境下Hbase高可用(HA)環境的搭建轉載請註明出處：http://blog.csdn.net/qq_23181841/article/details/75095370 （在Ubuntu14.04下以root使用者進行配置）下載

VirtualBox5.0.18+CentOS7.2+Hadoop2.7.2配置與開發（2）用YARN完成WordCount作業

執行WordCount作業步驟：進入hadoop目錄，刪除input目錄和output目錄（如果有）；啟動hdfs系統，ResourceManager和NodeManager。 $cd /usr/hadoop-2.7.2 $sbin/start-dfs.sh $s

Ubuntu14.04全分散式安裝hadoop2.7.2（三）jdk環境配置+hadoop單機

前文回顧：三臺電腦，一臺做主機，兩臺做從機。主機名分別是 master,slave1,slave2，ip分別是192.168.235.1~3 系統：ubuntu14.04 jdk：1.8.0_91 Hadoop: 2.7.2 (stable)

win 10 + maven + idea 15 + Hadoop 2.7.3開發環境配置

前言今天想在win 10上搭一個Hadoop的開發環境，希望能夠直聯Hadoop叢集並提交MapReduce任務，這裡給出相關的關鍵配置。步驟關於maven以及idea的安裝這裡不再贅述，非常簡單。在win 10上配置Hadoop 將Ha

hadoop2.7.2 win7 eclipse環境搭建測試

環境搭建參照上一篇hadoop2.7.2 win7基礎環境搭建。 Eclipse hadoop外掛下載2.7.2：http://download.csdn.net/detail/fly_leopard/9503172 將下載的檔案解壓，將jar包放到Eclipse/plug

springboot 入門2 開發環境與生產環境採用不同配置問題

目開發中我們通常有兩套配置資訊分別配置了我們的資料來源資訊等？那麼我們要如何不通過修改配置檔案大量配置來實現簡單的修改與配置來實現相關配置載入功能首先springboot 有一個核心的配置檔案appication.yml配置檔案通常我們的所有配置都是配置在當前一

Hadoop2.7.2 HBase2.0.0環境搭建

叢集配置 HBase – Hadoop Database，是一個高可靠性、高效能、面向列、可伸縮的分散式儲存系統，利用HBase技術可在廉價PC Server上搭建起大規模結構化儲存叢集。一、基礎環境 JDK　　　：1.8.0_65 （要求1

phpBB3.2開發環境配置

從Github匯出專案如果只是檢視程式碼, 可以直接clone官方的git https://github.com/phpbb/phpbb.git . 如果需要開發, 就fork一下再從自己的Git裡clone. 下載依賴在 phpBB 目錄下執行 php ../composer.p

Ubuntu 16.04 64位中文版配置 LAMP+phpMyAdmin PHP(7.0)開發環境

1.安裝 Apache Web伺服器. 終端：sudo apt-get install apache2 apache2-doc -y，然後測試是否安裝成功。瀏覽器位址列輸入：http://localhost，回車，出現下圖所示內容則代表成功！這步一般沒什麼錯。 2.安裝PHP7.0和A

Hadoop之——CentOS + hadoop2.5.2分散式環境配置

一、基礎環境準備系統：(VMWare) CentOS-6.5-x86_64-bin-DVD1.iso hadoop版本：hadoop-2.5.2 jdk版本：jdk-7u72-linux-x64.tar.gz 1.叢集機器三臺測試叢集，一個master(liuyazh

eclipse下配置GO語言的開發環境

1、配置eclipse下配置GO語言的外掛點選eclipse的“Help”選單，找到“Install New Software…”選單項。如下圖：點選“Install New Software…”選單項，顯示如下圖：在”Name“內輸

通過Windows7對linux上的hadoop2.7.2進行程式設計開發

1.首先宣告，我沒有在windows上的eclipse上安裝MapReduce外掛，需要的話自己可以查詢。我只是介紹如何程式設計。 2.在linux上安裝完hadoop偽分散式或者全分散式之後，將主節點上的hadoop資料夾放置到磁碟上，如：d:/hadoop272。下

hadoop2.7.2 window win7 基礎環境搭建

hadoop環境搭建相對麻煩，需要安裝虛擬機器過著cygwin什麼的，所以通過查資料和摸索，在window上搭建了一個，不需要虛擬機器和cygwin依賴，相對簡便很多。下面執行步驟除了配置檔案有部分

eclipse 配置執行hadoop 2.7 程式例子參考步驟

hfds-site.xml 增加屬性：關閉叢集的許可權校驗，windows的使用者一般與linux的不一樣，直接將它關閉掉好了。記住不是core-site.xml 重啟叢集 <property> <name>dfs.permissions</name> &l

eclipse配置hadoop2.7.2開發環境

相關推薦