eclipse+hadoop2.7.5的map-reduce的API的配置

阿新 • • 發佈：2019-01-09

1.環境配置：
a.將map reduce所需架包全部載入到eclipse下，
b.將
鍵：HADOOP_USER_NAME
值：hadoop
配置到系統環境中，需要重新啟動。
c.將架包hadoop-eclipse-plugin-2.7.1.jar放入eclipse安裝目錄的plugin下。
下載winutils.exe將下載下的hadoop.dll和winutils.exe放到hadoop-2.7.5/bin下
下載地址
d.配置eclipse。windows–>pref..–>hadoop map/reduce–>在路徑下新增hadoop-2.7.1的路徑
e pre…–>show –>mapreduce tool—>點選小象–>配置ip和埠（9000）
這裡寫圖片描述

f hadoop.tmp.dir :/tmp/hadoop-hadoop
將hadoop下的上傳的資料夾的許可權修改為777
hadoop fs -chmod 777 /wcin

2.Java程式碼進行操做
——————————-map類的API操作——————–

package www.oeacle.wc;

import java.io.IOException;

import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.Text;
import 
 org.apache.hadoop.mapreduce.Mapper;
/*
 * KEYIN:輸入鍵的型別，者一行的開始的偏移量：long（每一行的第一個的字，位於第幾個，就是此行的偏移量）
 * VALUEIN, 輸入的值的型別。在這裡當前行的內容，String
 * KEYOUT, 輸出的鍵值對的型別，每一個單詞，String
 * VALUEOUT，輸出的值的型別，表示單詞標記一個1，int
 * map乾的事就是，將單詞分隔出來，然後進行將每個單詞標記1
 * map的資料要網路傳輸，所以需要序列化，實現介面Serializabler,
 * 但是這個方式的序列化太過冗餘，所以Hadoop提供了自己的序列化方式
 * 序列化介面叫：Writable,並且常用資料型別幫你序列化了。
 * 常用資料烈性對應的序列化格式
 * byte--ByteWritable
 * short--ShortWirtable
 * int IntWirtable
 * long--同上
 * double--同上
 * String--Text
 * null--同上
 * 就String不一樣
 * 
 */ 

public class WorldCountMap extends Mapper<LongWritable, Text, Text, IntWritable>{
    /**
     * 這個函式一行呼叫一次
     * LongWritable key;輸入鍵，偏移量
     * Text value：輸入的值，一行的內容
     * Context:是上下文的物件，用育傳輸map的處理結果，提供Write方法
     */
    @Override
    protected void map(LongWritable key, Text value, Context context)
            throws IOException, InterruptedException {
        //1.取到一行的內容
        String line=value.toString();
        //2.切分
        String [] words=line.split(" ");
        //3.迴圈遍歷打標記併發送
        for (String w : words) {
            context.write(new Text(w), new IntWritable(1));
        }
    }
}
-----------------------reduce類的API操作------------------------------
package www.oeacle.wc;

import java.io.IOException;

import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Reducer;
/*
 * reduce的輸入其實是map的輸出
 * 
 */
public class WordCoountReduce extends Reducer<Text, IntWritable, Text, IntWritable>{
    /**
     * ruduce處理的最終結果儲存在hdfs
     * 多久呼叫一次這個方法：一組呼叫一次方法
     * 啥是一組：把key相同一類就是一組
     * Text arg0：這一組的第一個key
     * Iterable<IntWritable> arg1,這一組所有key對應的value值封裝在迭代器中
     * Iterable<IntWritable> arg1,上下文物件，也是傳輸作用，往hdfs進行寫
     * 
     */
    @Override
    protected void reduce(Text key, Iterable<IntWritable> values,
            Reducer<Text, IntWritable, Text, IntWritable>.Context context) throws IOException, InterruptedException {
        //1.定義一個求和變數
        int sum=0;
        //迴圈遍歷迭代器進行求和
        for (IntWritable value : values) {
            sum+=value.get();
        }
        context.write(key,new IntWritable(sum));
    }
}
--------------------------------主函式的類--------------------
package www.oeacle.wc;

import java.io.IOException;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;



public class Driver {

    public static void main(String[] args) throws IOException, ClassNotFoundException, InterruptedException {
        //1.獲取Configuration物件
        Configuration conf=new Configuration();
        //2.需要建立一個任務，啟動一個job,一個程式就是一個作業
        Job job=Job.getInstance(conf);
        //3.設定job提交的jar包
        job.setJarByClass(Driver.class);//內部是一個反射機制
        //4.設定map和reduce對應的類
        job.setMapperClass(WorldCountMap.class);
        job.setReducerClass(WordCoountReduce.class);
        //5.設定map輸出的鍵和值的型別
        job.setMapOutputKeyClass(Text.class);
        job.setMapOutputValueClass(IntWritable.class);
        //6.最終結果輸出的值
        job.setOutputKeyClass(Text.class);
        job.setOutputValueClass(IntWritable.class);
        //7.指頂輸入路徑和輸出路徑
        FileInputFormat.addInputPath(job, new Path("/wcin"));//指定一個路徑
        //最終輸出路徑要求不能存在，怕覆蓋原始檔案
        FileOutputFormat.setOutputPath(job, new Path("/wcout"));
//      job.submit();
        job.waitForCompletion(true);
    }

}

eclipse+hadoop2.7.5的map-reduce的API的配置

1.環境配置： a.將map reduce所需架包全部載入到eclipse下， b.將鍵：HADOOP_USER_NAME 值：hadoop 配置到系統環境中，需要重新啟動。 c.將架包hadoop-eclipse-plugin-2.7.1.jar

【Hadoop2.x】CentOS中jdk的安裝，hadoop2.7.3環境配置

前提 VMware虛擬機器中已正確安裝CentOS系統，安裝過程可見CentOS 6 安裝下載好jdk-8u151-linux-x64.tar.gz，以及hadoop-2.7.3.tar.gz 遠端

win10+eclipse+hadoop2.7.2+maven+local模式直接通過Run as Java Application執行wordcount

一、準備工作　（1）Hadoop2.7.2 在linux部署完畢，成功啟動dfs和yarn，通過jps檢視，程序都存在　（2）安裝maven 二、最終效果　在windows系統中，直接通過Run as Java Application執行wordcount，而不需要先打包成jar包，然後在lin

hadoop學習之HIVE（3.2）：hadoop2.7.2下配置hiveserver2啟動遠端連線

./hive只是啟動本地客戶端，往往用來測試，我們可以啟動hive server2伺服器用於遠端連線，方便開發。前提是配置好hadoop和hive 1，開啟hive server服務：bin/hiveserver2 可檢視服務是否開啟：netstat -nplt |

eclipse配置hadoop2.7.2開發環境

amt res project star ast text package fin super 　　先安裝並啟動hadoop，怎麽弄見上文http://www.cnblogs.com/wuxun1997/p/6847950.html。這裏說下怎麽設置IDE來開發hadoop

配置MapReduce插件時，彈窗報錯org/apache/hadoop/eclipse/preferences/MapReducePreferencePage : Unsupported major.minor version 51.0（Hadoop2.7.3集群部署）

ava 不一致 nbsp 1.0 log class dll blog 無效原因： hadoop-eclipse-plugin-2.7.3.jar 編譯的jdk版本和eclipse啟動使用的jdk版本不一致導致。解決方案一：修改myeclipse.ini文件

Windows 7(64位) 配置Eclipse+Hadoop2.5.1開發環境

本文承接《CentOS 7 快速架設hadoop 2.5.1叢集》一文。 1.增加hadoop使用者並登陸。使用者名稱hadoop,密碼 hadoop （使用者要與master上一樣,為測試方便可以直接放入管理員群組），同hadoop登陸系統 2.安裝JDK。安裝與叢集ma

eclipse遠程連接hadoop2.7.3進行開發

spa ios more 火墻 have 變量 str 顯示 through 一、前言環境：系統：centos6.5 hadoop版本：Apache hadoop2.7.3（Windows和centos都是同一個） eclipse版本：4.2.0（juno版

hadoop2.7.6偽分佈模式配置

1、本文目標是在linux單機環境下配置hadoop2.7.6的偽分佈模式。 2、在hadoop-2.7.6/etc/hadoop目錄下修改如下配置檔案內容（如果沒有配置檔案，自己建立一個即可）：2.1、core-site.xml： <configuration> &

IntelliJ IDEA2018配置Hadoop2.7.2閱讀環境並執行偽分散式

1. 下載hadoop原始碼並編譯 $ sudo tar -zxvf hadoop-2.7.2-src.tar.gz 將解壓縮的原始碼包，複製到/usr/local目錄下： $ sudo cp -r

MacBook Pro18 安裝hadoop2.7.7版本和eclipse外掛安裝

（話外）這幾天，剛剛入手一臺macbook pro18,心情非常激動，雖然已經對linux系統很熟悉，但是剛開始幾天用mac還是不習慣，就趕緊的安裝完的hadoop來跑實驗。現在來談談安裝hadoop踩過的坑。Mac安裝hadoop和其他系統差不多隻是有點地方不同。 1.安裝工具 Hado

Hadoop2.7.2高可用(HA)環境下Hbase高可用(HA)環境的搭建（在Ubuntu14.04下以root使用者進行配置）

Hadoop2.7.2高可用(HA)環境下Hbase高可用(HA)環境的搭建轉載請註明出處：http://blog.csdn.net/qq_23181841/article/details/75095370 （在Ubuntu14.04下以root使用者進行配置）下載

Hadoop2.7.4分散式叢集安裝配置檔案

叢集環境 Hadoop版本為2.7.4 JDK版本1.8.0_144 安裝了三臺虛擬機器分別設定名稱和IP如下主機名稱 IP地址 master 192.168.1.15 slave01 192.168.1.16

Hadoop2.7.4在Windows 7(64位)詳細配置(完美版)

hadoop環境搭建相對麻煩，需要安裝虛擬機器過著cygwin什麼的，所以通過查資料和摸索，在window上搭建了一個，不需要虛擬機器和cygwin依賴，相對簡便很多。官網下載JDK 1.8版本配置好java環境官網下載hadoop-2.7.

hadoop2.7.2編譯成功的一個配置

JDK1.8 protoc 2.5.0 findbugs1.3.9 mavent3.3.9 hadoop2.7.2原始碼如下圖： windows遠端除錯hadoop --在hfds上執行ls bin/hdfs dfs -ls /data/input https

Hadoop2.7.3及常用元件安裝和配置

最近在學Hadoop，從最開始的安裝配置，到簡單的小程式，再到專案實戰，都非常的有趣。最開始也是在網上找了很多教程來入門，但是因為有的教程是比較早期的Hadoop1.x甚至Hadoop0.x的，有些配置在現在流行的Hadoop2中可能會出問題，自己也被這些版本差異搞的很頭疼

VirtualBox5.0.18+CentOS7.2+Hadoop2.7.2配置與開發（2）用YARN完成WordCount作業

執行WordCount作業步驟：進入hadoop目錄，刪除input目錄和output目錄（如果有）；啟動hdfs系統，ResourceManager和NodeManager。 $cd /usr/hadoop-2.7.2 $sbin/start-dfs.sh $s

CentOS7.0安裝配置hadoop2.7.0 資源準備資源下載： hadoop-2.7.0.tar.gz 密碼：727y jdk-8u45-linux-x64.tar.gz 密碼：d8bm

CentOS7.0安裝配置hadoop2.7.0 資源準備資源下載：注意事項：如果自己下載資源的話，注意hadoop,jdk,centos都應該是64位或者32位的，以免出現無法預料的錯誤，上面的資源都是64位的我是在mac下配置的，virtual box是ios x系統的，如果是其它系統的另

MAC下Hadoop2.7.2配置

一、檢測JDK版本 1、java -version k-MacBook-Pro:~ $ java -version java version "1.8.0_60" Java(TM) SE Runtime Environment (build 1.8.0_60-b27

Ubuntu14.04全分散式安裝hadoop2.7.2（三）jdk環境配置+hadoop單機

前文回顧：三臺電腦，一臺做主機，兩臺做從機。主機名分別是 master,slave1,slave2，ip分別是192.168.235.1~3 系統：ubuntu14.04 jdk：1.8.0_91 Hadoop: 2.7.2 (stable)

eclipse+hadoop2.7.5的map-reduce的API的配置

相關推薦