windows本地eclispe執行linux上hadoop的maperduce程式

阿新 • • 發佈：2018-11-10

繼續上一篇博文：hadoop叢集的搭建

1.將linux節點上的hadoop安裝包從linux上下載下來（你也可以從網上直接下載壓縮包，解壓後放到自己電腦上）

我的地址是：

2.配置環境變數：

HADOOP_HOME D:\hadoop-2.6.5

Path中新增：%HADOOP_HOME%\bin

3.下載hadoop-common-bin-master\2.7.1

並且拷貝其中的winutils.exe,libwinutils.lib這兩個檔案到hadoop安裝目錄的 bin目錄下

拷貝其中hadoop.dll，拷貝到c:\windows\system32；

3.下載eclipse的hadoop外掛

4.拷貝到eclispe的plugin資料夾中

5.eclispe==》window==》Preferences

6.window==》show view==》other

顯示面版

7.Map.Reduce Locations 面版中右擊

8.選擇第一個New Hadoop location

9.面板中多出來一頭小象

並且左側的Project Explorer視窗中的DFS Locations看到我們剛才新建的hadoop Location。

10.linux上準備測試檔案到

/opt中新建檔案 hadoop.txt內容如下：

11.上傳到hadoop

hadoop fs -put /opt/hadoop.txt /test/input/hadoop.txt

12.重新整理eclipes的Hadoop Location 有我們剛才上傳的檔案

13.建立專案 File==>New==>Other

14.專案名稱

15.編寫原始碼：

package com.myFirstHadoop;

import java.io.IOException;
import java.util.StringTokenizer;

 
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.Mapper;
import org.apache.hadoop.mapreduce.Reducer;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;
import org.apache.hadoop.util.GenericOptionsParser;

public class WorkCount {
    public static class TokenizerMapper extends Mapper<Object, Text, Text, IntWritable>{
        private final static IntWritable one=new IntWritable(1);
        private Text word=new Text();
        public void map(Object key,Text value,Context context) throws IOException, InterruptedException{
            StringTokenizer itr=new StringTokenizer(value.toString());
            while(itr.hasMoreTokens()){
                word.set(itr.nextToken());
                context.write(word, one);
            }
            
        }
    }
    
    public static class IntSumReducer extends Reducer<Text, IntWritable, Text, IntWritable>{
        private IntWritable result=new IntWritable();
        public void reduce(Text key,Iterable<IntWritable> values,Context context) throws IOException, InterruptedException{
            int sum=0;
            for(IntWritable val:values){
                sum+=val.get();
            }
            result.set(sum);
            context.write(key, result);
        }
    }
    public static void main(String[] args) throws IOException, ClassNotFoundException, InterruptedException {
        Configuration conf=new Configuration();
        String[] otherArgs=new GenericOptionsParser(conf,args).getRemainingArgs();
        if(otherArgs.length<2){
            System.err.println("Useage:wordCount <in> [<in> ...] <out>");
            System.exit(2);
        }
        Job job=new Job(conf,"word count");
        job.setJarByClass(WorkCount.class);
        job.setMapperClass(TokenizerMapper.class);
        job.setCombinerClass(IntSumReducer.class);
        job.setReducerClass(IntSumReducer.class);
        job.setOutputKeyClass(Text.class);
        job.setOutputValueClass(IntWritable.class);
        for(int i=0;i<otherArgs.length-1;++i){
            FileInputFormat.addInputPath(job, new Path(otherArgs[i]));
            FileOutputFormat.setOutputPath(job,new Path(otherArgs[otherArgs.length-1]));
            System.exit(job.waitForCompletion(true)?0:1);
        }
    }
}

View Code

16.執行前的修改

右擊==》run as ==》Run Configurations

前面一個hdfs是輸入檔案；後面一個hdfs是輸出目錄

17.回到主介面右擊==》Run As==》Run on Hadoop 等執行結束後檢視Hadoop目錄

18.檢視執行結果：

19.收工。

windows本地eclispe執行linux上hadoop的maperduce程式

繼續上一篇博文：hadoop叢集的搭建 1.將linux節點上的hadoop安裝包從linux上下載下來（你也可以從網上直接下載壓縮包，解壓後放到自己電腦上）我的地址是： 2.配置環境變數： HADOOP_HOME D:

Linux伺服器和Windows本地間scp命令上傳下載檔案的使用

【linux】---sftp協議將windows檔案拷貝到linux上

1.通過sftp協議，安全連線到遠端伺服器，建議使用xshell的連線，也可以使用sftp 使用者名稱@主機名實現linux機器與linux機器之間檔案的上傳操作 2.上傳檔案可以上傳到指定目錄 sftp> cd /home/ sftp>

哲學家就餐問題在 linux 上的程式實現

以Windows服務方式執行ASP.NET Core程式

我們對ASP.NET Core的使用已經進行了相當一段時間了，大多數時候，我們的Web程式都是釋出到Linux主機上的，當然了，偶爾也有需求要釋出到Windows主機上，這樣問題就來了，難道直接以控制檯形式執行這個Web程式嗎？直接以控制檯形式執行程式當然是可以的，但有以下問題：需要敲命令列(這個

Windows 防火牆無法執行 "由於另一個程式或正在執行的服務可能正在使用網路地址轉換元件"

今天客戶的伺服器,客戶自己安裝了個u-mail 郵件伺服器軟體.重啟系統後.就遠端不了伺服器.也ping不通了.手動重啟系統也沒用.只好機房.本地登陸進去..右擊網路上的芳鄰--屬性---視窗開啟後.什麼都沒有.本地連線沒了.然後就想起在控制面版裡試一下防火牆有沒有配置問題.

Java windows專案遷移到linux上，遇到一些跟路徑相關的問題

最近在修改一個專案，原本這個專案部署在windows，現要遷移到linux上，遇到一些跟路徑相關的問題。 1、正常得到一個url： //windows系統下使用file:/ //linux下使用file:// URL url = new URL("file:

使用Windows API實現執行時動態獲取程式檔案版本資訊

檔案版本資訊的存在使得應用程式正確的安裝檔案變得簡單，並且使安裝程式能夠分析檔案的當前安裝狀態。通常，版本資訊應該包括檔案的版本號、檔案功能描述以及檔案作者等多項重要內容。　　在應用層面上，程式設計師可以通過儲存在應用程式檔案或動態連結庫檔案中的版本資訊判斷一個檔案是否

如何安裝和使用Wine，以便在Linux上執行Windows應用程式

如何安裝和使用Wine，以便在Linux上執行Windows應用程式  我來答分享舉報瀏覽 2150 次 1個回答 #不想上班# 今天上班，你最想說點啥？最佳答案 cincoutvc 來自電腦網路類芝麻團 2017-10-19 在Linux上執行Windows程式需要安裝Wine，

Docker在Linux上執行NetCore系列（五）更新應用程式 Docker在Linux/Windows上執行NetCore文章系列

轉發請註明此文章作者與路徑，請尊重原著，違者必究。本篇文章與其它系列文章不同，為了方便測試，新建了一個ASP.Net Core檢視應用。備註：下面

Docker在Linux上執行NetCore系列（四）使用私有Nuget與多個本地包引用執行ASPNetCore Docker在Linux/Windows上執行NetCore文章系列

原文: Docker在Linux上執行NetCore系列（四）使用私有Nuget與多個本地包引用執行ASPNetCore 轉發請註明此文章作者與路徑，請尊重原著，違者必究。本篇文章演示了使用Docke

Docker在Linux上執行NetCore系列（二）把本地編譯好的映象釋出到線上阿里雲倉庫 Docker在Linux/Windows上執行NetCore文章系列

原文: Docker在Linux上執行NetCore系列（二）把本地編譯好的映象釋出到線上阿里雲倉庫轉發請註明此文章作者與路徑，請尊重原著，違者必究。系列文章：https://www.cnblogs.com/alunchen/p/10121379.html

windows環境開發yii上傳程式至linux伺服器時程式執行結果不一致的問題

在windows環境下使用sublime開發，本地Apache伺服器進行除錯，利用sublime的sftp外掛同步上傳至linux伺服器，出現windows下網頁預覽正常，遠端linux頁面部分顯示不正常，頁面中部分程式碼未經yii框架解析，直接在以HTML格式原樣輸出

Windows編寫的shell指令碼，在linux上無法執行

　　前兩天由於要查一個數據庫的binlog日誌，經常用命令寫比較麻煩，想著寫一個簡單的指令碼，自動去刷一下資料庫的binlog日誌，就直接在windows上面寫了，然後拷貝到linux中去執行，其實很簡單的指令碼，具體如下： #!/bin/bash #flush mysql logs every da

windows本地執行hadoop的MapReduce程式

1.下載hadoo安裝到windows本地地址 https://archive.apache.org/dist/hadoop/core/hadoop-2.6.0/hadoop-2.6.0.tar.gz 2. 解壓之後進行設定環境變數

windows上傳本地專案至linux伺服器中的gitlab

1、安裝git： https://git-scm.com/downloads linux伺服器中安裝gitlab： https://blog.csdn.net/

Linux上後臺同時執行多個程式

因為需要進行神經網路的引數搜尋，需要在伺服器上同時執行多個程式。編寫測試程式： vim a.py vim b.py 查閱到以下方法： 1、 vim c.py 結果這是順序執行的，不是並行 2、 vim total 許可權改為可執行chmod +x

MapReduce 程式在 Windows 本地模式下執行報錯問題的解決

一、報錯資訊第一種： Exception in thread "main" java.lang.RuntimeException: Error while running command to get file permissions : java.io.IOException: (n

在linux上寫好串列埠程式後，利用windows上的串列埠除錯助手互發資料

我是用QT4在Linux上寫的串列埠程式，具體的程式碼就不寫了，網上搜一下很多。這裡主要說一下寫完程式碼之後，之前也行。要做的事情。 1，使用命令在終端上檢視有哪些串列埠驅動。可以看出ttyS0 ttyS1能用 .一般ttyS0指com1,ttyS1指co

linux上學習pyspark執行程式的命令

2002 spark-submit --master spark://192.168.0.80:7077 /home/tsl/chenchangsha/test_spark_run_model/temp_1.py 2003 : java.lang.Nu

windows本地eclispe執行linux上hadoop的maperduce程式

相關推薦