在Hadoop平臺中執行MapReduce WordCount程式

阿新 • • 發佈：2018-12-31

一、實驗名稱

在Hadoop平臺執行MapReduce程式

二、實驗過程

1.設定環境變數

（1）編輯~/.bashrc檔案，新增下列語句

export HADOOP_HOME=/usr/local/hadoop

export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar:$($HADOOP_HOME/bin/hadoopclasspath):$CLASSPATH

（2）source ~/.bashrc使環境變數生效

2.編譯Java檔案

3.將class檔案打包生成jar檔案

4.開啟HDFS、YARN服務

5.5.上傳檔案計數檔案至HDFS檔案系統中

hdfs相關操作：

hdfs dfs -rm 刪除HDFS檔案系統中的檔案或目錄

hdfs dfs -mkdir 建立目錄

hdfs dfs -ls 列出目錄下所有檔案

hdfs dfs -put 上傳檔案到HDFS

hdfs dfs -get 從HDFS下載檔案到本地

6.在Hadoop平臺中執行MapReduce Job

7.檢視執行結果

8.具體程式

        
import java.io.IOException;
import java.util.*;
        
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.conf.*;
import org.apache.hadoop.io.*;
import org.apache.hadoop.mapreduce.*;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.input.TextInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;
import org.apache.hadoop.mapreduce.lib.output.TextOutputFormat;
        
public class WordCount {
        
 public static class Map extends Mapper<LongWritable, Text, Text, IntWritable> {
    private final static IntWritable one = new IntWritable(1);
    private Text word = new Text();
        
    public void map(LongWritable key, Text value, Context context) throws IOException, InterruptedException {
        String line = value.toString();
        StringTokenizer tokenizer = new StringTokenizer(line);
        while (tokenizer.hasMoreTokens()) {
            word.set(tokenizer.nextToken());
            context.write(word, one);
        }
    }
 } 
        
 public static class Reduce extends Reducer<Text, IntWritable, Text, IntWritable> {

    public void reduce(Text key, Iterable<IntWritable> values, Context context) 
      throws IOException, InterruptedException {
        int sum = 0;
        for (IntWritable val : values) {
            sum += val.get();
        }
        context.write(key, new IntWritable(sum));
    }
 }
        
 public static void main(String[] args) throws Exception {
    Configuration conf = new Configuration();
        
    Job job = new Job(conf, "wordcount");
    
    job.setOutputKeyClass(Text.class);
    job.setOutputValueClass(IntWritable.class);
        
    job.setMapperClass(Map.class);
    job.setReducerClass(Reduce.class);
        
    job.setInputFormatClass(TextInputFormat.class);
    job.setOutputFormatClass(TextOutputFormat.class);
        
    FileInputFormat.addInputPath(job, new Path(args[0]));
    FileOutputFormat.setOutputPath(job, new Path(args[1]));
        
    job.waitForCompletion(true);
 }
        
}

在Hadoop平臺中執行MapReduce WordCount程式

一、實驗名稱在Hadoop平臺執行MapReduce程式二、實驗過程 1.設定環境變數（1）編輯~/.bashrc檔案，新增下列語句 export HADOOP_HOME=/usr/local/hadoop export CLASSPATH=.:$JAVA_HOME/

Eclipse中執行MapReduce程式控制臺無除錯資訊-log4j

在Eclipse中執行MapReduce程式，引數設定都正確的情況下，執行時控制檯的輸出為： log4j:WARN No appenders could be found for logger (or

hadoop叢集在eclipse中執行mapreduce的一些問題

有一個問題，配置好了分散式集群后，把mapreduce程式打包成jar在命令列可以跑成功，得到結果；但是在eclipse中執行就會報錯（class $map not found）就是說找不到map類。最終問題原因及解決辦法：在專案src目錄下匯入core-site.x

Apache 中執行 Python CGI 程式

Web 程式我還是喜歡用 Apache 來作為入口，因為我用的系統是 Mac OS, Apache 它就靜靜的躺上那兒了。最好是都像 PHP 那樣的程式，無需啟動額外的服務，這種使用方式的缺陷是不太適合於做微服務。這兒呢，我也是來探索如何在 Apache 中執行 Pyth

用hadoop streaming 來執行mapreduce的指令碼

2013-02-01 周海漢/文 2013.2.1 http://abloz.com tom white的《hadoop the_definitive_guide 3nd edition》附錄C裡面講到用streaming

從Linux程式中執行shell（程式、指令碼）並獲得輸出結果（轉）

1. 前言 2. 使用臨時檔案 3. 使用匿名管道 4. 使用popen 5. 小結

Java筆記---Hadoop 2.7.1下WordCount程式詳解

一、前言在之前我們已經在 CenOS6.5 下搭建好了 Hadoop2.x 的開發環境。既然環境已經搭建好了，那麼現在我們就應該來乾點正事嘛！比如來一個Hadoop世界的HelloWorld，也就是WordCount程式(一個簡單的單詞計數程式) 二、

Spark 使用Python在pyspark中執行簡單wordcount

0.參考文章 1.pyspark練習進入到spark目錄， 1.1 修改log4j.properties Spark（和PySpark）的執行可以特別詳細，很多INFO日誌訊息都會列印到螢幕。開發過程中，這些非常惱人，因為可能丟失Pytho

Hadoop windows 本地執行Mapreduce 報錯 Error while running command to get file permissions

package cn.hadoop.mr.flowsum; import java.io.IOException; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.Path

在android系統命令列中執行arm linux程式，出現/system/bin/sh: .xxx No such file or directory問題

android系統的底層就是Linux，理論上arm linux程式在android系統中也能夠執行。但是當我寫了一個“Hello World”程式並執行時，出現了下面的錯誤： system/bin/sh:./ a.out No such file or directory

圖解eclipse中執行C語言程式

現在上課講C語言的課，因為非常不喜歡VC++，聽說eclipse也可以做C的程式，就找了一下配置方法。首先要有以下三樣東西： ①JDK１.５，因為eclipse執行環境需要，呵，沒辦法 ②eclipse+CDT外掛，我是直接在官方網站上下載的帶有CDT外掛的eclipse，

在eclipse中編寫Hadoop的WordCount程式，並在eclipse中執行

基於Windows7 + jdk1.8.0_162 + eclipse4.7.2 + Hadoop2.7.7 一、安裝eclipse（自行百度）二、安裝jdk（自行百度）三、下載maven倉庫並在eclipse中配置maven環境（後面的文章講）四、在eclipse中新建一個maven

MapReduce 程式執行演示（示例PI程式 wordcount程式）

你說的9000埠應該指的是fs.default.name或fs.defaultFS（新版本）這一配置屬性吧，這個屬性是描述叢集中NameNode結點的URI(包括協議、主機名稱、埠號) 50070其實是在hdfs-site.xml裡面的配置引數dfs.namenode.http-address，

在eclipse中執行叢集版MapReduce程式

我們在windows下的eclipse直接將mapReduce程式傳送到hadoop叢集，在叢集上跑mapReduce程式。 1. 首先我們需要配置hadoop叢集的引數我們可以通過程式碼的方式進行配置，也可以從hadoop叢集中直接下載配置檔案下載好的配置檔案直接放在

Hadoop學習3-Macbook環境在IDEA中編寫MapReduce程式

Hadoop學習3-Macbook環境在IDEA中編寫MapReduce程式新建一個Maven專案不用說了，普通的Maven專案就行。加入Hadoop依賴其中的${hadoop.version}對應自己使用的Hadoop版本 hadoop-client

Linux 環境下執行hadoop 的wordcount 程式

我相信每個人部署完hadoop 環境之後，都想執行一下程式，就比如學習java的時候，配置好環境變數，就想執行一下程式輸出一個hellop word。 wordcount程式，統計文字中的字元出現次數。本次，主要目的是在liunx執行一下wordcount,看看輸出的效果。下一篇會介紹在

windows下idea編寫WordCount程式，並打jar包上傳到hadoop叢集執行（傻瓜版）

通常會在IDE中編制程式，然後打成jar包，然後提交到叢集，最常用的是建立一個Maven專案，利用Maven來管理jar包的依賴。一、生成WordCount的jar包 1. 開啟IDEA，File→New→Project→Maven→Next→填寫Groupld和Artifactld→Ne

在myeclipse上連線hadoop-2.8.0 執行mapreduce程式

首先 hadoop叢集是要先搭建的沒的說。可以先在hadoop上執行自帶的mapreduce jar包，跑一下，不成功說明配置檔案沒有配置好，這裡就不說配置哪些了，網上很多。 1.在windows下下載hadoop-2.8.0.tar.gz 並且解壓 2.下載 &n

hadoop 2.2.0 執行MapReduce程式

環境： 2臺虛擬機器搭建Hadoop環境系統Fedora 10 Hadoop 2.2.0 準備工作： 1、Hadoop 2.2.0 環境配置執行 2、建立Hdfs的輸入資料夾和輸入檔案： hadoop fs -copyFromLoca

偽分散式執行Hadoop例項之HDFS執行MapReduce程式

一、前期準備準備一臺客戶機安裝jdk 配置環境變數安裝Hadoop 配置環境變數二、配置叢集配置hadoop-env.sh檔案 cd /opt/module/hadoop-2.7.2/etc/hadoop vim hadoo

在Hadoop平臺中執行MapReduce WordCount程式

相關推薦