word count的reduce過程以及專案打包部署

阿新 • • 發佈：2022-04-08

　　map過程已經寫完了，上面那個流程我們涉及到了泛型以及序列化，我們要知道每個引數代表的含義，這樣有助於我們理解整個流程。

下面我們開始reduce，這個過程我們要把map輸出的鍵值對把key值相同的放在一起，具體的流程我們看程式碼：

package MR.wc;

import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Reducer;

import java.io.IOException;

/**
 * <KEYIN, VALUEIN, KEYOUT, VALUEOUT>
 * KEYIN, VALUEIN這兩個引數是map段輸出的值，就是之前的key，value鍵值對（Text, IntWritable）
 * KEYOUT, VALUEOUT這兩個引數是我們要輸出的資料格式，比如（“hello",5）,("Hadoop",1)等等等等
 * Reduce類中有一個迭代器，會迴圈獲取資料
 * */
//繼承Reducer類
public class wcReduce extends Reducer<Text, IntWritable,Text,IntWritable> {
    /**
     * 重寫reduce方法
     * Text key：就是讀取進來的每一個單詞（比如：hello）
     * Iterable<IntWritable> values hello這個key裡面所有的value值（1，1，1，1，1）
     * */
    @Override
    protected void reduce(Text key, Iterable<IntWritable> values, Reducer<Text, IntWritable, Text, IntWritable>.Context context) throws IOException, InterruptedException {
        int sum=0;
        //對values做迭代累加
        for (IntWritable value : values) {
            //把IntWritable轉成int值累加
            sum+=value.get();
        }
        //通過上下文輸出
        context.write(key,new IntWritable(sum));
    }
}

然後我們再寫驅動類，這個類基本是一些固定的寫法：

package MR.wc;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;

import java.io.IOException;

public class wcDriver {
    public static void main(String[] args) throws IOException, InterruptedException, ClassNotFoundException {
        //設定檔案輸入路徑，也是就我們要讀取的那個文字檔案路徑（第一個引數）
        //第二個引數是我們的輸出路徑
        String[] path=new String[]{"/word.txt","/output007"};
        //設定配置檔案
        //獲取配置檔案物件
        Configuration conf  = new Configuration();
        //這裡我們可以使用Windows環境裡面的hadoop去執行，但是現在我們先把它放到叢集上，所以要先配置叢集資源
        /**
         * 配置conf物件，要根據/opt/module/hadoop-2.8.4/etc/hadoop/core-site.xml 這個檔案裡面的去配置
         *     <property>
         *             <name>fs.defaultFS</name>
         *         <value>hdfs://bigdata101:9000</value>
         *      </property>
         *      */
        conf.set("fs.defaultFS","hdfs://bigdata101:9000");//設定叢集資源地址
        //1,載入任務
        Job job = Job.getInstance(conf);

        //2,設定任務的驅動類（jar載入路徑）,通過反射獲取
        job.setJarByClass(wcDriver.class);

        //3，設定map程式資訊
        job.setMapperClass(wcMapper.class);
        job.setMapOutputKeyClass(Text.class);//設定輸出的key型別,map階段的輸出key型別
        job.setMapOutputValueClass(IntWritable.class);//設定輸出的value型別，map階段輸出的value型別

        //4,設定reduce程式資訊
        job.setReducerClass(wcReduce.class);
        job.setOutputKeyClass(Text.class);//reduce階段輸出的key型別
        job.setMapOutputValueClass(IntWritable.class);// reduce階段的value型別

        //5,設定輸入路徑和輸出路徑
        FileInputFormat.setInputPaths(job,new Path(path[0]));
        FileOutputFormat.setOutputPath(job,new Path(path[1]));

        // 6,提交任務
        boolean res=job.waitForCompletion(true);
        System.exit(res?0:1);

        System.out.println(res?"執行成功":"執行失敗");


    }
}

現在整個流程就寫完了。寫完以後我們先在叢集上跑一下試試效果。先打一個jar包：

IDEA 右邊：

執行完以後我們可以在左邊看見打好的jar包：

把這個jar包拖到桌面上，改一下名字：wordDemo.jar

然後開啟三臺虛擬機器，在namenode上啟動hdfs：start-dfs.sh

在102上啟動yarn：start-yarn.sh

啟動完畢以後我們先手動建一個檔案：vim word.txt

寫入資料：

hello world
hello scala
hello spark
hello hadoop
hello mr

儲存推出。然後把這個檔案放到hdfs根目錄上：hdfs dfs -put word.txt /

現在我們把jar包上傳到Linux上：

上傳完畢以後是這樣：

這個檔案我們沒有執行許可權，給他授權：chmod 755 wordDemo.jar

然後就綠了：

綠了以後就可以在使用Hadoop命令執行這個檔案了，執行的時候我們要用到這個檔案驅動的全類名，我們提前把路徑複製下來：

然後執行：hadoop jar wordDemo.jar MR.wc.wcDriver

我們開啟瀏覽器，輸入yarn的地址：http://192.168.53.102:8088/，可以看見作業執行的資訊：

執行完以後，我們再開啟一個網頁視窗，輸入hdfs地址：http://192.168.53.101:50070/，可以看見我們指定的那個檔案已經生成了（我們每次執行的時候都會新生成一個檔案）：

我們給他開啟：

點選part開頭的檔案：

可以把這個檔案下載下來，用notepad開啟：

ok，搞定。其實這裡就是兩個步驟，一個map，一個reduce，當然了，細心的童鞋有可能發現了這個結果還被排序了，我們在程式碼裡面沒有看見，不著急，後面會慢慢展開來說。現在對mapreduce過程應該有一個大致的瞭解了。現在再回去看看那個mapreduce的流程圖，會稍微清晰一些。

word count的reduce過程以及專案打包部署

　　map過程已經寫完了，上面那個流程我們涉及到了泛型以及序列化，我們要知道每個引數代表的含義，這樣有助於我們理解整個流程。

Vue專案打包部署的實戰過程記錄

目錄前言一、準備工作——伺服器和nginx使用1. 準備一臺伺服器2. nginx安裝和啟動3. 瞭解nginx: 修改nginx配置，讓nginx伺服器代理我們建立的檔案二、專案打包同步檔案到遠端伺服器1. 打包2. 同步到遠端伺服器3. 同步

vue專案打包部署nginx（本地部署）過程中遇到的問題

1.首先說一下流程：打包vue專案，打包後的dist直接放在自動生成的路徑就好 npm run build

Vue專案打包部署到iis伺服器的配置方法

一將Vue專案打包切換到專案目錄下，輸入cnpm run build 打包等待打包完成

SpringBoot專案打包部署

部署方式 SpringBoot專案可以通過jar包或者war包部署在伺服器上，因為jar包更適合前後端分離的專案，所以這裡我們使用jar包的方式。

Vue專案打包部署到apache伺服器的方法步驟

vue專案在開發環境下，讓專案執行起來，是通過npm run dev命令，原理是在本地搭建了一個express伺服器。

vue-cli3構建的專案打包部署在非根目錄下的伺服器時需要進行的配置

vue-cli3直接打包專案時，部署到伺服器。會出現，css，js檔案載入失敗，連結錯誤的問題。這個時候要修改config資料夾下的index.js檔案

SpringBoo專案打包部署Linux後訪問不到 resources 下面的模板檔案

1 Bug場景 1.1 在開發中經常需要獲取資原始檔路徑，例如讀寫配置檔案，獲取resource下的模板檔案等

Vue3專案打包後部署到伺服器請求不到後臺介面解決方法

本地開發沒問題能正常請求到介面，部署後頁面也能展示出來就是介面的資料請求不到

vue專案打包之開發環境和部署環境的實現

專案開發階段和生產環境可能不一樣如前端在開發階段，介面可能是自己使用 node.js 搭建的伺服器，API 返回的也都是假資料，等後臺介面開發好後，再切換成後臺提供的介面，等測試沒有問題，服務端上線後，又要改成正

前端阻止冒泡事件、將專案打包並安裝在當前環境中、請求路徑引數傳遞方式、JQ觸發動態新增元素、position絕對定位和相對定位、js中動態新增id、Corpus專案部署上線

一、前端阻止冒泡事件舉例：button裡面有個span標籤，button和span都綁定了點選事件，點選span不會觸發button的點選事件

JavaWeb專案的部署以及遠端除錯

Linux環境下軟體的安裝 Linux環境下的程式的安裝、更新、解除安裝和檢視。 rpm 命令：相當於windows程式的新增/解除安裝程式，程序程式的安裝，檢視，解除安裝。

docker部署skywalking,以及.NETCore專案IIS部署整合

之前寫過一篇基於Linux下的Skywalking的部署，關於skywalking的介紹可以看這個https://www.cnblogs.com/shook/p/10852691.html

Springboot web專案打包實現過程解析

對於war包，相信對於我們開發javaweb工程師來說都是不陌生的，外接tomcat+war包安裝到伺服器上。

vue-cli3專案打包後自動化部署到伺服器的方法

一、安裝 scp2 npm install scp2 --save-dev 二、寫好指令碼例如 upload.js （下面任選一個即可）

Jenkins:用maven在本地打包部署一個github的springboot專案(Jenkins 2.257)

一，部署的準備工作 1，測試專案的地址: https://github.com/liuhongdi/profile 是一個空白專案

IntelliJ IDEA自身以及maven專案打包方式

轉自：https://www.cnblogs.com/swordfall/p/11359370.html 解決依賴第三方jar包，並可執行jar的打包

Springboot+Vue前後端分離專案打包並部署到伺服器

一、打包前端專案開啟前端專案，使用npm run build命令進行打包，打包成功後結果如下

windows環境下本地專案（或gitlab上拉取專案）在Jenkins上自動打包部署超超超詳細！！！！！

一、環境準備 1.下載jdk,官網：http://www.oracle.com/ 2.下載Jenkins，官網：https://www.jenkins.io/

Java 專案如何打包部署？？？

技術標籤：心得linuxjavashelljardocker Spring boot + maven + jar（單體專案架構） 1、首先得確保 pom.xml 中存在 <build></build> 配置。

word count的reduce過程以及專案打包部署

相關推薦