Hadoop的計算上下行流量的案例

阿新 • • 發佈：2019-01-03

問題：統計每一使用者的（手機號）所消耗的總的上行流量，下行流量，總流量

思路：1.建立mapper，reducer，job 2.與之間的worcount的區別在於，輸出的結果不是一個，而是多個，所以需要我們將需要輸出的資料封裝到一個類中 1.建立mapper，reducer，job（將三者放在一個類中或者分開寫）

package cn.lsm.bigdata.sumflow;

import java.io.IOException;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.Mapper;
import org.apache.hadoop.mapreduce.Reducer;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;

public class flowcount {
      /**
       * mapper
       */
      static class flowcountMapper extends Mapper<LongWritable, Text, Text, flowBean> {
           @Override
           protected void map(LongWritable key, Text value, Context context) throws IOException, InterruptedException {
                 String line = value.toString();
                 String[] fields = line.split("\t");

                 String phone = fields[1];

                 long upFlow = Long.parseLong(fields[fields.length - 3]);
                 long downFlow = Long.parseLong(fields[fields.length - 2]);
                 // long sumFlow=upFlow+downFlow;

                 context.write(new Text(phone), new flowBean(upFlow, downFlow));
           }
      }

      /**
       * reducer
       */
      static class flowcountReducer extends Reducer<Text, flowBean, Text, flowBean> {
           @Override
           protected void reduce(Text key, Iterable<flowBean> values, Context context)
                      throws IOException, InterruptedException {

                 // 定義上行流量和下行流量的數量
                 long upflowNum = 0;
                 long downflowNum = 0;

                 // 迴圈新增相同號碼的上行和下行流量
                 for (flowBean value : values) {
                      upflowNum += value.getUpflow();
                      downflowNum += value.getDownflow();
                 }

                 // 建立一個新的flowBean來存放結果
                 flowBean result = new flowBean(upflowNum, downflowNum);

                 context.write(key, result);
           }
      }

      /**
       * job
       */
      public static void main(String[] args) throws Exception {
           Configuration conf = new Configuration();
           Job myjob = Job.getInstance(conf);

           myjob.setJarByClass(flowcount.class);

           myjob.setMapperClass(flowcountMapper.class);
           myjob.setReducerClass(flowcountReducer.class);

           myjob.setMapOutputKeyClass(Text.class);
           myjob.setMapOutputValueClass(flowBean.class);

           myjob.setOutputKeyClass(Text.class);
           myjob.setOutputValueClass(flowBean.class);

           FileInputFormat.setInputPaths(myjob, new Path(args[0]));
           FileOutputFormat.setOutputPath(myjob, new Path(args[1]));

           myjob.waitForCompletion(true);
      }
}

2.建立輸出類

package cn.lsm.bigdata.sumflow;

import java.io.DataInput;
import java.io.DataOutput;
import java.io.IOException;

import org.apache.hadoop.io.Writable;
import org.apache.hadoop.io.WritableComparable;

public class flowBean implements Writable {
    // 上行流量
    private long upflow;
    // 下行流量
    private long downflow;
    // 總流量
    private long sumflow;

    //反序列化時，需要反射呼叫空參建構函式，所以需要
    public flowBean(){};

    public flowBean(long upflow, long downflow) {
        this.upflow = upflow;
        this.downflow = downflow;
        this.sumflow = upflow + downflow;
    }

    public long getUpflow() {
        return upflow;
    }

    public void setUpflow(long upflow) {
        this.upflow = upflow;
    }

    public long getDownflow() {
        return downflow;
    }

    public void setDownflow(long downflow) {
        this.downflow = downflow;
    }

    public long getSumflow() {
        return sumflow;
    }

    public void setSumflow(long sumflow) {
        this.sumflow = sumflow;
    }

    @Override
    public String toString() {
        return upflow + "\t" + downflow + "\t" + sumflow;
    }

    // 序列化
    @Override
    public void write(DataOutput out) throws IOException {
        out.writeLong(upflow);
        out.writeLong(downflow);
        out.writeLong(sumflow);
    }

    // 反序列化
    @Override
    public void readFields(DataInput in) throws IOException {
        upflow = in.readLong();
        downflow = in.readLong();
        sumflow = in.readLong();
    }

}

3.將封裝好的jar，傳到叢集中，執行 hadoop jar flowcount1.jar cn.lsm.bigdata.sumflow.flowcount /review/input /review/output

執行正確的過程和結果是：

結果：

Hadoop的計算上下行流量的案例

問題：統計每一使用者的（手機號）所消耗的總的上行流量，下行流量，總流量思路：1.建立mapper，reducer，job 2.與之間的worcount的區別在於，輸出的結果不是一個，而是多個，所以需要我們將需要輸出的資料封裝到一個類中 1.建立ma

Hadoop 7days -hadoop序列化機制及使用maven開發 MR統計上下行流量的例子開發

MR執行流程:(1).客戶端提交一個mr的jar包給JobClient(提交方式：hadoop jar ...)(2).JobClient通過RPC和ResourceManager進行通訊，返回一個存放jar包的地址（HDFS）和jobId(3).client將jar包寫入到

Hadoop單點部署與案例開發（微博用戶數據分析）

環境搭建 hadoop 數據分析微博用戶一、環境搭建1、Hadoop運行環境搭建1.1 安裝虛擬機（1）下載並安裝VMware虛擬機軟件。（2）創建虛擬機，實驗環境虛擬機配置如下圖所示。（3）安裝Ubuntu系統，安裝結果如下圖所示。1.2 配置JDK環境下載並安裝JDK，安裝結束後需對

Ubuntu 16.04安裝indicator-sysmonitor實現導航條顯示上下行網速/CPU/內存使用率

mem cnblogs http sudo images ica cpu 上下實現安裝： sudo add-apt-repository ppa:fossfreedom/indicator-sysmonitor sudo apt-get update sudo

測試Hadoop hdfs 上傳與 mr

一個 nbsp 輸入 sco sha bin apr art 文檔 1.隨便在哪個目錄新增一個文檔。內容隨便輸入 mkdir words 2.在hdfs 中新建文件輸入目錄 ./hdfs dfs -mkdir /test 3.把新建的文檔 (/home/

一個完整的springmvc + ajaxfileupload實現圖片上傳的案例

multipart per cnblogs not his let facade func connector 一，原理詳細原理請看這篇文章 springmvc + ajaxfileupload解決ajax不能異步上傳圖片的問題。java.lang.ClassCastEx

Linux上下行網速測試

上下行網速 speedtest 此程序是基於Python開發的腳本程序，利用了speedtest.net的服務來測量出上下行的寬帶。Speedtest-cli能根據機房離測速服務器的物理距離來列出測速服務器，或者針對某一服務器進行測速，同時還能為你生成一個URL以便你分享你的測速結果。要在Lin

hadoop計算二度人脈關系推薦好友

轉載 xtend java class .class text 去重 QQ -m https://www.jianshu.com/p/8707cd015ba1 問題描述：以下是qq好友關系，進行好友推薦，比如：老王和二狗是好友，二狗和春子以及花朵是好友，那麽

LVS實現FTP的上傳流量的負載均衡

負載均衡 LVS 文件上傳工作中遇到上百臺機器向一個集群環境（大約10臺機器）上傳文件的場景，想到了使用LVS來做ftp服務器的負載均衡。但是NAT模式下請求、響應報文都要經過Director Server，在高負載的場景下Director Server的就會成為瓶頸。而雖然DR模式和TUN模

hadoop--Hadoop生態上幾個技術的關系與區別：hive、pig、hbase 關系與區別

正是讀寫操作 java 結構化映射 map 外部表 base metastore Pig 一種操作hadoop的輕量級腳本語言，最初又雅虎公司推出，不過現在正在走下坡路了。當初雅虎自己慢慢退出pig的維護之後將它開源貢獻到開源社區由所有愛好者來維護。不過現在還是有些公司

EMR：一體化Hadoop雲上工作平臺

不足科學家 bin 允許 oozie 庫存通信 streaming ase 摘要： Hadoop生態體系日臻完善，如何利用Hadoop生態各項技術與阿裏雲更好的服務於企業。EMR最新發布的工作流管理、彈性伸縮、異構計算多項功能，更好的助力用戶在阿裏雲上利用Hadoop、

習題 13.2 從鍵盤輸入一批數值，要求保留3位小數，在輸出時上下行小數點對齊。

C++程式設計（第三版）譚浩強習題13.2 個人設計習題 13.2 從鍵盤輸入一批數值，要求保留3位小數，在輸出時上下行小數點對齊。程式碼塊： #include <iostream> #include <iomanip> using names

MapReduce 自定義屬性類（輸出電話號對應的上行，下行流量及其總計，並排序）

MapReduce 自定義屬性類注意要點：無參構造方法繼承 Writable類重寫write() readFields()方法相關錯誤： java.lang.Exception: java.lang.RuntimeExceptio

MapReduce 統計手機使用者的上行流量，下行流量，總流量，並對輸出的結果進行倒序排序。（二），劃分省份，輸出到不同的檔案

在（一）的基礎上，寫一個自己的partitioner就好了。分割槽的預設實現HashPartitioner，它根據key的hashcode和Interger. 在Reduce過程中，可以根據實際需求（比如按某個維度進行歸檔，類似於資料庫的分組），把Map完的資

MapReduce 統計手機使用者的上行流量，下行流量，總流量，並對輸出的結果進行倒序排序。（一）

首先，要知道hadoop自帶的LongWritable 是沒辦法儲存三個變數，即使用者的上行流量，下行流量，總流量。這個時候，沒辦法，你就要去寫一個屬於你自己的介面，去實現能夠放入這三個資料。 MapReduce中傳輸自定義資料型別（Bean->setter+

關於CKEditor4 5 6的使用，自定義toolbar配置，上傳圖片案例（SpringMVC+MyBatis案例），

分享一下我老師大神的人工智慧教程！零基礎，通俗易懂！http://blog.csdn.net/jiangjunshow 也歡迎大家轉載本篇文章。分享知識，造福人民，實現我們中華民族偉大復興！

統計每一個使用者(手機號)所耗費的上行流量,下行流量,總流量

假設從資料運營商可以獲取使用者(通過手機號來區分)的上網資訊: 1363157985066 13726230503 00-FD-07-A4-72-B8:CMCC 120.196.100.82 i02.c.aliimg.com 24 27 2481 24681 200 13631579

【Java筆記】TCP上傳圖片案例分析

要求：從客戶端上傳一張圖片到伺服器，伺服器將圖片儲存在指定資料夾中，伺服器反饋上傳成功。（本質是檔案複製，只要有資料來源和資料目的即可）客戶端：資料來源是電腦某碟符下的某張照片資料目的

上下行參考訊號RS

本文轉載阿米爾部落格：http://blog.csdn.net/m_052148/article/details/51360400 做了LTE這麼久，一直對參考訊號模模糊糊，分不清上行、下行參考訊號。只記得有一個圖，一個天線埠，參考訊號怎麼對映，兩個天線埠怎麼對映。具體也不知道參考訊號有哪

上下行harq概念

1：上行harq是對UE發往eNode資料pusch進行反饋及相應重傳處理流程。上行harq是同步，ACK/NACK反饋和重傳有固定的時序關係。下行harq是對enodeb發往UE資料pdsch進行反饋及相應重傳處理流程。下行h

Hadoop的計算上下行流量的案例

相關推薦