mr 程式自定義分組的實現

阿新 • • 發佈：2019-10-04

AreaPartitioner

package cn.itcast.hadoop.mr.areapartition;

import java.util.HashMap;
import org.apache.hadoop.mapreduce.Partitioner;

public class AreaPartitioner<KEY, VALUE> extends Partitioner<KEY, VALUE> {

	private static HashMap<String, Integer> areaMap = new HashMap<>();

	static {
		areaMap.put("135", 0);
		areaMap.put("136", 1);
		areaMap.put("137", 2);
		areaMap.put("138", 3);
		areaMap.put("139", 4);
	}

	@Override
	public int getPartition(KEY key, VALUE value, int numPartitions) {
		// 從 key 中拿到手機號，查詢手機歸屬字典，不同省份返回不同的組號

		int areaCoder = areaMap.get(key.toString().substring(0, 3)) == null ? 5
				: areaMap.get(key.toString().substring(0, 3));

		return areaCoder;
	}

}

FlowSumArea

package cn.itcast.hadoop.mr.areapartition;

import java.io.IOException;
import org.apache.commons.lang.StringUtils;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.Mapper;
import org.apache.hadoop.mapreduce.Reducer;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;
import cn.itcast.hadoop.mr.flowsum.FlowBean;


/**
 * 對流量原始日誌進行流量統計，將不同省份的使用者統計結果輸出到不同檔案
 * 需要自定義改造兩個機制：
 * 1.改造分割槽的邏輯，自定義一個parttioner
 * 2.自定義 reduce task 的併發任務數量
 * 
 * @author [email protected]
 *
 */
public class FlowSumArea {

	public static class FlowSumAreaMapper extends Mapper<LongWritable, Text, Text, FlowBean>{
		
		@Override
		protected void map(LongWritable key, Text value,Context context)
				throws IOException, InterruptedException {

			//拿一行資料
			String line = value.toString();
			//切分各個欄位
			String[] fields = StringUtils.split(line, "\t");
			
			//拿到我們需要的欄位
			String phoneNB = fields[1];
			long u_flow = Long.parseLong(fields[7]);
			long d_flow = Long.parseLong(fields[8]);
			
			//封裝成 kv 並輸出
			context.write(new Text(phoneNB), new FlowBean(phoneNB,u_flow,d_flow));

		}
		
		
	}
	
	
	public static class FlowSumAreaReducer extends Reducer<Text, FlowBean, Text, FlowBean>{
		
		@Override
		protected void reduce(Text key, Iterable<FlowBean> values,Context context)
				throws IOException, InterruptedException {

			long up_flow_counter = 0;
			long d_flow_counter = 0;
			
			for(FlowBean bean: values){
				
				up_flow_counter += bean.getUp_flow();
				d_flow_counter += bean.getD_flow();
				
				
			}
			
			context.write(key, new FlowBean(key.toString(), up_flow_counter, d_flow_counter));
			
			
			
		}
		
	}
	
	public static void main(String[] args) throws Exception {
		
		Configuration conf = new Configuration();
		Job job = Job.getInstance(conf);
		
		job.setJarByClass(FlowSumArea.class);
		
		job.setMapperClass(FlowSumAreaMapper.class);
		job.setReducerClass(FlowSumAreaReducer.class);
		
		//設定我們自定義的邏輯定義
		job.setPartitionerClass(AreaPartitioner.class);
		
		
		job.setOutputKeyClass(Text.class);
		job.setOutputValueClass(FlowBean.class);
		
		//設定reduce的任務併發數，應該跟分組的數量保持一致
		job.setNumReduceTasks(6);
		
		
		FileInputFormat.setInputPaths(job, new Path(args[0]));
		FileOutputFormat.setOutputPath(job, new Path(args[1]));
		
		
		System.exit(job.waitForCompletion(true)?0:1);
		
		
	}
	
	
}

打包 jar 包，上傳：

上面最後一個加個 2 。。

reduce 併發數量如果 < 分組數，會報錯；但是改成 1 不會報錯。。。

reduce 併發數量如果 < 分組數，多的分組沒有資料

map 不會涉及到業務邏輯，，如果有 10 個map ，每個就處理 1/10 的資料，map 的併發量是可以任意去設定的。

mr 程式自定義分組的實現

AreaPartitioner package cn.itcast.hadoop.mr.areapartition; import java.util.HashMap; import org.apache.hadoop.mapreduce.Partitione

微信小程式自定義元件實現地址單級連續選擇（拼多多APP地址選擇樣式）

最終效果在首先在page資料夾下建立components資料夾，在components資料夾下建立region-picker的資料夾，然後在region-picker資料夾下建立Component名稱為region-picker。 region-picke

使用微信小程式自定義元件實現的tabs選項卡功能

一個自定義元件由 json wxml wxss js 4個檔案組成。要編寫一個自定義元件，首先需要在 json 檔案中進行自定義元件宣告（將 component 欄位設為 true 可這一組檔案設為自定義元件） components/navigator/i

大資料入門（11）mr自定義分組和切片劃分

public class AreaPartitioner<KEY, VALUE> extends Partitioner<KEY, VALUE>{ private static HashMap<String,Integer> areaMa

微信小程式自定義欄位實現選項的動態新增和刪除

問題描述：在自定義選項中，點選新增選項按鈕，會出現一個選項的輸入框，輸入的選項可以通過點選左側的減號刪除效果如圖：解決過程： 1.首先寫出大體的框架。在pages下，建立了一個selfdefine的資料夾，在wxml中寫出靜態結構 selfdefine.wxml 說明

微信小程式自定義單選複選按鈕組的實現(用於實現購物車產品列表功能)

（一）單選按鈕組模型圖如下： index.js Page({ data: { parameter: [{ id: 1, name: '銀色' }, { id: 2, name: '白色' },{ id: 3, name: '黑色' }],//模擬商

微信小程式自定義tab，多層tab巢狀實現

小程式最近是越來越火了…… 做小程式有一段時間了，總結一下專案中遇到的問題及解決辦法吧。專案中有個多 tab 巢狀的需求，進入程式主介面下面有兩個 tab，進入A模組後，A模組最底下又有多個tab，每個tab上又嵌了2-4個不等的tab。。。這種變

微信小程式自定義toast的簡單實現

小程式官方文件裡面的wx.showToast(OBJECT)比較侷限，沒法把圖示去掉，用起來有很多不方便，趁有空就還是自己寫個簡單的出來用用吧！具體實現：wxml：wxss：js：為了方便呼叫，我把js

Hadoop之——自定義分組比較器實現分組功能

不多說，直接上程式碼,大家都懂得 1、Mapper類的實現 /** * Mapper類的實現 * @author liuyazhuang * */ static class MyMapper extends Mapper<LongWrita

小程式自定義元件的具體實現+頁面與自定義元件間的通訊

具體步驟如下： 1.建立一個元件圖中的singerList就是一個元件，元件為了規範通常放在conponents裡。 2.在頁面的json檔案裡引用元件 //想在index

Android -- 自定義view實現keep歡迎頁倒計時效果

super onfinish -m use new getc awt ttr alt 1，最近打開keep的app的時候，發現它的歡迎頁面的倒計時效果還不錯，所以打算自己來寫寫，然後就有了這篇文章。 2，還是老規矩，先看一下我們今天實現的效果　　相較於我們常見的倒計時

Android自定義View——實現水波紋效果類似剩余流量球

string 三個點 pre ber block span 初始化 move 理解最近突然手癢就想搞個貝塞爾曲線做個水波紋效果玩玩，終於功夫不負有心人最後實現了想要的效果，一起來看下吧：效果圖鎮樓一：先一步一步來分解一下實現的過程需要繪制一個正弦曲線(sin

Android自定義processor實現bindView功能

lis dds 定義 java代碼 cli 註冊文章 type() mage 一、簡介在現階段的Android開發中，註解越來越流行起來，比如ButterKnife，Retrofit，Dragger，EventBus等等都選擇使用註解來配置。按照處理時期，註解又分為兩

自定義toast實現

web javascript html5 toast ys_toast.css.ys-toast{ position:fixed; left:0; right:0; top:0; bottom:0; z-index: 999999; } .ys-toast>em{ pos

SpringVC 攔截器+自定義註解實現權限攔截

json.js 加載 bean media tar attr esp 權限 encoding 1.springmvc配置文件中配置 <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://w

自定義ScrollView 實現上拉下拉的回彈效果--並且子控件中有Viewpager的情況

是否 AS abs pri tar utils lda animation ted onInterceptTouchEvent就是對子控件中Viewpager的處理：左右滑動應該讓viewpager消費 1 public class MyScrollView ext

[python]RobotFramework自定義庫實現UI自動化

bubuko output source 自動封裝 9.png 全局變量詳細變量 1.安裝教程環境搭建不多說，網上資料一大堆，可參考https://www.cnblogs.com/puresoul/p/3854963.html，寫的比較詳細，值得推薦。目前pyt

NPOI+反射+自定義特性實現上傳excel轉List及驗證

type set custom pre script private property xssf don 1.自定義特性 [AttributeUsage(AttributeTargets.Property, AllowMultiple = false, Inherited

Android bc信用盤搭建自定義behavior 實現上滑隱藏底部view

退出 Y軸 log rect app sum string dsl oss 布局 <android.support.design.widget.CoordinatorLayout android:layout_width="match_parent"

13、自定義Analyzer實現字長過濾

import org.apache.lucene.analysis.Analyzer; import org.apache.lucene.analysis.TokenStream; import org.apache.lucene.analysis.Tokenizer; import org.a

mr 程式自定義分組的實現

相關推薦