結合案例講解MapReduce重要知識點 --------- 簡單排序

阿新 • • 發佈：2018-12-20

import java.io.IOException;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.Mapper;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;

/**
 * 
 * @author lyd
 *簡單排序
 *
 *資料：
 *
 *899
 *45
 *654564
 *432
 *45236
 *76
 *654
 *32
 *643
 *45
 *754
 *34
 *
 *
 *詞頻統計並按照次數高低排序？？取前三個？？
 *hello qianfeng hello qianfeng world hello hadoop hello qianfeng hadoop
 hello 4
 qianfeng 3
 hadoop 2
 *
 */
public class SortSample {
	//自定義myMapper
	public static class MyMapper extends Mapper<LongWritable, Text, IntWritable, Text>{
		//只在map方法執行之前執行一次。(僅執行一次)
		@Override
		protected void setup(Context context)
				throws IOException, InterruptedException {
		}

		@Override
		protected void map(LongWritable key, Text value,Context context)
				throws IOException, InterruptedException {
			context.write(new IntWritable(Integer.parseInt(value.toString())), new Text(""));
		}
		
		//map方法執行完後執行一次(僅執行一次)
		@Override
		protected void cleanup(Context context)
				throws IOException, InterruptedException {
		}
	}
	
	/*//自定義myReducer
	public static class MyReducer extends Reducer<Text, Text, Text, Text>{
		//在reduce方法執行之前執行一次。(僅一次)
		@Override
		protected void setup(Context context)
				throws IOException, InterruptedException {
		}

		@Override
		protected void reduce(Text key, Iterable<Text> value,Context context)
				throws IOException, InterruptedException {
			context.write(new Text(value.toString()), new Text(""));
		}
		//在reduce方法執行之後執行一次。(僅一次)
		@Override
		protected void cleanup(Context context)
				throws IOException, InterruptedException {
		}
	}*/
	
	/**
	 * job的驅動方法
	 * @param args
	 */
	public static void main(String[] args) {
		try {
			//1、獲取Conf
			Configuration conf = new Configuration();
			conf.set("fs.defaultFS", "hdfs://hadoop01:9000");
			//2、建立job
			Job job = Job.getInstance(conf, "model01");
			//3、設定執行job的class
			job.setJarByClass(SortSample.class);
			//4、設定map相關屬性
			job.setMapperClass(MyMapper.class);
			job.setMapOutputKeyClass(IntWritable.class);
			job.setMapOutputValueClass(Text.class);
			FileInputFormat.addInputPath(job, new Path(args[0]));
			
			//5、設定reduce相關屬性
			/*job.setReducerClass(MyReducer.class);
			job.setOutputKeyClass(Text.class);
			job.setOutputValueClass(Text.class);*/
			//判斷輸出目錄是否存在，若存在則刪除
			FileSystem fs = FileSystem.get(conf);
			if(fs.exists(new Path(args[1]))){
				fs.delete(new Path(args[1]), true);
			}
			FileOutputFormat.setOutputPath(job, new Path(args[1]));
			
			//6、提交執行job
			int isok = job.waitForCompletion(true) ? 0 : 1;
			
			//退出
			System.exit(isok);
			
		} catch (IOException | ClassNotFoundException | InterruptedException e) {
			e.printStackTrace();
		}
	}
}

結合案例講解MapReduce重要知識點 --------- 簡單排序

import java.io.IOException; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.FileSystem; import org.apache.hadoop.

結合案例講解MapReduce重要知識點 -------- 記憶體排序

TOP N 資料： hello qianfeng hello qianfeng qianfeng is best qianfeng better hadoop is good spark is nice 取統計後的前三名： qianfeng 4 is

結合案例講解MapReduce重要知識點 -------- 使用自定義資料實現記憶體排序

自定義資料WCData import java.io.DataInput; import java.io.DataOutput; import java.io.IOException; import org.apache.hadoop.io.WritableComparab

結合案例講解MapReduce重要知識點 ------- 使用自定義MapReduce資料型別實現二次排序

自定義資料型別SSData import java.io.DataInput; import java.io.DataOutput; import java.io.IOException; import org.apache.hadoop.io.WritableCompa

結合案例講解MapReduce重要知識點 ----------- 自定義MapReduce資料型別（1）重寫Writable介面

重寫Writable介面如下程式碼就是自定義mr資料型別，在wordcount類使用它。 WordCountWritable import java.io.DataInput; import java.io.DataOutput; import java.io.IOE

結合案例講解MapReduce重要知識點 --------- 多表連線

第一張表的內容： login： uid sexid logindate 1 1 2017-04-17 08:16:20 2 2 2017-04-15 06:18:20 3 1 2017-04-16 05:16:24 4 2 2017-04-14 03:18:20

結合題目講解“快速排序演算法”

　　理論很豐滿，實戰很骨感，作為一個嫌棄自己的胖子，我對實戰很是熱衷，導致總是對理論知識不上心，做題的時候就蒙了。　　比如有這樣一道自考題：　　看完以後第一感覺就是翻書，因為覺得過了一遍書中知

spring心得3--bean的生命週期結合案例詳細講解@普通期圖解與uml圖解一併分析

1.繼上一篇部落格續將，bean生命週期理論概括 bean被載入到容器中時，他的生命週期就開始了。bean工廠在一個bean可以使用前完成很多工作： 1）.容器尋找bean的定義資訊並例項化。 2）.使用依賴注入，spring按bean定義資訊配置bean的所有屬性。 3）

詳細講解MapReduce二次排序過程

我在15年處理大資料的時候還都是使用MapReduce, 隨著時間的推移, 計算工具的發展, 記憶體越來越便宜, 計算方式也有了極大的改變. 到現在再做大資料開發的好多同學都是直接使用spark, hive等工具, 很少有再寫MapReduce的了. 這裡整理一下MapReduce中經常用到的二次排序的方

大資料（hadoop-mapreduce案例講解）

package com.vip; import java.io.IOException; import java.util

JS重要知識點總結-不完善

子函數必須 his 代碼規範重要 line java 全局 lba ###1、閉包 ??閉包就是能夠讀取其他函數內部變量的函數。由於在Javascript語言中，只有函數內部的子函數才能讀取局部變量，因此可以把閉包簡單理解成"定義在一個函數內部的函數"。所以，在本質上，

一種排序（nyoj8）（簡單排序）

scan http -a tdi 輸入 clu truct clr -c 一種排序時間限制：3000 ms | 內存限制：65535 KB 難度：3 描寫敘述如今有非常多長方形。每個長方形都有一個編號，這個編號能夠反復。還知道

(九)數據結構之簡單排序算法實現：冒泡排序、插入排序和選擇排序

html lan 獎章 tmx 4tb wot 數據結構 lec get d59FG8075P7伊http://www.zcool.com.cn/collection/ZMTg2NTU2NjQ=.html 312V畏蝗淤ZP哦睬http://www.zcool.com.c

C 雙向鏈表的簡單排序實現

rtb swap 結構 code str 表頭 urn else 重新今天偶爾看到了C結構體的單項鏈表。於是重新溫習了下雙向鏈表，重寫了下雙向鏈表的簡單排序實現，當做溫習總結吧。先定義雙向鏈表 1 struct Student{ 2 int studentI

nginx知識點簡單回顧

:hover https 備份文件靜默 -s config 連接數量 aps 數據庫 html { font-family: sans-serif } body { margin: 0 } article,aside,details,figcaption,figure,f

數據結構--排序--簡單排序

時間復雜度移動 ble turn cnblogs rgs 控制 ins args 1 /*插入排序--是基本排序裏面性能比較好的(比較適合基本有序的排序) 2 *排序的思想：一個序列，前邊是有序的，後邊是無序的，拿出一個元素進行插入到已經有序 3 *

python- Socket & Mysql 重要知識點

線程進程解釋一對一線程池生產者消費者模型並發基於 ket socket : 解決粘包並發編程生產者消費者模型進程池和線程池回調函數 GIL全局解釋器

排序_簡單排序_冒泡排序

str 中一 nbsp wap color new 指向冒泡 temp 冒泡排序有三個記錄值，其中的兩個指向需要比較的兩個對象，其中一個指向需要排序的數值的末尾值。in，in+1，out public class ArrayBub { private long

排序_簡單排序_選擇排序

排序 bsp array 數據 log 其中 test args pri 選擇排序是有三個記錄值，其中一個記錄值標記著需要比較的數組的第一個值，也是變換後的最小值。其中兩個記錄值記錄需要比較的兩個對象，而且記錄臨時最小值的位置和記錄另一個還未比較的數據。 public c

C#入門經典（重要知識點）

指向 ack div abstract 傳遞修飾多少 new blog 一、重載和覆蓋的區別：　　相同點：都涉及兩個同名的方法。　　不同點： 1.類層次：重載涉及的是同一個類的兩個同名方法；.覆蓋涉及的是子類的一個方法和父類的一個方法，這兩個方法同名。

結合案例講解MapReduce重要知識點 --------- 簡單排序

相關推薦