MR模式是模擬實現天氣資料獲取兩次溫度

阿新 • • 發佈：2018-12-20

資料

1949-10-01 14:21:02	34c
1949-10-01 19:21:02	38c
1949-10-02 14:01:02	36c
1950-01-01 11:21:02	32c
1950-10-01 12:21:02	37c
1951-12-01 12:21:02	23c
1950-10-02 12:21:02	41c
1950-10-03 12:21:02	27c
1951-07-01 12:21:02	45c
1951-07-02 12:21:02	46c
1951-07-03 12:21:03	47c

主程式

package com.zyd.tq;

import java.io.IOException;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;



public class TQRunner {
	public static void main(String[] args) throws IOException, ClassNotFoundException, InterruptedException {
		//1 獲取檔案系統
		Configuration conf = new Configuration();
		
		Job job = Job.getInstance(conf);
		
		job.setJarByClass(TQRunner.class);
		job.setJobName("TQ");
		//讀
		FileInputFormat.addInputPath(job, new Path(args[0]));
		FileOutputFormat.setOutputPath(job, new Path(args[1]));
		//map操作
		job.setMapperClass(TQMapper.class);
		//Reduce操作
		job.setReducerClass(TQReducer.class);
		//map的輸出的key和value都是Text
		job.setMapOutputKeyClass(Text.class);
		//如果key不對 啟動任務時候報unable to initialize any output collect
		job.setMapOutputValueClass(Text.class);
		job.waitForCompletion(true);
	}
}

map階段程式碼:

package com.zyd.tq;

import java.io.IOException;

import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Mapper;

/**
 * 
 * @author Administrator
 *傳入輸入的key value 輸入的key value
 *key 精確到年月 value是度數 是字串
 */

public class TQMapper extends Mapper<Object, Text, Text, Text>{

	
	@Override
	/**
	 * 重寫map方法
	 * 
	 */
	protected void map(Object key, Text value,
			Mapper<Object, Text, Text, Text>.Context context)
			throws IOException, InterruptedException {
		//時間和溫度是按製表符隔開的
		String[] split = value.toString().split("\t");
		//時間
		String time = split[0];
		//溫度
		String wd = split[1];
		
		context.write(new Text(time.substring(0,7)),new Text(wd));
		
	}

}

Reduce階段:

	package com.zyd.tq;
	
	import java.io.IOException;
	import java.util.ArrayList;
	import java.util.Collections;
	import java.util.Iterator;
	
	import org.apache.hadoop.io.Text;
	import org.apache.hadoop.mapreduce.Reducer;
	
	/**
	 * 
	 * @author Administrator
	 *根據map分割槽後 <text,text>
	 */
	public class TQReducer extends Reducer<Text, Text, Text, Text> {
	
		@Override
		/**
		 * 相同的key為一組
		 * 
		 * iterable是同一個月裡面所有的溫度,是所有的map直接拉過來以後的
		 */
		protected void reduce(Text key, Iterable<Text> iterable,
				Reducer<Text, Text, Text, Text>.Context context) throws IOException,
				InterruptedException {
			ArrayList<String> list = new ArrayList<String>();
			for(Text text : iterable){
				list.add(text.toString());
			}
			//按照字典排序
			Collections.sort(list);
			
			//得到最高的兩個溫度  即下標的最後兩個
			String maxWD = list.get(list.size()-1);
			String tmp = "";
			if (list.size()>=2) {
				String secondWD = list.get(list.size()-2);
				tmp = ":"+secondWD;
			}
			
			context.write(key,new Text(maxWD+tmp));
		}
	}

MR模式是模擬實現天氣資料獲取兩次溫度

資料 1949-10-01 14:21:02 34c 1949-10-01 19:21:02 38c 1949-10-02 14:01:02 36c 1950-01-01 11:21:02 32c 19

Hadoop實現MR程式模擬實現天氣資料獲取兩次最高溫度

資料 1949-10-01 14:21:02 34c 1949-10-01 19:21:02 38c 1949-10-02 14:01:02 36c 1950-01-01 11:21:02 32c 1950-10-01 12:21:02 37c 1951-12-01 12:21:02

嵌入式核心及驅動開發之學習筆記（八）阻塞模式+中斷實現讀取資料

目前已經學習兩種應用層IO模型的使用非阻塞：立即返回結果，如果想得到期望的結果，要不停的呼叫這個方法（輪詢），非常耗費資源阻塞：沒有得到真正的資料前，不返回結果。此時，程序進入阻塞（休眠）態，直到有資料喚醒程序，這個過程不耗資源。 PS:linux應用中，大部分的函式介面都是阻塞

嵌入式核心及驅動開發之學習筆記（七）非阻塞模式+中斷實現讀取資料

當中斷髮生時，驅動程式會跳轉到中斷處理的函式入口，實現了中斷的捕獲和處理，但這樣還不夠。要讓使用者能夠獲取到中斷分析的結果，我們將建立一個描述中斷事件的結構體物件。硬體產生中斷後，驅動程式碼將對中斷事件的分析結果儲存在結構體變數中，使用者需要的時候，直接通過介面函式獲取這個結構體的資料。核心層

解決中文亂麻問題，頁面端發出的資料作兩次encodeURI

前端URL裡面有中文的時候就要在js裡面進行兩次編碼了 encodeURI(encodeURI(URL)); 後臺解碼： URLDecoder.decode(name,"UTF-8"); URL編碼與兩次encodeURI 當使用位址列提交查詢引數時，如果不編碼，

解決中文亂碼問題，頁面端發出的資料作兩次encodeURI

解決中文亂麻問題，頁面端發出的資料作兩次encodeURIvar name="張三";encodeURI(encodeURI(name));後臺解碼： URLDecoder.decode(name,"UTF-8");------------------------------

Unity3D-實現連續點選兩次返回鍵退出遊戲(安卓/IOS)

Unity3D-連續點選兩次返回鍵退出遊戲本文提供全流程，中文翻譯。Chinar堅持將簡單的生活方式，帶給世人！（擁有更好的閱讀體驗 —— 高解析度使用者請根據需求調整網頁縮放比例）

Echart實現從資料庫獲取資料展示圖表（結合Servlet和SSM實現的兩種例項）

2018年5月30日（UPDATE）: Google郵箱不怎麼上，建議Email [email protected]------------------------------

微信小程式----map元件實現（獲取定位城市天氣或者指定城市天氣資料）

效果圖實現原理採用高德地圖微信小程式開發API（getWeather），如果 city 屬性的值為空（或者沒有city屬性），預設返回定位位置的天氣資料；如果 city 不為空，則

js實現獲取兩個日期之間篩選出指定周日制的方法

js var start = "2017-5-25"; var end = "2017-6-5"; var startTime = new Date(start); var endTime = new Date(end) var timeArr = []; var weekDay = ["1","2

模擬實現任務分配（模板模式）

在實際應用中有這樣一個場景：有m臺伺服器，有n個任務，需要把這n個任務按一定策略分配給m臺伺服器來執行，請按以下要求實現該場景： 1、使用List列表代表伺服器（列表中每個元素為一個IP地址）； 2、使用List列表代表任務（列表中每個元素為任務ID）； 3、分配的過程就是把IP地址與任務ID對

如何用兩個棧模擬實現一個佇列? 如果這兩個堆疊的容量分別是m和n（m>n)，你的方法能保證佇列的最大容量是多少？

保證入隊完畢之後才可以出隊；分析：棧的特點是“後進先出(LIFO)”，而佇列的特點是“先進先出(FIFO)”。用兩個棧模擬實現一個佇列的基本思路是：用一個棧作為儲存空間，另一個棧作為輸出緩衝區，入隊時把元素按順序壓入兩棧模擬的佇列，出隊時按入隊的順序出棧即可。　　　　　如下圖，用容

Spark-Streaming獲取kafka資料的兩種方式：Receiver與Direct的方

簡單理解為：Receiver方式是通過zookeeper來連線kafka佇列，Direct方式是直接連線到kafka的節點上獲取資料回到頂部使用Kafka的高層次Consumer API來實現。receiver從Kafka中獲取的資料都儲存在Spark Exec

獲取天氣資料 (根據天氣介面返回的資料)

第一次寫部落格(如有侵權請通知我,立馬刪除) 獲取天氣資料 (根據天氣介面返回的資料) 介面:心知天氣 ulr:https://api.seniverse.com/v3/pro/weather/grid/now.json?key=your_api_key&location=39.

資料結構-兩個鏈式棧實現一個佇列

#include<stdio.h> #include<stdlib.h> #include<string.h> typedef struct node { int data; struct node *nex

資料結構-兩個鏈式佇列實現一個棧

#include<stdio.h> #include<stdlib.h> #include<string.h> typedef struct node { int data; struct node *next

資料結構（C語言實現）：判斷兩棵二叉樹是否相等，bug求解

判斷兩棵二叉樹是否相等。遇到了bug，求大神幫忙！！！ C語言原始碼： #include <stdio.h> #include <stdlib.h> #include <malloc.h> #define OK 1 #define

【作業系統實驗】python程式碼模擬實現生產者消費者模式

相比C/C++指標的折磨，本人更喜歡python程式碼的簡潔，廢話不多說： from multiprocessing import Process, JoinableQueue import time,

責任鏈設計模式模擬Java Web過濾器的實現

public class Main { public static void main(String[] args) { String msg = "大家好:),<script>,敏感,被就業"; Request request = new Request(); request.se

jQuery使用JSONP實現跨域獲取資料的三種方法詳解

本文例項講述了jQuery使用JSONP實現跨域獲取資料的三種方法。分享給大家供大家參考，具體如下：第一種方法是在ajax函式中設定dataType為'jsonp' $.ajax({ dataType: 'jsonp', url: 'http://www.a

MR模式是模擬實現天氣資料獲取兩次溫度

相關推薦