編寫MapReduce程式（簡單的電話被呼叫分析程式）

阿新 • • 發佈：2018-12-09

由於Hadoop 2.2.0目前還沒有好用的Eclipse外掛，目前使用Eclipse上編寫程式碼，而後放到Hadoop環境執行的形式。

準備工作：

1、搭建Hadoop環境，建立專案，專案的BuildPath中新增所有Hadoop中的jar包；

2、構造資料集：每一行資料兩個號碼組成，呼叫號和被呼叫號，生成隨機測試資料，將生成的檔案放入hdfs中；

import java.io.BufferedOutputStream;
import java.io.File;
import java.io.FileOutputStream;
import java.io.OutputStream;
import java.util.Random;

public class GenerateTestData {
	public static void writeToFile(String fileName) throws Exception{
		 OutputStream out = new FileOutputStream(new File(fileName));
		 BufferedOutputStream bo = new BufferedOutputStream(out);
		 
		 Random rd1 = new Random();
		 
		 for(int i=0; i<10000; i++){
			 int j=0;
			 StringBuffer sb = new StringBuffer("");
			 sb.append(1);
			 for(j=1;j<9;j++){
				 sb.append(rd1.nextInt(10));
				 //bo.write(rd1.nextInt(10));
			 }
			 sb.append(" ");
			 switch(rd1.nextInt(10)){
			    case 1:
			    	sb.append("10086");
			    	break;
			    case 2:
			    	sb.append("110");
			    	break;
			    case 3:
			    	sb.append("120");
			    	break;
			    case 4:
			    	sb.append("119");
			    	break;
			    case 5:
			    	sb.append("114");
			    	break;
			    case 6:
			    	sb.append("17951");
			    	break;
			    case 7:
			    	sb.append("10010");
			    	break;
			    case 8:
			    	sb.append("13323567897");
			    	break;
			    default:
			    	sb.append(1);
					 for(j=1;j<9;j++){
						 sb.append(rd1.nextInt(10));
						 //bo.write(rd1.nextInt(10));
					 }
			    	break;
			    
			 }
			
			 
			 sb.append("\r\n");
			 bo.write(sb.toString().getBytes());
		 }
	}
	
	public static void main(String[] args) {
			 try {
				writeToFile("d://helloa.txt");
				System.out.println("finish!");
			} catch (Exception e) {
				e.printStackTrace();
			}

	}

}

MapReduce程式如下，目前編寫的程式參考自Hadoop權威指南，用的還是老版本的API：

import java.io.IOException;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.conf.Configured;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.Mapper;
import org.apache.hadoop.mapreduce.Reducer;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;
import org.apache.hadoop.util.Tool;
import org.apache.hadoop.util.ToolRunner;

public class FirstTest extends Configured implements Tool{

	enum Counter{
		LINESKIP,
	}
	
	public static class Map extends Mapper<LongWritable, Text, Text, Text>{
		@Override
		public void map(LongWritable key, Text value, Context context)
			      throws IOException, InterruptedException{
			String line = value.toString();
			
			try {
				String []arr = line.split(" ");
				context.write(new Text(arr[1]), new Text(arr[0]));
			} catch (Exception e) {
				context.getCounter(Counter.LINESKIP).increment(1);
			}
		}
	}
	
	
	public static class Reduce extends Reducer<Text,Text,Text,Text>{
		@Override
		public void reduce(Text key, Iterable<Text> values,Context context)throws IOException, InterruptedException{
			String out = "";
			for(Text t:values){
				out += t.toString()+"|";
			}
			context.write(key, new Text(out));
		}
	}
	
	@Override
	public int run(String[] args) throws Exception {
		
		Configuration conf = getConf();
		
		Job job = new Job(conf, "First Map-Reduce Program");
	    job.setJarByClass(getClass());

	    FileInputFormat.addInputPath(job, new Path(args[0]));
	    FileOutputFormat.setOutputPath(job, new Path(args[1]));
	    
	    job.setMapperClass(Map.class);
	    job.setReducerClass(Reduce.class);
	    
	    job.setOutputKeyClass(Text.class);
	    job.setOutputValueClass(Text.class);
	    
	    job.waitForCompletion(true);
		return job.isSuccessful()?0:1;
	}
	
	public static void main(String[] args) throws Exception {
	    int exitCode = ToolRunner.run(new Configuration(),new FirstTest(), args);
	    System.exit(exitCode);
		
	  }

}

在linux下編譯構造jar檔案後在hadoop環境執行：
hadoop jar FirstTest.jar /input/helloa.txt /output

注意出現的問題：

1、由於是在Eclipse編寫的程式，加了package，但是在Linux下打包時直接使用了jar cvfm abc.jar ..的命令，導致hadoop執行jar包時總提示找不到main class；

2、在linux下編譯時，FirstTest.java檔案是放在了HADOOP_CLASSPATH下編譯，在此目錄執行hadoop jar FirstTest.jar /input/helloa.txt /output時提示FirstTest&Map類找不著，將生成的FirstTest.jar放入其他目錄後執行正常。

編寫MapReduce程式（簡單的電話被呼叫分析程式）

由於Hadoop 2.2.0目前還沒有好用的Eclipse外掛，目前使用Eclipse上編寫程式碼，而後放到Hadoop環境執行的形式。準備工作： 1、搭建Hadoop環境，建立專案，專案的BuildPath中新增所有Hadoop中的jar包； 2、構造資料集：每一行資料兩個號碼組成，

我的第一個Python程式（簡單的使用者名稱密碼登入程式）

話說啊，所謂的C語言1000行，Java100行，Python20行呢。。。光一個登入就30行了。、一個輸入使用者名稱密碼的登入程式： init_usrname=input('Please en

hadoop編寫MapReduce例子（附有程式碼）

開發環境：hadoop2.6.5， jdk1.8. ubuntu14系統 1.在本地寫好程式碼（eclipse寫的，當時沒用maven，直接把jar引到程式裡了） 2.打成jar包（eclipse右鍵專案，點選export，選擇jar包型別），打jar包的時

S2.1 修復影象小程式（簡單版）

用OpenCV自帶的inpaint()演示 CV_EXPORTS_W void inpaint( InputArray src, InputArray inpaintMask, OutputArray dst, double inpaintRad

簡單的聊天程式（java的socket+多執行緒）

服務端 import java.net.*; import java.util.*; import java.io.*; public class ChatServer { ServerSocket server = null; Collection

matlab練習程式（簡單多邊形的核）

還是計算幾何，多邊形的核可以這樣理解：這個核為原多邊形內部的一個多邊形，站在這個叫核的多邊形中，我們能看到原多邊形的任何一個位置。演算法步驟如下： 1.根據原多邊形最大和最小的x,y初始化核多邊形，就是個矩形。 2.計算多邊形當前處理的點的凹凸性。 3.用當前點與其後繼點構成直線，判斷當前點的前驅

某些抽象類中有呼叫抽象方法的程式碼的原因（抽象方法不是不能被呼叫嗎？）

以下是轉載內容：記住：抽象方法是不能呼叫的原因就是抽象方法沒有方法體。但是，在一個類中定義了一個抽象方法，在這個類或這個類的子類中是可以呼叫的。為什麼可以呼叫呢？因為，具有抽象方法的類，一定是一個抽象類，而抽象類在被繼承的時候，必須重寫這個抽象類的抽象方法，而且，抽象類

支付寶面試題： 30秒內限制某方法被呼叫100次（一個時間段限制方法被呼叫的次數）

假設一個Class的方法 a，被限定30秒內只能被呼叫100次，如何實現。當時沒答上，回來補上 1、定義呼叫介面Icallee public interface Icallee {public void play(); } 2、實現呼叫介面類 publi

連續數的相加（簡單的函數的應用）

i++ oid add print inpu for include std input 如 3+4+5+6+7等 #include <stdio.h>void addres(int x,int y){ int i; int sum=0;

論文筆記——An online EEG-based brain-computer interface for controlling hand grasp using an adaptive probabilistic neural network（10年被引用66次）

不同 -s evel 模型 his ren 虛擬 dem virt 題目：利用自適應概率網絡設計一種在線腦機接口樓方法控制手部抓握概要：這篇文章提出了一種新的腦機接口方法，控制手部，系列手部抓握動作和張開在虛擬現實環境中。這篇文章希望在現實生活中利用腦機接口技術控制抓握。

編寫MapReduce程式（簡單的電話被呼叫分析程式）

編寫MapReduce程式（簡單的電話被呼叫分析程式）

我的第一個Python程式（簡單的使用者名稱密碼登入程式）

hadoop編寫MapReduce例子（附有程式碼）

S2.1 修復影象小程式（簡單版）

簡單的聊天程式（java的socket+多執行緒）

matlab練習程式（簡單多邊形的核）

某些抽象類中有呼叫抽象方法的程式碼的原因（抽象方法不是不能被呼叫嗎？）

支付寶面試題： 30秒內限制某方法被呼叫100次（一個時間段限制方法被呼叫的次數）

連續數的相加（簡單的函數的應用）

論文筆記——An online EEG-based brain-computer interface for controlling hand grasp using an adaptive probabilistic neural network（10年被引用66次）

微信小程式（看文件寫例項十）微信小程式課堂寶APP實現我的模組相關介面及邏輯

微信小程式（看文件寫例項八）微信小程式課堂寶APP實現練習模組前臺

微信小程式（看文件寫例項七）微信小程式課堂寶APP實現線上課堂測試

微信小程式（看文件寫例項六）微信小程式課堂寶APP實現簽到邏輯

微信小程式（看文件寫例項五）微信小程式課堂寶APP實現獲取簽到列表

微信小程式（看文件寫例項四）微信小程式課堂寶APP實現簽到子頁面佈局及課程視訊播放頁面

微信小程式（看文件寫例項三）微信小程式課堂寶APP實現整體介面框架及首頁佈局

Java設計模式（一）之建立型模式：工廠模式（簡單工廠模式+工廠方法模式）

10-8日上課簡記（簡單資料型別與輸入輸出）

2.我的第一個小程式（獲取使用者資訊--包括敏感資訊）

編寫MapReduce程式（簡單的電話被呼叫分析程式）

相關推薦