求好友中互粉的好友對

阿新 • • 發佈：2018-11-20

好友列表：

A:B,C,D,F,E,O
B:A,C,E,K
C:F,A,D,I
D:A,E,F,L
E:B,C,D,M,L
F:A,B,C,D,E,O,M
G:A,C,D,E,F
H:A,C,D,E,O
I:A,O
J:B,O
K:A,C,D
L:D,E,F
M:E,F,G
O:A,H,I,J

分析A裡面好友有B，而B裡面好友有A，那麼A跟B就是互為好友。

我們的Map過程：
將好友列表檔案的每一行資料都進行提取出來，提取成好友：

A:B,C,D,F,E,O

經過Map就變成：

<A-B,NULL>
<A-C,NULL>
<A-D,NULL>
<A-F,NULL>
<A-E,NULL>
<A-O,NULL>

B:A,C,E,K

經過Map就變成

<A-B.NULL>
<B-C,NULL>
<B-E,NULL>
<B-K,NULL>

static class EachFanMapper extends Mapper<LongWritable, Text, Text, NullWritable> {
		Text k = new Text();
		@Override
		protected void map(LongWritable key, Text value, Context context)
				throws IOException, InterruptedException {
				String line = value.toString();
				String user = line.split(":")[0];
				String[] friends = line.split(":")[1].split(",");
				for(int i = 0; i < friends.length; i++) {
					String friend = friends[i];
					/**
					 * 下面這個過程就是關鍵的過程，
					 * 第一行資料 ： A:B,C,D,F,E,O
					 * 第二行資料  ：B:A,C,E,K
					 * A裡面有B，B裡面有A
					 * 現在我們需要獲取這兩個
					 * 那麼我們在map的時候， user 跟 friend 進行組合往reduce輸出的時候，
					 * 我們組合的時候需要進行排序，  
					 * 第一行資料組合  A-B
					 * 第二行如果沒有排序 那麼就是  B-A
					 * 但是我們在reduce進行處理時，需要的是相同的key
					 * 那麼我們應該讓 A-B  與  B-A 變成同一個key往reduce輸出
					 * 這樣reduce才能根據相同的key進行數量的統計
					 * 當數量為2時，就代表，A-B出現了兩次，那麼這一對手機互相關注的。
					 */
					if(user.compareTo(friend) < 0) {
						k.set(user + "-" + friend);
						context.write(k, NullWritable.get());
					} else {
						k.set(friend + "-" + user);
						context.write(k, NullWritable.get());
					}
				}
		}
	}

reduce

static class EachFanReducer extends Reducer<Text, NullWritable, Text, NullWritable> {
		@Override
		protected void reduce(Text key, Iterable<NullWritable> values, Context context) throws IOException, InterruptedException {
			int count = 0;
			for(NullWritable nw : values) {
				count++;
			}
			/**
			 * 嚴格來說，這個count要麼為1 要麼為 2，當為2的時候，就說明是互粉
			 */
			if(count == 2) {
				context.write(key, NullWritable.get());
			}
		}
	}

程式碼
https://gitee.com/tanghongping/hadoopMapReduce/tree/master/src/com/thp/bigdata/eachFan

求好友中互粉的好友對

好友列表： A:B,C,D,F,E,O B:A,C,E,K C:F,A,D,I D:A,E,F,L E:B,C,D,M,L F:A,B,C,D,E,O,M G:A,C,D,E,F H:A,C,D,E,O I:A,O J:B,O K:A,C,D L:D,E,F M:E,F,G O:A,H,

MapReduce案例5——求互粉好友對

題目：A:B,C,D,F,E,O B:A,C,E,K C:F,A,D,I D:A,E,F,L E:B,C,D,M,L F:A,B,C,D,E,O,M G:A,C,D,E,F H:A,C,D,E,O I:A,O J:B,O K:A,C,D L:D,E,F M:E,F,G O:A

MapReduce--求哪些人兩兩之間是互粉好友

for hot on() config args void person ava dex 數據： A:B,C,D,F,E,O B:A,C,E,K C:F,A,D,I D:A,E,F,L E:B,C,D,M,L F:A,B,C,D,E,O,M G:A,C,D,E,F H:A,

求陣列中的逆序對分治法

題目分析：先求前面一半陣列的逆序數，再求後面一半陣列的逆序數，然後求前面一半陣列比後面一半陣列中大的數的個數（也就是逆序數），這三個過程加起來就是整體的逆序數目了。這類似與歸併排序，歸併排序的思想就是把前一段排序，後一段排序，然後再整體排序。而且，歸併排序的規程中，需要判

定義抽象類Shape，抽象方法為showArea()，求出面積並顯示，定義矩形類Rectangle,正方形類Square,圓類 Circle，根據各自的屬性，用showArea方法求出各自的面積，在main方法中構造3個對象，調用showArea方法。（體現多態）

子類 protected new 都是 package 使用類指針 3.1 shape 實現多態的三個條件:1.要有繼承2.要有抽象方法重寫3.用父類指針(引用)指向子類對象重載重寫重定義的區別: 1.重載:在同一個類中進行;　　編譯時根據參數類型和個數決定方法調用;　

求類中創建對象的個數

bubuko public ring oid 分享 src num 設計技術分享使用類的靜態字段和構造函數，可以跟蹤某個類所創建對象的個數。請寫一個類，，在任何時候都可以向它查詢“你已經創建了多少個對象”? 1.設計思想：定義靜態變量，定義構造函數，進行函數實現。 2

計算幾何平面最近點對 nlogn分治演算法求平面中距離最近的兩點

本文全文原創轉載請註明出處 http://blog.csdn.net/lytning/article/details/25370169 平面最近點對，即平面中距離最近的兩點分治演算法： int SOLVE(int left,int right)//求解點集中區間[lef

Numpy中求標準差的函式std( )與Matlab中求標準差的函式std( )對同一組資料求標註差結果不一樣

一、問題描述 “Matlab求標註差函式std與Python Numpy中求標註差函式std對統一資料求標準差的結果不一樣” Matlab示例： >> a = [1,3,7,10,20]; >> std(a) ans =

在陣列中的兩個數字，如果前面一個數字大於後面的數字，則這兩個數字組成一個逆序對。輸入一個數組,求出這個陣列中的逆序對的總數P。並將P對1000000007取模的結果輸出。

/* 最簡單的思路：陣列的所有數兩兩比較，進行累加，空間複雜度為O(n^2) */ class Solution { public: int InversePairs(vector<int> data) { int P

在陣列中的兩個數字，如果前面一個數字大於後面的數字，則這兩個數字組成一個逆序對。輸入一個數組,求出這個陣列中的逆序對的總數P。並將P對1000000007取模的結果輸出。即輸出P%100000000

分析:可以利用兩層for迴圈,從頭開始遍歷查詢每一個元素的逆序對數,然後求總和。也可以利用歸併排序的思想來求解。下面是利用歸併排序的思想求解 public class Solution{public int InversePairs(int[] array) {if (ar

JS中數組和對象的區別

src 區別 nbsp log 對象 img images image ima JS中數組和對象的區別

Java中克隆(Clone)一個對象

cloneabl puts 返回 print ack pcl 序列化 trac write 在開發過程中,可能會遇到我們需要一個和某個對象一樣數據,但是不是同一個內存地址的新對象,這個時候就需要用到Clone()了. 不過.註意,Clone()分為淺拷貝和深拷貝.區別在於要

webform中Session和Cookies對象的用法、登錄保持

登錄界面 expire ron 首選項 images ons ssi none 主界面一、webform中Session和Cookies對象的用法 1、Session：　　Session:在計算機中，尤其是在網絡應用中，稱為“會話控制”。Session 對象存儲特

js中的函數對象

三種九九 mis .get asc color logs text true JavaScript三種定義函數方法： {}表示函數體1.第一種是使用function語句定義函數 function func() { } 2.第二種是使用Function(

36.數組中的逆序對

inverse avi 分享 .net div hit tex ack delet int InversePairs(int* data, int length) { if (data == NULL || length < 0) return 0;

JS中來創建對象的方法--（一閃而過）

list text body 年齡 style -s 冒號 pan bsp <body><script type="text/jscript"> 　　//使用new來創建　　var stu=new Object(); 　　　　stu.name="

Python中 isinstance()用法判斷對象的類型

pytho () type logs pan code ret instance col isinstance(p_object, class_or_type_or_tuple):判斷對象的類型 a=123 ret=isinstance(a,int) print(ret)

java中的幾種對象(PO,VO,DAO,BO,POJO)

objects 其中標準 setter ant object get 組件工廠類一、PO :(persistant object )，持久對象可以看成是與數據庫中的表相映射的java對象。使用Hibernate來生成PO是不錯的選擇。二、VO :(value ob

Java中字節與對象之間的轉換

ring str arr cti void too trac port ear 近期公司裏面用到了消息隊列，而正如我們知道的是消息隊列之間的是通過二進制形式的。以下就分享一下java中字節與對象之間的轉換。主要是用到了ByteArrayOutputStream和Ob

根據字典中值得大小，對字典中的項排序

lam and for 數據 bcd 參數 sorted imp abcde 案例1：某班語文科目的成績以字典形式存儲，形式為：{"lili":89,"wenwen":91 ...} 根據成績高低，計算學生的排名解決方案：使用內置函數sorted 1,利用zip將

求好友中互粉的好友對

reduce

相關推薦