求共同好友，多job運用

阿新 • • 發佈：2018-12-24

package bd1805day09;

import java.io.IOException;
import java.net.URI;
import java.net.URISyntaxException;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.Text;
import 
 org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.Mapper;
import org.apache.hadoop.mapreduce.Reducer;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.jobcontrol.ControlledJob;
import org.apache.hadoop.mapreduce.lib.jobcontrol.JobControl;
import 
 org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;

public class ManyJob {
    //多job串聯，求共同好友
    /**
     * A:B,C,D,F,E,O
       B:A,C,E,K
       C:F,A,D,I
            第一步將每個好友關注哪些使用者
            第二步將兩兩使用者的共同好友求出來
            建立兩個MR可以和容易完成
     */
     //第一個MapReduce
    static class MyMapper extends 
 Mapper<LongWritable, Text, Text, Text>{
        @Override
        protected void map(LongWritable key,
                Text value, 
                Mapper<LongWritable, Text, Text, Text>.Context context)
                throws IOException, InterruptedException {
            //A-B
            //A:B,C,D,F,E,O
            String line = value.toString();
            String[] user_friends = line.split(":");
            //獲取的是所有的好友
            String[] friends = user_friends[1].split(",");
            //迴圈遍歷好友  和使用者拼接傳送
            for(String f:friends){
                context.write(new Text(f), new Text(user_friends[0]));
            }
        }
    }

    static class MyReducer extends Reducer<Text, Text, Text, Text>{
        @Override
        protected void reduce(Text key, Iterable<Text> values, 
                Context context)
                throws IOException, InterruptedException {
            //同一個好友的所有使用者,A:B,C,D
            //將values進行迴圈遍歷拼接
            StringBuffer sb=new StringBuffer();
            for(Text v:values){
                sb.append(v.toString()).append(","); //A    F,I,O,K,G,D,C,H,B
            }
            context.write(key, new Text(sb.substring(0,sb.length()-1)));
        }
    }

第二個MapReduce

static class MyMapper2 extends Mapper<LongWritable, Text, Text, Text>{
                @Override
                protected void map(LongWritable key, Text value, Mapper<LongWritable, Text, Text, Text>.Context context)
                        throws IOException, InterruptedException {
                    String line = value.toString();
                    String[] friend_users = line.split("\t");
                    String[] users = friend_users[1].split(",");
                     //A    F,I,O,K,G,D,C,H,B
                    //迴圈遍歷使用者  進行兩兩拼接   拼接順序問題   a-b    b-a
                    for(String ul:users){//拼左側的
                        for(String ur:users){//拼右側的
                            if(ul.charAt(0)<ur.charAt(0)){  
                                String uu=ul+"-"+ur;        
                                System.out.println(uu);
                                context.write(new Text(uu), new Text(friend_users[0]));//A-E    C
                            }
                        }
                    }
                }   
            }
            static class MyReducer2 extends Reducer<Text, Text, Text, Text>{
                //相同的兩兩使用者為一組
                @Override
                protected void reduce(Text key, Iterable<Text> values, 
                        Reducer<Text, Text, Text, Text>.Context context)
                        throws IOException, InterruptedException {
                    StringBuffer sb=new StringBuffer();
                    for(Text v:values){
                        sb.append(v.toString()).append(",");
                    }
                    context.write(key, new Text(sb.substring(0, sb.length()-1)));  //A-E    C,D,B
                }
            }

//建立驅動，載入job任務

    public static void main(String[] args) throws IllegalArgumentException, IOException, URISyntaxException, InterruptedException {
        System.setProperty("HADOOP_USER_NAME", "hadoop");
        Configuration conf=new Configuration();
        conf.set("fs.defaultFS", "hdfs://hadoop02:9000");
        Job job1=Job.getInstance(conf);             //建立第一個job

        job1.setJarByClass(bd1805day09.ManyJob.class);

        job1.setMapperClass(MyMapper.class);
        job1.setReducerClass(MyReducer.class);

        job1.setOutputKeyClass(Text.class);
        job1.setOutputValueClass(Text.class);

        FileInputFormat.addInputPath(job1, new Path("hdfs://hadoop02:9000/friendin"));
        FileSystem fs = FileSystem.get(new URI("hdfs://hadoop02:9000"), conf);//建立一個hdfs的檔案系統
        Path path = new Path("/friendout_01");
        if(fs.exists(path)){
            fs.delete(path,true);
        }
        FileOutputFormat.setOutputPath(job1, new Path("/friendout_01"));


        Job job2=Job.getInstance(conf);         //建立第二個job

        job2.setJarByClass(bd1805day09.ManyJob.class);

        job2.setMapperClass(MyMapper2.class);
        job2.setReducerClass(MyReducer2.class);

        job2.setOutputKeyClass(Text.class);
        job2.setOutputValueClass(Text.class);

        FileInputFormat.addInputPath(job2, new Path("/friendout_01"));

        Path path1=new Path("/friendout_03");
        if(fs.exists(path1)){           //對所在路徑下的檔案清除
            fs.delete(path1, true);
        }
        FileOutputFormat.setOutputPath(job2,path1);
        //提交兩個job  組：需要一起執行的job  組名隨意
        JobControl jc=new JobControl("wc_sort");
        //job.xml
        ControlledJob ajob=new ControlledJob(job1.getConfiguration());
        ControlledJob bjob=new ControlledJob(job2.getConfiguration());

        //需要新增多個job之間的依賴關係
        bjob.addDependingJob(ajob);
        //bjob.addDependingJob(cjob);


        jc.addJob(ajob);
        jc.addJob(bjob);

        //提交job  啟動可一個執行緒
        new Thread(jc).start();    
        //關閉了這個執行緒  應該在上面的執行緒執行完成之後進行關閉
        //判斷jc物件上的job是否全部執行完成   執行完成 true   不完成  false
        while(!jc.allFinished()){
            Thread.sleep(500);
        }
        jc.stop();

    }
}

求共同好友，多job運用

package bd1805day09; import java.io.IOException; import java.net.URI; import java.net.URISyntaxException; import org.apache.hadoop.conf.Configur

hadoop求共同好友一個MapReduce搞定

Map端 package com.yd.CommFriend; import java.io.IOException; import org.apache.hadoop.io.LongWritable; import org.apache.hadoop.io.Text; import

spark求共同好友

使用spark求共同好友：在做一些專案時，又時可能遇到一些類似與求共同好友的要求，可以根據共同好友進行推薦新增好友，就比如說A和B的好友有M,K,O,L，那麼有可能A和B就是也認識，所以可以把B推薦給A，下面是用Spark求共同好友的實現資料格式如下 A:B

hadoop入門6：hadoop查詢兩兩之間有共同好友，及他倆的共同好友都是誰

A:B,C,D,F,E,O B:A,C,E,K C:F,A,D,I D:A,E,F,L E:B,C,D,M,L F:A,B,C,D,E,O,M G:A,C,D,E,F H:A,C,D,E,O I:A,O J:B,O K:A,C,D L:D,E,F M:E,F,G O:A,H,

Spring-batch學習總結（2）—Job,Flow創建及應用，多線程並發，決策器，監聽器，參數

class getname current ces 表達式 .get been ant string 一．Job的創建及其應用1.Job flow的介紹：（1）狀態機：例完成step1，是否繼續完成step2,step3,我們就需要通過Job flow來控制（2）進行演示:

多執行緒程式設計（二）——面試題，每個執行緒只打印一種字元，多個執行緒協同順序列印n次字串（求大神的其他實現方案）

（這個是歡聚時刻（YY）的筆試題，在筆試的時候沒有寫出來，後來自己寫了出來，希望大神能給出更優秀的解決方案……ps：現在面試官總有面試時問筆試程式設計題思路的習慣，呵呵）題目簡述：輸入一個字串以

夫妻共同創業，開店高達兩千多家，年營收額36億元

來伊份始於1999年上海街頭的一家炒貨夫妻檔，由施永雷、鬱瑞芬夫婦創辦。賣出的第一道貨是從浙江天目山直採的1500斤山核桃仁。這後來成為了來伊份的經營模式——所有產品都從產地直接找供應商代工，沒有中間商賺差價。目前，來伊份在全球擁有200多家供應商。而且很多供應商是從來伊份創業伊始就開始合作，

Leetcode 213. House Robber II -打家劫舍，每家都有一定數量的錢，多家組成一個圓形，首尾相鄰，不能偷盜相鄰的兩家，求可偷盜的最大金額

You are a professional robber planning to rob houses along a street. Each house has a certain amount of money stashed. All houses at this place are&

d3之元件的運用（單選框，下拉列表，滑動軸，多選）

目錄目錄單選框下拉列表滑動軸多選框單選框 1.前端 <form name="myForm" action="" method="" style="posit

給定字串，求出現次數最多的那個字母及次數，如有多個重複則都輸出

給定字串，求出現次數最多的那個字母及次數，如有多個重複則都輸出。 eg，String data ="aaavzadfsdfsdhshdWashfasdf"；這是一道很基礎的面試題，在別的部落格上也

Azkaban實戰，Command型別單一job示例，任務中執行外部shell指令碼，Command型別多job工作flow,HDFS操作任務，MapReduce任務，HIVE任務

1.Azkaban實戰 Azkaba內建的任務型別支援command、java Command型別單一job示例 1、建立job描述檔案 vi command.job #command.job type=command

3693 求這串字元中的重複次數最多的連續重複子串，多組答案輸出字典序最小的那個串（字尾陣列）

題目：求這串字元中的重複次數最多的連續重複子串，多組答案輸出字典序最小的那個串。思路：與前一個題目幾乎一樣的，加上了字典序。多判斷就好 //#include<bits/stdc++.h> #include<iostream> #include

java-mybaits-00203-DAO-mapper代理開發方法，多參數【推薦】

tca alt 三種 ram 程序員 spl cep () void 程序員只需要mapper接口（相當於dao接口）不需要寫具體實現類，mapper已經代理完成,mybatis才有的一、mapper代理開發方法（建議使用）程序員在編寫map

OOP 三大特點：繼承性，封裝性，多態性

封裝保持 .cn mage img 技術 log 多態性不支持　　　　1、繼承性：代碼重用　　　　2、封裝性: 使相似數據和操作進行封裝，保持代碼安全　　　　3、多態性: PHP不支持多態 OOP 三大

求階乘，輸入一個正整數 n，輸出n！

factor i++ print 階乘 pri tor n) printf main #include<stdio.h>int factorial (int n); int main(){ int n; scanf("%d",&n); printf("

AtCoder Regular Contest 075 E - Meaningful Mean 樹狀數組求順序對，前綴和

n) cin 答案 bound std lan memset main ani 題目鏈接: http://arc075.contest.atcoder.jp/tasks/arc075_c 題意：給你一個序列和一個數k，求有多少對l，r，使得a[l]+a[l+1]+...+

黑馬程序猿——JAVA面向對象的特性：封裝，繼承，多態

面向對象結構無法 tex col data- emp ngs 不能 - ----------android培訓、java培訓、java學習型技術博客、期待與您交流！----------

PHP.29-TP框架商城應用實例-後臺7-商品會員修改-頁面優化，多表數據更新

color 創建判斷插入數據 market 字段鉤子 check image 商品表修改功能 1、頁面優化，類似添加頁面 1 <layout name="layout" /> 2 3 <div class="tab-div"&g

POJ 3368 Frequent values(RMQ 求區間出現最多次數的數字的次數)

popu man most add scrip algo main for you 題目鏈接：http://poj.org/problem?id=3368 Description You are given a sequence of n int

多線程，多進程使用過程中的問題和解決方案

共享並發之間競爭技術分享參考發生 pro 早期次作，只是摘錄，組合而成，只能參考多線程：一個進程中可以有多條執行路徑同時執行，一個線程就是進程中的一條執行路徑。在早期的操作系統中並沒有線程的概念，進程是能擁有資源和獨立運行的最小單位，也是程序執行的

求共同好友，多job運用

相關推薦