hadoop入門教程-程式小例項

阿新 • • 發佈：2019-01-01

無論是在微信還是QQ，我們經常看到好友推薦這樣的功能，其實這個功能是在大資料的基礎上實現的，下面來看具體的程式碼實現：

在src下新增三個類：JobRun.java:

package com.lftgb.mr;

import java.io.IOException;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;

public class JobRun {
	public static void main(String[] args) {
		Configuration conf = new Configuration();
		conf.set("mapred.job.tracker", "192.168.152.128:9001");
		conf.set("fs.default.name", "hdfs://192.168.152.128:9000");
		conf.set("mapred.jar", "C:\\Users\\志鵬\\Desktop\\hadoop程式\\qq.jar");

		try {
			Job job = new Job(conf);
			/*
			 * job.setJarByClass(JobRun.class);
			 * job.setMapperClass(WcMapper.class);
			 * job.setReducerClass(WcReducer.class);
			 * job.setMapOutputKeyClass(Text.class);
			 * job.setMapOutputValueClass(IntWritable.class);
			 * 
			 * // job.setNumReduceTasks(1);//設定reduce任務的個數 預設是一個
			 * 
			 * // mapreduce 輸入資料所在的目錄或者檔案 FileInputFormat.addInputPath(job, new
			 * Path("/usr/my2016")); // mr執行之後的資料資料目錄
			 * FileOutputFormat.setOutputPath(job, new Path("/usr/output"));
			 */

			job.setJobName("qq");
			job.setJarByClass(JobRun.class);
			job.setMapperClass(Test2Mapper.class);
			job.setReducerClass(Test2Reduce.class);
			job.setMapOutputKeyClass(Text.class);
			job.setMapOutputValueClass(IntWritable.class);


			// mapreduce 輸入資料所在的目錄或者檔案
			FileInputFormat.addInputPath(job, new Path("/usr/input/qq/"));
			// mr執行之後的資料資料目錄
			FileOutputFormat.setOutputPath(job, new Path("/usr/output/qq"));
			try {
				System.exit(job.waitForCompletion(true) ? 0 : 1);
			} catch (ClassNotFoundException e) {
				e.printStackTrace();
			} catch (InterruptedException e) {
				e.printStackTrace();
			}

		} catch (IOException e) {
			e.printStackTrace();
		}
	}
}

QQMapper.java:

package com.lftgb.mr;

import java.io.IOException;

import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Mapper;

public class Test2Mapper extends Mapper<LongWritable, Text, Text, Text> {
	protected void map(LongWritable key, Text value, Context context)
			throws IOException, InterruptedException {
		String line = value.toString();
		String[] ss = line.split("\t");
		context.write(new Text(ss[0]),new Text(ss[1]));
		context.write(new Text(ss[1]),new Text(ss[0]));	
	}
}

QQReduce.java:

package com.lftgb.mr;

import java.io.IOException;
import java.util.HashSet;
import java.util.Iterator;
import java.util.Set;

import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Reducer;

public class Test2Reduce extends Reducer<Text, Text, Text, Text> {
	
	protected void reduce(Text key, Iterable<Text> i,
			Context arg2) throws IOException,
			InterruptedException {
		Set<String>	set= new HashSet<String>();
		for(Text t:i){
			set.add(t.toString());
		}
		if(set.size()>1){
			for (Iterator j = set.iterator(); j.hasNext();) {
				String name = (String) j.next();
				for (Iterator k = set.iterator(); k.hasNext();) {
					String other = (String) k.next();
					if(name.equals(other)){
						arg2.write(new Text(name),new Text(other));
					}
				}
			}
		}
	}
}

在eclipse下，與hadoop結合可以更有效的實現大資料處理的功能，深入的研究請期待小編的下次部落格！！

hadoop入門教程-程式小例項

無論是在微信還是QQ，我們經常看到好友推薦這樣的功能，其實這個功能是在大資料的基礎上實現的，下面來看具體的程式碼實現：在src下新增三個類：JobRun.java: package com.lftgb.mr; import java.io.IOException; i

Apache Hadoop 入門教程第四章

大數據 hadoop 運行在單節點的 YARN 您可以通過設置幾個參數，另外運行 ResourceManager 的守護進程和 NodeManager 守護進程以偽分布式模式在 YARN 上運行 MapReduce job。以下是運行步驟。（1）配置 etc/hadoop/mapred-site.

Apache Hadoop 入門教程第二章

大數據 hadoop Apache Hadoop 單節點上的安裝配置下面將演示快速完成在單節點上的 Hadoop 安裝與配置，以便你對 Hadoop HDFS 和 MapReduce 框架有所體會。先決條件支持平臺： GNU/Linux：已經證實了 Hadoop 在 GNU/Linux 平臺

Apache Hadoop 入門教程第一章

大數據 hadoop Apache Hadoop 是一個由 Apache 基金會所開發的分布式系統基礎架構。可以讓用戶在不了解分布式底層細節的情況下，開發出可靠、可擴展的分布式計算應用。 Apache Hadoop 框架，允許用戶使用簡單的編程模型來實現計算機集群的大型數據集的分布式處理。它的目的是支

Apache Hadoop 入門教程第三章

hadoop 大數據免密碼 ssh 設置現在確認能否不輸入口令就用 ssh 登錄 localhost: $ ssh localhost1如果不輸入口令就無法用 ssh 登陸 localhost，執行下面的命令： $ ssh-keygen -t rsa -P ‘‘ -f ~/.ssh/id_rsa$

hadoop入門教程之DKH安裝環境準備

hadoop入門教程之DKH安裝環境準備前幾天去參加了一個線下的聚會，參加聚會的基本都是從事網際網路工作的。會上有人提到了區塊鏈，從而引發了一場關於大資料方面的探討。我也是從去年才正式接觸大資料，一直在學習hadoop。相信接觸過hadoop的人都知道，。單獨搭建hadoop裡每個組建都需

Hadoop教程(一) Hadoop入門教程

1 Hadoop入門教程 Hadoop是Apache開源組織的一個分散式計算開源框架(http://hadoop.apache.org/)，用java語言實現開源軟體框架，實現在大量計算機組成的叢集中對海量資料進行分散式計算。Hadoop框架中最核心設計就是：HDFS和MapReduce，HDFS實現儲存

hadoop入門教程免費下載

Hadoop入門教程免費下載，學習大資料的小夥伴應該都知道Hadoop是必須要接觸的，學習大資料，從Hadoop入門教程開始。 Hadoop是什麼？首先我們瞭解到Hadoop是Apache軟體基金會管理的開源軟體平臺，但Hadoop到底是什麼呢？簡單來說，Hadoop是在分散

gitbook 入門教程之小白都能看懂的 Gitbook 外掛開發全流程

什麼是外掛 Gitbook 外掛是擴充套件 GitBook 功能(電子書和網站)的最佳方式. 只要是 Gitbook 預設沒有提供的功能,基於外掛機制都可以自行擴充套件,是外掛讓 Gitbook 變得更加強大. 本文將全面介紹外掛的相關知識並重點介紹外掛開發的全流程,只有熟悉外掛開發流程才能做到有的放矢,

微信小程式入門教程及例項

原文地址：https://mp.weixin.qq.com/s?__biz=MzAwNjI5MTYyMw==&mid=2651493295&idx=1&sn=4dc4c570140d246b5ead8eb0c01d90d9&chksm=80

微信小程式入門教程（附原始碼）

五分鐘上手-微信小程式 1：用沒有註冊過微信公眾平臺的郵箱註冊一個微信公眾號，申請帳號 ,點選 https://mp.weixin.qq.com/wxopen/waregister?action=step1 根據指引填寫資訊和提交相應的資料，就可以擁有自己的小程式帳號。註冊完成之後開始登入。

小程式簡單開發入門教程

微信小程式入門教程+案例demo

尊重原創，轉載請註明出處：原文檢視驚喜更多 http://blog.csdn.net/qq137722697 首先擺在好姿態，——微信小程式開發也就那麼回事。你只需要一點點css（真的只要一點點）的基礎就可以了。認清微信小程式開發其實，我覺得小程式就是將微信官方提供

微信小程式開發入門教程含視訊有原始碼

　　做任何程式開發要首先找到其官方文件，我們先來看看其有哪些官方文件。微信小程式開發文件連結為：https://mp.weixin.qq.com/debug/wxadoc/dev/index.html，如下圖：這裡就是做微信小程式開發的全部官方文件。知道了文件的位置，下面我們來介紹下如何做一個微

微信小程式開發入門教程

小程式：傳圖識字君小程式：廁所在哪呢傳圖片上去把上面的文字抓取下來定位附近的廁所位置　　做任何程式開發要首先找到其官方文件，我們先來看看其

微信小程式雲開發簡單入門教程

文章目錄 ###開場白：雲開發顧名思義就是後端開發，應該是微信上週才推出的開放能力，現在這讓我想起了以前的leancloud，和更早的bmob了，而leancloud一早就開始支援微信小程式開發了，相比較而言，leancloud的資料應該更多些，但畢竟微信自

全棧工程師之路-中級篇之小程式開發-入門教程完結報告

首先，說說小程式開發的完結，基本上的東西，在我們前面的章節中，都已經提到過了。我覺得掌握這些內容，足夠你開始開發小程式了。接下來，就要我們根據實際的專案需求去實現了，如果遇到教程中沒有提到的東西，可以查閱官方的API，也可以在公眾

小程式開發快速入門教程（附原始碼）

五分鐘上手-微信小程式image我們可以在選單 “設定”-“開發設定” 看到小程式的 AppID 了。小程式的 AppID 相當於小程式平臺的一個身份證，後續你會在很多地方要用到 AppID (注意這裡要區別於服務號或訂閱號的 AppID)。有了小程式帳號之後，我們需要一個工具來開發

微信小程式入門教程--列表渲染多層巢狀迴圈及wx:key的使用

入門教程之列表渲染多層巢狀迴圈，目前官方的文件裡，主要是一維陣列列表渲染的案例，還是比較簡單單一，給剛入門的童鞋還是無從入手的感覺。 <view wx:for="{{items}}"> {{index}}: {{item.message}} </view> 還有一個九九乘法表把資

微信小程式入門教程---列表渲染多層巢狀迴圈及wx:key的使用(雙層for迴圈)

前言入門教程之列表渲染多層巢狀迴圈，目前官方的文件裡，主要是一維陣列列表渲染的案例，還是比較簡單單一，給剛入門的童鞋還是無從入手的感覺。 <view wx:for="{{items}}"> {{index}}: {{item.message}} <

hadoop入門教程-程式小例項

相關推薦