HBase之自定義HBase-Mapreduce案例一

阿新 • • 發佈：2018-11-14

1.需求場景

將HBase中的ys表中的一部分資料通過Mapreduce遷移到ys_mr表中

2.程式碼編寫

1)構建ReadysMapreduce類，用於讀取ys表中的資料

package cn.ysjh;

import java.io.IOException;

import org.apache.hadoop.hbase.Cell;
import org.apache.hadoop.hbase.CellUtil;
import org.apache.hadoop.hbase.client.Put;
import org.apache.hadoop.hbase.client.Result;
import org.apache.hadoop.hbase.io.ImmutableBytesWritable;
import org.apache.hadoop.hbase.mapreduce.TableMapper;
import org.apache.hadoop.hbase.util.Bytes;
import org.apache.hadoop.mapreduce.Mapper;



public class ReadysMapreduce extends TableMapper<ImmutableBytesWritable,Put>{
	
@Override
protected void map(ImmutableBytesWritable key, Result value,
		Mapper<ImmutableBytesWritable, Result, ImmutableBytesWritable, Put>.Context context)
		throws IOException, InterruptedException {
	//將 fruit 的 name 和 color 提取出來，相當於將每一行資料讀取出來放入到 Put 物件中。
    Put put = new Put(key.get());
//遍歷新增 column 行
    for(Cell cell: value.rawCells()){
//新增/克隆列族:info
        if("info".equals(Bytes.toString(CellUtil.cloneFamily(cell)))){
//新增/克隆列：name
            if("name".equals(Bytes.toString(CellUtil.cloneQualifier(cell)))){
//將該列 cell 加入到 put 物件中
                put.add(cell);
//新增/克隆列:color
            }else if("color".equals(Bytes.toString(CellUtil.cloneQualifier(cell)))){
//向該列 cell 加入到 put 物件中
                put.add(cell);
            }
        }
    }
    //將從 fruit 讀取到的每行資料寫入到 context 中作為 map 的輸出
    context.write(key, put);

}
	
}

2)構建WriteysReduce類，用於將讀取到的fruit表中的資料寫入到fruit_mr表中

package cn.ysjh;

import java.io.IOException;

import org.apache.hadoop.hbase.client.Mutation;
import org.apache.hadoop.hbase.client.Put;
import org.apache.hadoop.hbase.io.ImmutableBytesWritable;
import org.apache.hadoop.hbase.mapreduce.TableReducer;
import org.apache.hadoop.io.NullWritable;
import org.apache.hadoop.mapreduce.Reducer;

public class WriteysReduce extends TableReducer<ImmutableBytesWritable, Put, NullWritable>{

	@Override
	protected void reduce(ImmutableBytesWritable key, Iterable<Put> values,
			Context context)
			throws IOException, InterruptedException {
		//讀出來的每一行資料寫入到 fruit_mr 表中
        for(Put put: values){
            context.write(NullWritable.get(), put);
	}
}
}

3)構建JobysMapreduce類，用於建立Job任務

package cn.ysjh;

import java.io.IOException;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.conf.Configured;
import org.apache.hadoop.hbase.HBaseConfiguration;
import org.apache.hadoop.hbase.client.Put;
import org.apache.hadoop.hbase.client.Scan;
import org.apache.hadoop.hbase.io.ImmutableBytesWritable;
import org.apache.hadoop.hbase.mapreduce.TableMapReduceUtil;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.util.Tool;
import org.apache.hadoop.util.ToolRunner;

public class JobysMapreduce extends Configured implements Tool{
	
	public int run(String[] args) throws Exception {
		//得到 Configuration
        Configuration conf = this.getConf();
//建立 Job 任務
        Job job = Job.getInstance(conf, this.getClass().getSimpleName());
        job.setJarByClass(JobysMapreduce.class);
//配置 Job
        Scan scan = new Scan();
        scan.setCacheBlocks(false);
        scan.setCaching(500);
//設定 Mapper，注意匯入的是 mapreduce 包下的，不是 mapred 包下的，後者是老版本
        TableMapReduceUtil.initTableMapperJob(
                "ys", //資料來源的表名
                scan, //scan 掃描控制器
                ReadysMapreduce.class,//設定 Mapper 類
                ImmutableBytesWritable.class,//設定 Mapper 輸出 key 型別
                Put.class,//設定 Mapper 輸出 value 值型別
                job//設定給哪個 JOB
        );
//設定 Reducer
        TableMapReduceUtil.initTableReducerJob("ys_mr", WriteysReduce.class,
                job);
//設定 Reduce 數量，最少 1 個
        job.setNumReduceTasks(1);
        boolean isSuccess = job.waitForCompletion(true);
        if(!isSuccess){
            throw new IOException("Job running with error");
        }
        return isSuccess ? 0 : 1;
    }
	
	public static void main( String[] args ) throws Exception{
        Configuration conf = HBaseConfiguration.create();
        int status = ToolRunner.run(conf, new JobysMapreduce(), args);
        System.exit(status);
    }
	
	}

3.打包執行

使用maven 打包命令：-P local clean package，然後將jar包上傳到叢集上執行測試

注意：如果待匯入資料的表不存在，則需要提前建立

HBase之自定義HBase-Mapreduce案例一

1.需求場景將HBase中的ys表中的一部分資料通過Mapreduce遷移到ys_mr表中 2.程式碼編寫 1)構建ReadysMapreduce類，用於讀取ys表中的資料 package cn.ysjh; import java.io.IOException;

按鈕配置之自定義按鈕使用（一）——JEPLUS軟件快速開發平臺

事件 proc oss In 需求信息 ces otto 圖片 JEPLUS按鈕配置之自定義按鈕使用（一）系統開發過程中無論是表單的默認按鈕或是列表的默認按鈕以及Action的默認按鈕有時候並不能滿足我們的業務需求，這個時

JavaWeb學習心得之自定義簡單標籤（一）

一、簡單標籤簡介含義：實現SimpleTag介面的標籤稱為簡單標籤。方法： setJspContext：用於把JSP頁面的pageContext物件傳遞給標籤處理器物件setParent：用於把

MapReduce之自定義WordCount案例

在一堆給定的文字檔案中統計輸出每一個單詞出現的總次數。 1.分析 mapper階段：將mapstack 傳給我們的文字資訊內容先轉換成string。根據空格將一行切分成單詞。將單詞輸出為<單詞，1>的格式。 reducer階段

Qt之自定義搜索框——QLineEdit裏增加一個Layout，還不影響正常輸入文字（好像是一種比較通吃的方法）

too 步驟 set box 文本 csdn sub void 鼠標簡述關於搜索框，大家都經常接觸。例如：瀏覽器搜索、Windows資源管理器搜索等。當然，這些對於Qt實現來說毫無壓力，只要思路清晰，分分鐘搞定。方案一：調用QLineEdit現

MapReduce系列之自定義Partitioner

partitioner定義：分割槽器 partitioner的作用是將mapper（如果使用了combiner的話就是combiner）輸出的key/value拆分為分片（shard），每個reducer對應一個分片。預設情況下，partitioner先計算key的雜湊值（通常為md5值）。然後

8、jeecg 筆記之自定義word 模板匯出（一）

1、前言 jeecg 中已經自帶 word 的匯出匯出功能，其所使用的也是 easypoi，儘管所匯出的 word 能滿足大部分需求，但總是有需要用到自定義 word匯出模板，下文所用到的皆是 easypoi 提供的，為方便下次翻閱，故記之。 2、程式碼部分 2.1、controll

java基礎之-自定義註解一

（分類資訊來自百度搜索）執行機制分類：源註解程式碼中註解編譯後class中沒有編譯時註解再class中存在的執行時註解執行時起作用的註解按來源分 JDK自帶註解三方註解最常見自定義註解元註解註解的註解今天來看看J

Docker之自定義映象製作與執行（一）

前幾篇我們介紹了Windows下安裝Docker與第三方Nginx映象執行，這一篇我們學習怎麼自己製作映象並放在docker容器中執行起來。製作映象製作映象首先要知道你這個專案所要依賴什麼環境下才能執行，我們的專案都是JAVA WEB專案，所以就要依賴to

MapReduce 之 ---自定義全域性計數器，將資訊輸出到控制檯

package jishuqi; import java.io.IOException; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.Path; import org.apache.ha

Android進階之自定義View實戰(一)仿iOS UISwitch控制元件實現

一.引言個人覺得，自定義View一直是Android開發最變換莫測、最難掌握、最具吸引力的地方。因為它涉及到的知識點比較多，想在實際應用中駕輕就熟，由淺入深，你需要掌握以下知識點: 1. View的繪製機制以及Canvas、Paint、Rect等的常用方

Android開發之自定義控制元件(一)---onMeasure詳解

話說一個有十年的程式設計經驗的老漢，決定改行書法，在一個熱火炎炎的中午，老漢拿著毛筆，在一張白紙上寫了個“Hello World!”，從此開啟了他的書法旅程。那麼問題來了請問自定義一個控制元件需要怎樣的流程？我們經常說自定義控制元件，那麼究竟怎樣去自定義一

Android之自定義一個可播放某一時間段的音樂播放器

本文純屬蛋疼，實現一個可以拖動，選擇需要播放的時間段，然後播放效果是隻播放這一段選中的音樂。需求：自定義一個Android播放器可以隨意選擇需要播放音樂片段返回選中播放部分的音樂資料分析：

js基礎之自定義屬性（一）

aLi[i].onclick=function(){if(this.onOff){this.style.background='url(img/normal.png)';this.onOff=false}else{this.style.background='url(img/active.png)';this

Mapreduce之自定義OutputFormat應用-日誌增強

主要介紹的是自定義OutputFormat的使用，給出的需求很簡單對現有的日誌檔案內容進行增強。 1、從原始日誌檔案中讀取資料 2、根據日誌中的一個URL欄位到外部知識庫中獲取資訊增強到原始日誌 3、如果成功增強，則輸出到增強結果目錄；如果增強失敗，則

android自定義view學習（一）之時尚錶盤

最近在學習自定義view，順便謝謝自己的路程，後面回首看看以前的自己有多菜。。。。下方的是實現圖，首先需要說明的是，這個效果是看了一遍部落格，然後自己想著去實現，並給出此部落格：點選開啟連結正文：首先學習自定義view需要稍稍入門一下，然後是各種函式的使用，以及大量的練習，至

MapReduce之自定義partitioner

partitioner定義： partitioner的作用是將mapper（如果使用了combiner的話就是combiner）輸出的key/value拆分為分片（shard），每個reducer對應一個分片。預設情況下，partitioner先計算key的雜湊值（通常

MapReduce之自定義InputFormat

>在企業開發中，Hadoop框架自帶的`InputFormat`型別不能滿足所有應用場景，需要==自定義==InputFormat來解決實際問題。自定義InputFormat步驟如下： - （1）自定義一個類繼承`FilelnputFormat`。 - （2）自定義一個類繼承`RecordReader`，實

MapReduce之自定義分割槽器Partitioner

@[toc] ## 問題引出 >要求將統計結果按照條件輸出到不同檔案中（分割槽）。比如：將統計結果按照**手機歸屬地不同省份**輸出到不同檔案中（分割槽） ## 預設Partitioner分割槽 ```java public class HashPartitioner extends Partitio

MapReduce之自定義OutputFormat

@[toc] ## OutputFormat介面實現類 `OutputFormat`是`MapReduce`輸出的基類，所有實現`MapReduce`輸出都實現了`OutputFormat`介面。下面介紹幾種常見的OutputFormat實現類。 - 文字輸出`TextoutputFormat` 預設的輸出

HBase之自定義HBase-Mapreduce案例一

相關推薦