HBase 協處理器實踐（一）AggregationClient

阿新 • • 發佈：2019-01-26

HBase 協處理器實踐（一）

對資料表中的資料進行求和。

1、新增coprocessor AggregateImplementation分為新增全域性和為單表新增Aggregation。

a、新增全域性AggregateImplementation，方法：修改hbase-site.xml檔案，在該檔案中新增

<span style="font-size:18px;"><property>
   <name>hbase.coprocessor.user.region.classes</name>
   <value>org.apache.hadoop.hbase.coprocessor.AggregateImplementation</value>
 </property></span>

b、新增單表的AggregateImplementation，可以通過hbase shell實現也可以通過Java API

hbase shell

<span style="font-size:18px;">disable 'table'
alter 'table',METHOD => 'table_att','coprocessor' => 'hdfs://ip:9000/user/hadoop/jars/test.
                         jar|mycoprocessor.SampleCoprocessor|1001|'
enable 'table'</span>

java api 通過HBaseAdmin / HTableDescriptor 來實現的

<span style="font-size:18px;">    建立HBaseConfiguration
    Configuration hbaseconfig = HBaseConfiguration.create();  
    通過HBaseAdmin來完成為表新增配置
    HBaseAdmin hbaseAdmin = new HBaseAdmin(hbaseconfig);  
    hbaseAdmin.disableTable(TABLE_NAME);  
    通過表的描述來為表新增AggregationImplementation
    HTableDescriptor htd = hbaseAdmin.getTableDescriptor(TABLE_NAME);  
    htd.addCoprocessor(AggregateImplementation.class.getName());  
    hbaseAdmin.modifyTable(TABLE_NAME, htd);  
    hbaseAdmin.enableTable(TABLE_NAME);  
    hbaseAdmin.close();</span>

在完成新增之後就是對於表資料統計，LongColumnInterpreter列直譯器，解析列值，呼叫AggregationClient的rowCount方法，t對於表資料的行統計的大小完全是取決於建立的Scan，可以是針對單個列族、單個列、範圍查詢。

<span style="font-size:18px;">public static void testAggregationClient()
        throws Throwable {
        HTable hTable = new HTable(config, TableName.valueOf("marketing"));
        /**
         * ColumnInterperter型別的引數ci。即列直譯器，用於解析列中的值。
         */
        LongColumnInterpreter columnInterpreter = new LongColumnInterpreter();
        AggregationClient aggregationClient = new AggregationClient(config);
        Scan scan = new Scan();

        // 統計範圍內的資料
        // scan.setStopRow("rk007".getBytes());

        // 統計單列族
        scan.addFamily(Bytes.toBytes("f"));
        // 統計單列族的列
        // scan.addColumn(Bytes.toBytes("f"), Bytes.toBytes("q"));

        Long count = aggregationClient.rowCount(hTable, columnInterpreter, scan);
        System.out.println("count..." + count);

    }</span>

這裡的範圍統計，只指定結束的rowKey，預設startRowkey從第一條開始。還有一些求平均值，最大值的方法注意資料型別。

HBase 協處理器實踐（一）AggregationClient

linux驅動開發之framebuffer應用編程實踐（一）

linux驅動開發之framebuffer驅動 1、framebuffer應用編程 (1)打開設備文件 (2)獲取設備信息宏定義的命令在/linux/fb.h中不可變信息FSCREENINFO，使用ioctl參數有FBIOGET_FSCREENINFO宏名，表示用ioctl從

前後端分離實踐（一）

就是經驗靜態頁局限工具服務器 png 開發人員技術前言最近這一段時間由於Nodejs的逐漸成熟和日趨穩定，越來越多的公司中的前端團隊開始嘗試使用Nodejs來練一下手，嘗一嘗鮮。一般的做法都是將原本屬於後端的一部分相對於業務不是很重要的功能遷移到Nodej

java線程與並發編程實踐（一）

tee start new read 它的 static ctrl+ als 函數一、給出線程的定義線程就是一條在程序代碼中獨立執行的路徑二、給出runnable的定義一個runnable就是一段封裝在對象中的代碼序列，它的類實現了runnable接口三、

Kotlin學習與實踐（一）基礎

eat 代碼塊數據 eas 特性 neu 簡潔跟著 pla 1、函數和變量直奔主題不啰嗦 * a.關鍵字 fun 用來聲明函數。* b.參數的類型寫在參數名字的後面。* c.函數可以定義再文件的最外層，不需要把它放入類中。* d.數組就是類。和Java不同Kotl

Docker學習與實踐（一）

docker一、docker的安裝 1.依賴包安裝 yum install -y yum-utils device-mapper-persistent-data lvm2 2.添加yum源 yum-config-manager --add-repo https://mirrors.ustc.edu.cn/do

mysql數據庫索引優化與實踐（一）

都是分鐘必備範圍查詢無法使用 RM strong span 實踐前言 mysql數據庫是現在應用最廣泛的數據庫系統。與數據庫打交道是每個Java程序員日常工作之一，索引優化是必備的技能之一。為什麽要了解索引真實案例案例一：大學有段時間學習爬蟲，爬取了知乎30

ngrinder 壓力測試實踐（一） -- ngrinder介紹及部署

ngrinder dockr ngrinder ngrinder 介紹 ngrinder 是一款操作簡單，功能強大的分布式壓力測試工具，其可以簡單快速的開始測試，也可以靈活根據實際需求設計場景完成壓力測試工作。快速開始第一步：輸入待測地址第二步：設定壓測參數第三步：設定預約或立刻開始第四

Jmeter接口測試案例實踐（一）

只需要 jmeter -c threads 文件 info 默認值完成 image 1.1. 接口介紹本次測試的接口采用內網中的通訊錄查詢接口進行測試，接口參數如下：1.2.

Python編程入門到實踐（一）

文本編輯器 apt 會有 linu sta all 就是 AS g++ 1.安裝文本編輯器Geany 首先確保已經安裝了gcc與g++（一般的Linux都會有內置的）： sudo apt-get install gcc sudo apt-get install g++

KVM虛擬化實踐（一）

KVMKVM虛擬化環境搭建：環境介紹：CentOS 7.4 一臺 IP：10.10.10.135/24 hostname：node1 1>查看系統版本信息（建議CentOS 7）[root@node1 ~]# cat /etc/redhat-releaseCentOS Linux release 7.4

yolov3實踐（一）

如果分享攝像 div 步驟主程序 char 第一篇 index 很多博友看了我的第一篇博客yolo類檢測算法解析——yolo v3，對其有了一定的認識和了解，但是並沒有貼出代碼和運行效果，略顯蒼白。因此在把篇博客理論的基礎上，造就了第一篇實踐文章，也就是本文。只要讀者

探果題庫實踐（一）

7月題目 bsp tle 頁面 alt get blank 決定在這個上面已經花了很長一段時間，還沒有真實的接觸一個用戶，不確定這些時間是不是付諸東流。現在決定把這個過程記錄下來。網站首頁：www.tamguo.com 章節頁面：http://www.tamg

Flume+Kafka+SparkStreaming+Hbase+可視化（一）

日誌導入 ash channels style 導入 com system ase spark 一、前置準備： Linux命令基礎 Scala、Python其中一門 Hadoop、Spark、Flume、Kafka、Hbase基礎知識二、分布式日誌收集框架Flume

Android ANR分析實踐（一）：北京×××搭建ANR是什麽、產生的原因及如何避免ANR

例如三種 handler 線程處理不足線程阻塞種類工具 input 一、什麽是北京×××搭建 dsluntan.com VX:17061863513ANR ANR,(Application Not Responding) 即應用程序無響應，在android應

Spring Boot 最佳實踐（一）快速入門

我想並不是系統 exe 輸出開發環境模型 hot 根據一、關於Spring Boot 在開始了解Spring Boot之前，我們需要先了解一下Spring，因為Spring Boot的誕生和Spring是息息相關的，Spring Boot是Spring發展到一定程

服務化改造實踐（一）| Dubbo + ZooKeeper

roo app 組織 mes false 部分 nba 進程 4.4 摘要： “沒有最好的技術，只有最合適的技術。”我想這句話也同樣適用於微服務領域，沒有最好的服務框架，只有最適合自己的服務改造。在 Dubbo 的未來規劃中，除了保持自身技術上的領先性，關註性能、大流量、大

Git工程開發實踐（一）——Git基礎

其中 it管理操作系統 linux發行版 ict src conflict 例如行合並 Git工程開發實踐（一）——Git基礎一、版本控制系統 1、版本控制系統簡介版本控制系統(VCS,Version Control Systems)是一種記錄一個或若幹文件內容變化

mllib實踐（一）之LinearRegressionWithSGD實踐（整合網際網路上多個例項）

package mllib; import org.apache.spark.{ SparkConf, SparkContext } import org.apache.spark.mllib.linalg.Vectors import org.apache.spark.mllib.regr

hadoop程式設計實踐（一）

Hadoop操作基礎與IDE環境配置。 Hadoop操作目錄操作在操作之前，需要在hadoop根目錄下建立與Linux使用者同名的user目錄 ./bin/hdfs dfs -mkdir -p /user/hadoop 之後，所有的檔案都預設放

HBase 協處理器實踐（一）AggregationClient

相關推薦