Hbase過濾器（一）：比較過濾器API

阿新 • • 發佈：2018-12-28

過濾器（filter）

一：行過濾器（rowFilter）

解析：行過濾器基於rowkey來過濾資料。使用多種運算子返回符合條件的行鍵，同時過濾掉不符合條件的rowkey。

package compareFilter;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.hbase.HBaseConfiguration;
import org.apache.hadoop.hbase.TableName;
import org.apache.hadoop.hbase.client.*;
import org.apache.hadoop.hbase.filter.*;
import org.apache.hadoop.hbase.util.Bytes;
import org.junit.Test;

import java.io.IOException;

public class rowfilter {

    private Configuration configuration = null;
    private Connection connection = null;

    /*
    * 根據rowkey查詢
    */
    @Test
    public void rowfilter() throws IOException {
        System.out.print("begin\n");
        //建立Hbase配置檔案
        configuration = HBaseConfiguration.create();
        //建立連線
        connection = ConnectionFactory.createConnection(configuration);
        //根據表名獲取表實體
        Table table = connection.getTable(TableName.valueOf("ns1:t1"));
        //建立掃描實體
        Scan scan = new Scan();
        //新增掃描的列族 引數1.列族 引數2.列名
        scan.addColumn(Bytes.toBytes("cf1"),Bytes.toBytes("name"));
        //新增掃描的列族 引數1.列族 引數2.列名
        scan.addColumn(Bytes.toBytes("cf1"),Bytes.toBytes("age"));
        //建立過濾器實體
        Filter filter = new RowFilter(CompareFilter.CompareOp.LESS_OR_EQUAL,new BinaryComparator(Bytes.toBytes("row3")));
        //將filter實體放入掃描實體
        scan.setFilter(filter);
        //建立掃描返回類
        ResultScanner resultScanner = table.getScanner(scan);
        for (Result result:resultScanner){
            System.out.println(result);
            String name = Bytes.toString(result.getValue(Bytes.toBytes("cf1"),Bytes.toBytes("name")));
            Integer age = Bytes.toInt(result.getValue(Bytes.toBytes("cf1"),Bytes.toBytes("age")));
            System.out.println(name);
            System.out.println(age);
        }
        resultScanner.close();
        table.close();
        System.out.print("end\n");
    }

    /*
    * 根據rowkey正則表示式查詢
    */
    @Test
    public void rowRegexfilter() throws IOException {
        System.out.print("begin\n");
        //建立Hbase配置檔案
        configuration = HBaseConfiguration.create();
        //建立連線
        connection = ConnectionFactory.createConnection(configuration);
        //根據表名獲取表實體
        Table table = connection.getTable(TableName.valueOf("ns1:t1"));
        //建立掃描實體
        Scan scan = new Scan();
        //新增掃描的列族 引數1.列族 引數2.列名
        scan.addColumn(Bytes.toBytes("cf1"),Bytes.toBytes("name"));
        //新增掃描的列族 引數1.列族 引數2.列名
        scan.addColumn(Bytes.toBytes("cf1"),Bytes.toBytes("age"));
        //建立過濾器實體
        Filter filter = new RowFilter(CompareFilter.CompareOp.EQUAL,new RegexStringComparator(".3"));
        //將filter實體放入掃描實體
        scan.setFilter(filter);
        //建立掃描返回類
        ResultScanner resultScanner = table.getScanner(scan);
        for (Result result:resultScanner){
            System.out.println(result);
            String name = Bytes.toString(result.getValue(Bytes.toBytes("cf1"),Bytes.toBytes("name")));
            System.out.println(name);
        }
        resultScanner.close();
        table.close();
        System.out.print("end\n");
    }

    /*
    * 根據rowkey字串查詢
    */
    @Test
    public void rowSubStringfilter() throws IOException {
        System.out.print("begin\n");
        //建立Hbase配置檔案
        configuration = HBaseConfiguration.create();
        //建立連線
        connection = ConnectionFactory.createConnection(configuration);
        //根據表名獲取表實體
        Table table = connection.getTable(TableName.valueOf("ns1:t1"));
        //建立掃描實體
        Scan scan = new Scan();
        //新增掃描的列族 引數1.列族 引數2.列名
        scan.addColumn(Bytes.toBytes("cf1"),Bytes.toBytes("name"));
        //新增掃描的列族 引數1.列族 引數2.列名
        scan.addColumn(Bytes.toBytes("cf1"),Bytes.toBytes("age"));
        //建立過濾器實體
        Filter filter = new RowFilter(CompareFilter.CompareOp.EQUAL,new SubstringComparator("3"));
        //將filter實體放入掃描實體
        scan.setFilter(filter);
        //建立掃描返回類
        ResultScanner resultScanner = table.getScanner(scan);
        for (Result result:resultScanner){
            System.out.println(result);
            String name = Bytes.toString(result.getValue(Bytes.toBytes("cf1"),Bytes.toBytes("name")));
            System.out.println(name);
        }
        resultScanner.close();
        table.close();
        System.out.print("end\n");
    }
}

二：列族過濾器（FamilyFilter）

解析：列族過濾器於行過濾器相似，不過它是通過比較列族而不是比較rowkey來返回結果的。通過使用不同組合的運算子和比較器，使用者可以在列族一級篩選所需的資料。

package compareFilter;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.hbase.HBaseConfiguration;
import org.apache.hadoop.hbase.TableName;
import org.apache.hadoop.hbase.client.*;
import org.apache.hadoop.hbase.filter.*;
import org.apache.hadoop.hbase.util.Bytes;
import org.junit.Test;

import java.io.IOException;

public class familyfilter {

    private Configuration configuration = null;
    private Connection connection = null;

    /*
    * 根據列族查詢
    */
    @Test
    public void familyfilter() throws IOException {
        System.out.print("begin\n");
        //建立Hbase配置檔案
        configuration = HBaseConfiguration.create();
        //建立連線
        connection = ConnectionFactory.createConnection(configuration);
        //根據表名獲取表實體
        Table table = connection.getTable(TableName.valueOf("ns1:t1"));
        //建立掃描實體
        Scan scan = new Scan();
        //建立過濾器實體
        Filter filter = new FamilyFilter(CompareFilter.CompareOp.LESS,new BinaryComparator(Bytes.toBytes("cf2")));
        //將filter實體放入掃描實體
        scan.setFilter(filter);
        //建立掃描返回類
        ResultScanner resultScanner = table.getScanner(scan);
        for (Result result:resultScanner){
            System.out.println(result);
            String name = Bytes.toString(result.getValue(Bytes.toBytes("cf1"),Bytes.toBytes("name")));
            System.out.println(name);
        }
        Get get = new Get(Bytes.toBytes("row1"));
        get.setFilter(filter);
        Result result = table.get(get);
        System.out.println("result:"+result);
        resultScanner.close();
        table.close();
        System.out.print("end\n");
    }
}

三：列名過濾器（QualifierFilter）

解析：使用列名進行篩選的類似邏輯，這種操作可以幫助使用者篩選特定的列。

package compareFilter;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.hbase.HBaseConfiguration;
import org.apache.hadoop.hbase.TableName;
import org.apache.hadoop.hbase.client.*;
import org.apache.hadoop.hbase.filter.BinaryComparator;
import org.apache.hadoop.hbase.filter.CompareFilter;
import org.apache.hadoop.hbase.filter.Filter;
import org.apache.hadoop.hbase.filter.QualifierFilter;
import org.apache.hadoop.hbase.util.Bytes;
import org.junit.Test;

import java.io.IOException;

public class qualifierfilter {


    private Configuration configuration = null;
    private Connection connection = null;
    /*
    * 根據列名查詢
    */
    @Test
    public void familynamefilter() throws IOException {
        System.out.print("begin\n");
        //建立Hbase配置檔案
        configuration = HBaseConfiguration.create();
        //建立連線
        connection = ConnectionFactory.createConnection(configuration);
        //根據表名獲取表實體
        Table table = connection.getTable(TableName.valueOf("ns1:t1"));
        //建立掃描實體
        Scan scan = new Scan();
        //建立過濾器實體
        Filter filter = new QualifierFilter(CompareFilter.CompareOp.LESS_OR_EQUAL,new BinaryComparator(Bytes.toBytes("age")));
        //將filter實體放入掃描實體
        scan.setFilter(filter);
        //建立掃描返回類
        ResultScanner resultScanner = table.getScanner(scan);
        for (Result result:resultScanner){
            System.out.println(result);
            String name = Bytes.toString(result.getValue(Bytes.toBytes("cf1"),Bytes.toBytes("name")));
            System.out.println(name);
        }
        Get get = new Get(Bytes.toBytes("row1"));
        get.setFilter(filter);
        Result result = table.get(get);
        System.out.println("result:"+result);
        resultScanner.close();
        table.close();
        System.out.print("end\n");
    }
}

四：值過濾器（ValueFilter）

解析：這個過濾器可以幫助使用者篩選某個特定值得單元格，與RegexStringComparator配合使用，可以使用功能強大的表示式來進行篩選，需要注意的是，在使用特定比較器的時候，只能與部分運算子配合使用。

package compareFilter;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.hbase.HBaseConfiguration;
import org.apache.hadoop.hbase.KeyValue;
import org.apache.hadoop.hbase.TableName;
import org.apache.hadoop.hbase.client.*;
import org.apache.hadoop.hbase.filter.CompareFilter;
import org.apache.hadoop.hbase.filter.Filter;
import org.apache.hadoop.hbase.filter.SubstringComparator;
import org.apache.hadoop.hbase.filter.ValueFilter;
import org.junit.Test;

import java.io.IOException;

public class valuefilter {

    private Configuration configuration = null;
    private Connection connection = null;

    /*
    * 根據值查詢
    */
    @Test
    public void valueFilter() throws IOException {
        //建立Hbase配置檔案
        configuration = HBaseConfiguration.create();
        //建立連線
        connection = ConnectionFactory.createConnection(configuration);
        Table table = connection.getTable(TableName.valueOf("ns1:t1"));
        Scan scan = new Scan();
        Filter filter = new ValueFilter(CompareFilter.CompareOp.EQUAL,new SubstringComparator(".4"));
        //建立掃描返回類
        ResultScanner resultScanner = table.getScanner(scan);
        for (Result result:resultScanner){
            for (KeyValue kv :result.raw())
            {
                System.out.println(kv);
                System.out.println(kv.getValue());
            }
        }
        resultScanner.close();
        table.close();
    }
}

五：參考列過濾器（DependentColumnFilter）

解析：DependentColumnFilter主要根據所選列的時間戳的時間過濾所要查詢的資料

此過濾器提供了四種建構函式：

（1）DependentColumnFilter()

（2）DependentColumnFilter(byte[] family,byte[] qulifier)

（3）DependentColumnFilter(byte[] family,byte[] qulifier，boolean dropDependentColumn)

（4）DependentColumnFilter(byte[]family,byte[]qulifier，boolean dropDependentColumn，CompareOp valueCompareOp, WritableByteArrayComparable valueComparator)

相關引數：

boolean dropDependentColumn -- 決定參考列被返回還是丟棄，為true時表示參考列被返回，為false時表示被丟棄

CompareOp valueCompareOp -- 比較運算子

WritableByteArrayComparable valueComparator -- 比較器

package compareFilter;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.hbase.HBaseConfiguration;
import org.apache.hadoop.hbase.KeyValue;
import org.apache.hadoop.hbase.TableName;
import org.apache.hadoop.hbase.client.*;
import org.apache.hadoop.hbase.filter.*;
import org.apache.hadoop.hbase.util.Bytes;
import org.junit.Test;

import java.io.IOException;

public class valuefilter {

    private Configuration configuration = null;
    private Connection connection = null;

    /*
    * 根據參考列查詢
    */
    @Test
    public void valueFilter() throws IOException {
        //建立Hbase配置檔案
        configuration = HBaseConfiguration.create();
        //建立連線
        connection = ConnectionFactory.createConnection(configuration);
        Table table = connection.getTable(TableName.valueOf("ns1:t1"));
        Scan scan = new Scan();
        Filter filter = new DependentColumnFilter(Bytes.toBytes("cf1"),Bytes.toBytes("name"),false);
        //建立掃描返回類
        scan.setFilter(filter);
        ResultScanner resultScanner = table.getScanner(scan);
        for (Result result:resultScanner){
            System.out.println(result);
        }
        resultScanner.close();
        table.close();
    }
}

Hbase過濾器（一）：比較過濾器API

過濾器（filter）目錄一：行過濾器（rowFilter）解析：行過濾器基於rowkey來過濾資料。使用多種運算子返回符合條件的行鍵，同時過濾掉不符合條件的rowkey。 package compareFilter; import org.apache.hadoop.

Hbase過濾器（三）：附加過濾器API

目錄一：跳轉過濾器（SkipFilter）跳轉過濾器包裝了一個使用者提供的過濾器，當被包裝的過濾器遇到一個需要過濾的KeyValue例項時，使用者可以拓展並過濾到整行資料。換言之，當過濾器發現某一行中的一列被過濾時，那麼整行都會被過濾掉。案例將SkipFilter和Va

Hbase過濾器（二）：專用過濾器API

目錄一：單列值過濾器（SingleColumnValueFilter）方法類： singleColumnValueFilter(byte[] family,byte[] qualifier,compareOp compareOp,btye[] value) singleColum

Hbase過濾器（四）：FilterList API

FilterList：使用者可以提供多個過濾器共同限制返回到客戶端的結果，與其他單一功能的過濾器一樣，FilterList類實現了Filter介面，所以它可以通過組合多個過濾器的功能來實現某種效果，從而代替提供這類效果的過濾器。方法類： FilterList（List<Filt

Java中String、StringBuilder、StringBuffer常用源碼分析及比較（一）：String源碼分析

array string類都是 epo sys 匹配字符串 bound 地址簡單 String：一、成員變量： /** The value is used for character storage. */ private final char value[

大資料生態系統基礎： HBASE（一）：HBASE 介紹及安裝、配置

一、介紹 Apache HBase是Hadoop資料庫，一個分散式的、可伸縮的大型資料儲存。當您需要隨機的、實時的讀/寫訪問您的大資料時，請使用Apache HBase。這個專案的目標是承載非常大的表——數十億行X百萬列的列——執行在在商用硬體

工作流引擎Oozie（一）：workflow

觸發 line last ssa pig oozie apt cnblogs 定時任務 1. Oozie簡介 Yahoo開發工作流引擎Oozie（馭象者），用於管理Hadoop任務（支持MapReduce、Spark、Pig、Hive），把這些任務以DAG（有向無環圖）方式

Spring 事務配置實戰（一）：過濾無需事務處理的查詢之類操作

log pla ssi pan spl tail gif aop img <tx:advice id="txAdvice" transaction-manager="transactionManager"> <tx:attributes

【SSH之旅】一步步學習Hibernate框架（一）：關於持久化

stc localhost 對象 schema hbm.xml java let pass [] 在不引用不論什麽框架下，我們會通過平庸的代碼不停的對數據庫進行操作，產生了非常多冗余的可是又有規律的底層代碼，這樣頻繁的操作數據庫和大量的底層代碼的反復

CS231n（一）：基礎知識

深度學習 highlight 自己元組 .py [0 upper bsp python 給自己新挖個坑：開始刷cs231n深度學習。看了一下導言的pdf，差缺補漏。 s = "hello" print s.capitalize() # 首字母大寫; prints "

Javascript基礎簡單匯總（一）：元素獲取

問題元素節點 all push 傳說 length [] nbsp 文檔在頁面腳本中，如果要對頁面元素進行操作，那麽我們就要獲取到這個元素那麽在獲取元素之前首先得要了解什麽是DOM（document object model）在DOM，元素是以節點的形式表示的，每

elastic-job詳解（一）：數據分片

count 任務不同的應該 center shc 偶數 int ext 數據分片的目的在於把一個任務分散到不同的機器上運行，既可以解決單機計算能力上限的問題，也能降低部分任務失敗對整體系統的影響。elastic-job並不直接提供數據處理的功能，框架只會將分片項分配至各

中國mooc北京理工大學機器學習第二周（一）：分類

kmeans 方法輸入 nump arr mod 理工大學 each orm 一、K近鄰方法（KNeighborsClassifier）使用方法同kmeans方法，先構造分類器，再進行擬合。區別是Kmeans聚類是無監督學習，KNN是監督學習，因此需要劃分出訓練集和測試

在Python中用Request庫模擬登錄（一）：字幕庫（無加密，無驗證碼）

用戶名 com color 了無 1-1 value img requests log 如此簡單（不安全）的登錄表單已經不多見了。字幕庫的登錄表單如下所示，其中省去了無關緊要的內容： 1 <form class="login-form" action="/User/

Maven項目搭建（一）：Maven初體驗

測試類 java平臺存在 ack 做的 rar cli maven2 試用今天給大家介紹一個項目管理和綜合工具：Maven。 Maven: maven讀作 [‘meivin]，本意是指可以被信任的領域專家，致力於傳播知識(來自於http://en.wikip

方便大家學習的Node.js教程（一）：理解Node.js

圖形 -1 iter pri attribute set run 相對 mage 理解Node.js 為了理解Node.js是如何工作的，首先你需要理解一些使得Javascript適用於服務器端開發的關鍵特性。Javascript是一門簡單而又靈活的語言，這種靈

Nginx實用教程（一）：啟動、停止、重載配置

style 負載繼續 local con doc lin 配置文件的修改 tex Nginx是一個功能強大的web服務器和負載均衡軟件，由俄羅斯人開發。Nginx包括一個master進程和數個worker進程，master進程用於讀取、解析配置文件和管理worker進程，

ASP.NET MVC5（一）：ASP.NET MVC概覽

depend 靈活預覽版管理 res lob 代碼 oba 引擎 ASP.NET MVC概覽 ASP.NET MVC是一種構建Web應用程序的框架，它將一般的MVC（Model-View-Controller）模式應用於ASP.NET框架。 ASP.NET MVC模式

一站式學習Wireshark（一）：Wireshark基本用法

11g 實現 alt href ascii 根據無線網絡完成 analyze 按照國際慣例，從最基本的說起。抓取報文: 下載和安裝好Wireshark之後，啟動Wireshark並且在接口列表中選擇接口名，然後開始在此接口上抓包。例如，如果想要在無線網絡上抓取流量

Docker（一）：Docker核心技術預覽

docker開始學習docker了，想寫一篇docker技術介紹的純理論文章，發現以下網站的文檔寫的特別好，就直接引用了，文章轉載自：http://www.infoq.com/cn/DockerDeep http://www.infoq.com/cn/articles/docker-core-technolo

Hbase過濾器（一）：比較過濾器API

過濾器（filter）

目錄

相關推薦