Storm整合Hbase

阿新 • • 發佈：2018-11-07

將Storm流計算的結果儲存到Hbase上。以 WordCount 為例

準備工作

1. 啟動叢集

啟動ZooKeeper叢集

$> zkServer.sh start

啟動hadoop叢集(Hbase叢集啟動前應該保證Hadoop叢集啟動，並保證namenode為啟用狀態)

$> start-dfs.sh

啟動hbase叢集

start-hbase.sh

啟動Storm叢集

//啟動master
$> storm nimbus

//啟動slave
$> 
 storm supervisor

建立表名為wordcount，列族為f1的資料表

$hbase shell> create 'ns1:wordcount','f1'

2. maven依賴匯入

<dependency>
    <groupId>org.apache.storm</groupId>
    <artifactId>storm-hbase</artifactId>
    <version>1.1.3</version>
</dependency>
< 
dependency>
    <groupId>org.apache.hbase</groupId>
    <artifactId>hbase-client</artifactId>
    <version>1.2.6</version>
</dependency>
<dependency>
    <groupId>org.apache.hadoop</groupId>
    <artifactId>hadoop-common</artifactId> 

    <version>2.7.6</version>
</dependency>

3. 配置檔案匯入

將 hbase-site.xml檔案和 hdfs-site.xml檔案匯入 resources 目錄下

程式設計實現

源頭 Spout

public class WordCountSpout implements IRichSpout {
    private TopologyContext context;
    private SpoutOutputCollector collector;

    private List<String> states;

    private Random r = new Random();

    private int index = 0;

    public void open(Map conf, TopologyContext context, SpoutOutputCollector collector) {
        this.context = context;
        this.collector = collector;
        states = new ArrayList<String>();
        states.add("hello world tom");
        states.add("hello world tomas");
        states.add("hello world tomasLee");
        states.add("hello world tomson");
    }

    public void close() {

    }

    public void activate() {

    }

    public void deactivate() {

    }

    public void nextTuple() {
        if (index < 3) {
            String line = states.get(r.nextInt(4));
            collector.emit(new Values(line));
            index++;
        }
    }

    public void ack(Object msgId) {

    }

    public void fail(Object msgId) {

    }

    public void declareOutputFields(OutputFieldsDeclarer declarer) {
        declarer.declare(new Fields("line"));
    }

    public Map<String, Object> getComponentConfiguration() {
        return null;
    }
}

分片 Bolt

public class SplitBolt implements IRichBolt {

    private TopologyContext context ;
    private OutputCollector collector ;

    public void prepare(Map stormConf, TopologyContext context, OutputCollector collector) {
        this.context = context ;
        this.collector = collector ;
    }

    public void execute(Tuple tuple) {
        String line = tuple.getString(0);
        String[] arr = line.split(" ");
        for(String s : arr){
            collector.emit(new Values(s,1));
        }
    }

    public void cleanup() {

    }

    public void declareOutputFields(OutputFieldsDeclarer declarer) {
        declarer.declare(new Fields("word","count"));

    }

    public Map<String, Object> getComponentConfiguration() {
        return null;
    }
}

HbaseBolt——寫資料到Hbase庫中

public class HbaseBolt implements IRichBolt {

    private Table table;

    public void prepare(Map stormConf, TopologyContext context, OutputCollector collector) {
        try {
            Configuration conf = HBaseConfiguration.create();
            Connection connection = ConnectionFactory.createConnection(conf);
            TableName tableName = TableName.valueOf("ns1:wordcount");
            table = connection.getTable(tableName);
        } catch (IOException e) {
            e.printStackTrace();
        }
    }

    public void execute(Tuple tuple) {
        //取到單詞
        String word = tuple.getString(0);
        //取到單詞數
        Integer count = tuple.getInteger(1);

        //使用hbase的計數器進行單詞統計
        byte[] rowKey = Bytes.toBytes(word);
        byte[] f = Bytes.toBytes("f1");
        byte[] c = Bytes.toBytes("count");
        try {
            table.incrementColumnValue(rowKey, f, c, count);
        } catch (IOException e) {
            e.printStackTrace();
        }
    }

    public void cleanup() {

    }

    public void declareOutputFields(OutputFieldsDeclarer declarer) {

    }

    public Map<String, Object> getComponentConfiguration() {
        return null;
    }
}

WCApp

public class WCApp {
    public static void main(String[] args) throws Exception {
        TopologyBuilder builder = new TopologyBuilder();
        builder.setSpout("wcspout", new WordCountSpout()).setNumTasks(1);
        builder.setBolt("split-bolt", new SplitBolt(), 2).shuffleGrouping("wcspout").setNumTasks(2);
        builder.setBolt("hbase-bolt", new HbaseBolt(), 2).fieldsGrouping("split-bolt", new Fields("word")).setNumTasks(2);

        Config conf = new Config();
        LocalCluster cluster = new LocalCluster();
        cluster.submitTopology("wc", conf, builder.createTopology());
    }
}

Storm整合Hbase

將Storm流計算的結果儲存到Hbase上。以 WordCount 為例準備工作 1. 啟動叢集啟動ZooKeeper叢集 $> zkServer.sh start 啟動hadoop叢集(Hbase叢集啟動前應該保證H

Storm 系列（八）—— Storm 整合 HDFS 和 HBase

一、Storm整合HDFS 1.1 專案結構本用例原始碼下載地址：storm-hdfs-integration 1.2 專案主要依賴專案主要依賴如下，有兩個地方需要注意：這裡由於我伺服器上安裝的是 CDH 版本的 Hadoop，在匯入依賴時引入的也是 CDH 版本的依賴，需要使用 <

storm 整合 kafka之保存MySQL數據庫

ons fin 整合連接 shu date pri 對數 data 整合Kafka+Storm，消息通過各種方式進入到Kafka消息中間件，比如通過使用Flume來收集的日誌數據，然後暫由Kafka中的路由暫存，然後在由實時計算程序Storm做實時分析，這時候我們需要講S

大數據學習系列之五 ----- Hive整合HBase圖文詳解

scala direct ont 增加 pac hadoop2 exe dfs- min 引言在上一篇大數據學習系列之四 ----- Hadoop+Hive環境搭建圖文詳解(單機) 和之前的大數據學習系列之二 ----- HBase環境搭建(單機) 中成功搭建了Hive

【多資料來源連線】-Spring整合Hbase、Impala、Orcale三種資料來源

專案中需要按需連線不同的資料來源，原專案預設為mysql連線，現在要新增Hbase、Impala、Orcale三種資料來源，以支援現有的查詢（屬於報表子系統）。 MySql、Orcale、Impala是關係型資料庫，可以用bean來配置

Storm整合Kafka應用的開發

https://www.cnblogs.com/freeweb/p/5292961.html Storm整合Kafka應用的開發　　我們知道storm的作用主要是進行流式計算，對於源源不斷的均勻資料流流入處理是非常有效的，而現實生活中大部分場景並不是均勻的資料流，而是時而多時而少的資料流入

Hortonwork Ambari配置Hive整合Hbase的java開發maven配置

叢集環境 ambari 2.7.3 hdp/hortonwork 2.6.0.3 maven 1 <dependency> 2 <groupId>org.apache.hive</groupId> 3 <ar

iServer整合HBase操作說明

HBase是一款建立在Hadoop檔案系統之上的開源的分散式面向列的資料庫，採用橫向擴充套件架構。HBase是一個數據模型，類似於谷歌的大表設計，可以提供快速隨機訪問海量結構化資料，並利用了Hadoop的檔案系統（HDFS）提供的容錯

hive1.2.1整合hbase遇到的坑

通常我們會整合hive與hbase，通過建立hive外部表，進行一些增刪改查hbase表，hive1.2.1整合hbase1.2.6，遇到了一些坑，通過修改了幾行hive原始碼，重新編譯hive-hbase-handler-1.2.1.jar包替換hive lib目錄下原本那個hive-

Python基礎（六）--- Python爬蟲，Python整合Hbase，PythonWorldCount，Spark資料分析生成分析圖表

一、Python爬蟲 --------------------------------------------------- 1.測試 # -*- encoding=utf-8 -*- import urllib.request #

Storm框架：Storm整合springboot

except nfa 單例 code follow err als nco ons 我們知道Storm本身是一個獨立運行的分布式流式數據處理框架，Springboot也是一個獨立運行的web框架。那麽如何在Strom框架中集成Springboot使得我們能夠在Storm開發

saprk sql 整合 hbase 通過phoenix 關係對映 jdbc

首先說明遇到的坑要在phoenxi中建表，只有在Phoenix中建表才鞥對映到hbase ,因為spark是通過Phoenix的jdbc 插入資料的不是吧資料放進hbase而是把資料放進Phoenix 所以在hbase中建表是找不到的我是通過sparksql插入的 sparks

kafka與storm整合

kafka與storm的整合步驟採用官方storm-kafka-client方式進行整合一引入pom依賴 <properties> <project.build.sourceEncoding>UTF-8</

開發筆記 – Spring Boot整合HBase

最近在重新整理搜書吧(一個做圖書比價的平臺)的系統架構，目前圖書產品數量超過了200萬條。各種資料加起來超過40G了，使用Mysql資料庫儲存伺服器吃不消，於是考慮使用HBase儲存大部分資料。一、摘要以前搜書吧的資料量比較小，使用資料庫+靜態檔案儲存的方式就可以搞

Hive整合HBase --解決版本衝突

筆者使用的是0.99.2這個版本的hbase. 第一步：拷貝hbase的jar包到hive 需要hbase下面的jar包到hive的lib目錄下 hbase-client-0.99.2.jar hbase-common-0.99.2.jar hbase-server-0.99

Storm(七)Storm整合kafka

使用kafka-client jar進行Storm Apache Kafka整合這包括新的Apache Kafka消費者API。相容性 Apache Kafka版本0.10起引入jar包 &

Hadoop整合Hbase，處理完的資料直接存入Hbase中

Hadoop可以清洗計算TB級別的資料，資料清洗結束存入HDFS中，也可以存入到Hbase中，可以方便快速查詢； 1.Hbase中需要建立一張表用來儲存HDFS清洗後的資料： hbase(main):014:0> create_namespace 'hdfs'

Hive 整合Hbase

1、摘要 Hive提供了與HBase的整合，使得能夠在HBase表上使用HQL語句進行查詢插入操作以及進行Join和Union等複雜查詢、同時也可以將hive表中的資料對映到Hbase中。 2、應用場景 2.1 將ETL操作的資料存入HBase 2.2 HBase作為Hive

storm整合kafka舊版API（offset In Zk）示例

編寫主函式啟動類的Topo package com.simon.storm.kafka; import org.apache.storm.Config; import org.apache.storm.LocalCluster; import org.apache.storm.kafka.

storm整合kafka新版API（offset In Kafka）示例

本例storm版本為1.1.0 kafka版本為2.11.0.10.0.1 匯入maven依賴  <dependency> <groupId>org.apache.storm&

Storm整合Hbase

準備工作

1. 啟動叢集

2. maven依賴匯入

3. 配置檔案匯入

程式設計實現

源頭 Spout

分片 Bolt

HbaseBolt——寫資料到Hbase庫中

WCApp

相關推薦