Storm之——程式設計案例

阿新 • • 發佈：2019-02-17

一、程式需求

今天，我們再次為大家帶來一篇關於Storm的文章，以便為大家起到複習Storm的效果。這篇文章的程式設計案例基於Maven實現，主要的功能是：從檔案讀取內容——>切分單詞，去掉首尾空格並將單詞轉化為小寫——>統計單詞數量並列印結果。

好了，明確了程式要實現的功能之後，我們就正式進入Storm的開發。

二、程式實現

1、建立工程

首先我們建立一個Maven工程，編譯pom.xml檔案如下：

<project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
	xsi:schemaLocation="http://maven.apache.org/POM/4.0.0
             http://maven.apache.org/xsd/maven-4.0.0.xsd">
	<modelVersion>4.0.0</modelVersion>
	<groupId>com.lyz</groupId>
	<artifactId>storm-test</artifactId>
	<version>0.0.1-SNAPSHOT</version>
	<build>
		<plugins>
			<plugin>
				<groupId>org.apache.maven.plugins</groupId>
				<artifactId>maven-compiler-plugin</artifactId>
				<version>2.3.2</version>
				<configuration>
					<source>1.7</source>
					<target>1.7</target>
					<compilerVersion>1.7</compilerVersion>
				</configuration>
			</plugin>
		</plugins>
	</build>
	<repositories>
		<!-- Repository where we can found the storm dependencies -->
		<repository>
			<id>clojars.org</id>
			<url>http://clojars.org/repo</url>
		</repository>
	</repositories>
	<dependencies>
		<!-- Storm Dependency -->
		<dependency>
			<groupId>storm</groupId>
			<artifactId>storm</artifactId>
			<version>0.6.0</version>
		</dependency>
	</dependencies>
</project>

工程的目錄結構如下：

2、編寫Spout類WordReader

這個類的主要作用是負責從檔案按行讀取文字，並把文字行提供給第一個bolt。

主要程式碼如下：

package com.lyz.storm.spouts;

import java.io.BufferedReader;
import java.io.FileNotFoundException;
import java.io.FileReader;
import java.util.Map;

import backtype.storm.spout.SpoutOutputCollector;
import backtype.storm.task.TopologyContext;
import backtype.storm.topology.IRichSpout;
import backtype.storm.topology.OutputFieldsDeclarer;
import backtype.storm.tuple.Fields;
import backtype.storm.tuple.Values;

/**
 *WordReader負責從檔案按行讀取文字，並把文字行提供給第一個bolt。
 * @author liuyazhuang
 *
 */
public class WordReader implements IRichSpout {

	private static final long serialVersionUID = -850307559130820088L;

	private SpoutOutputCollector collector;
	private FileReader fileReader;
	private boolean completed = false;
	private TopologyContext context;
	@Override
	public boolean isDistributed() {
		return false;
	}
	@Override
	public void ack(Object msgId) {
		System.out.println("OK:" + msgId);
	}
	@Override
	public void close() {
	}
	@Override
	public void fail(Object msgId) {
		System.out.println("FAIL:" + msgId);
	}

	/**
	 * 這個方法做的惟一一件事情就是分發檔案中的文字行
	 */
	@Override
	public void nextTuple() {
		/**
		 * 這個方法會不斷的被呼叫，直到整個檔案都讀完了，我們將等待並返回。
		 */
		if (completed) {
			try {
				Thread.sleep(1000);
			} catch (InterruptedException e) {
				// 什麼也不做
			}
			return;
		}
		String str;
		// 建立reader
		BufferedReader reader = new BufferedReader(fileReader);
		try {
			// 讀所有文字行
			while ((str = reader.readLine()) != null) {
				/**
				 * 按行釋出一個新值
				 */
				this.collector.emit(new Values(str), str);
			}
		} catch (Exception e) {
			throw new RuntimeException("Error reading tuple", e);
		} finally {
			completed = true;
		}
	}

	/**
	 * 我們將建立一個檔案並維持一個collector物件
	 */
	@Override
	public void open(Map conf, TopologyContext context, SpoutOutputCollector collector) {
		try {
			this.context = context;
			this.fileReader = new FileReader(conf.get("wordsFile").toString());
		} catch (FileNotFoundException e) {
			throw new RuntimeException("Error reading file [" + conf.get("wordFile") + "]");
		}
		this.collector = collector;
	}

	/**
	 * 宣告輸入域"word"
	 */
	@Override
	public void declareOutputFields(OutputFieldsDeclarer declarer) {
		declarer.declare(new Fields("line"));
	}

}

3、編寫第一個bolt類WordNormalizer

這個類的主要作用是：負責得到並標準化每行文字。它把文字行切分成單詞，大寫轉化成小寫，去掉頭尾空白符，並將結果傳送給第二個bolt類。

具體程式碼如下：

package com.lyz.storm.bolts;

import java.util.ArrayList;
import java.util.List;
import java.util.Map;

import backtype.storm.task.OutputCollector;
import backtype.storm.task.TopologyContext;
import backtype.storm.topology.IRichBolt;
import backtype.storm.topology.OutputFieldsDeclarer;
import backtype.storm.tuple.Fields;
import backtype.storm.tuple.Tuple;
import backtype.storm.tuple.Values;

/**
 * 負責得到並標準化每行文字。它把文字行切分成單詞，大寫轉化成小寫，去掉頭尾空白符。
 * @author liuyazhuang
 *
 */
public class WordNormalizer implements IRichBolt {
	private static final long serialVersionUID = -2127001114476106896L;
	
	private OutputCollector collector;
	
	@Override
	public void cleanup() {
		
	}

	/**
	 * *bolt*從單詞檔案接收到文字行，並標準化它。 文字行會全部轉化成小寫，並切分它，從中得到所有單詞。
	 */
	@Override
	public void execute(Tuple input) {
		String sentence = input.getString(0);
		String[] words = sentence.split(" ");
		for (String word : words) {
			word = word.trim();
			if (!word.isEmpty()) {
				word = word.toLowerCase();
				// 釋出這個單詞
				List<Tuple> a = new ArrayList<Tuple>();
				a.add(input);
				collector.emit(a, new Values(word));
			}
		}
		// 對元組做出應答
		collector.ack(input);
	}
	@Override
	public void prepare(Map stormConf, TopologyContext context, OutputCollector collector) {
		this.collector = collector;
	}

	/**
	 * 這個*bolt*只會釋出“word”域
	 */
	@Override
	public void declareOutputFields(OutputFieldsDeclarer declarer) {
		declarer.declare(new Fields("word"));
	}
}

4、編寫第二個bolt類WordCounter

這個類的主要作用是：統計每個單詞的數量並列印結果。

package com.lyz.storm.bolts;

import java.util.HashMap;
import java.util.Map;

import backtype.storm.task.OutputCollector;
import backtype.storm.task.TopologyContext;
import backtype.storm.topology.IRichBolt;
import backtype.storm.topology.OutputFieldsDeclarer;
import backtype.storm.tuple.Tuple;

/**
 * 負責為單詞計數。這個拓撲結束時（cleanup()方法被呼叫時），我們將顯示每個單詞的數量。
 * 這個例子的bolt什麼也沒釋出，它把資料儲存在map裡，但是在真實的場景中可以把資料儲存到資料庫。
 * @author liuyazhuang
 *
 */
public class WordCounter implements IRichBolt{
	
	private static final long serialVersionUID = 6323893801667766697L;
	Integer id;
    String name;
    Map<String,Integer> counters;
    private OutputCollector collector;

    /**
      * 這個spout結束時（叢集關閉的時候），我們會顯示單詞數量
      */
    @Override
    public void cleanup(){
        System.out.println("-- 單詞數 【"+name+"-"+id+"】 --");
        for(Map.Entry<String,Integer> entry : counters.entrySet()){
            System.out.println(entry.getKey()+": "+entry.getValue());
        }
    }

    /**
     *  為每個單詞計數
     */
    @Override
    public void execute(Tuple input) {
        String str=input.getString(0);
        /**
         * 如果單詞尚不存在於map，我們就建立一個，如果已在，我們就為它加1
         */
        if(!counters.containsKey(str)){
        	counters.put(str,1);
        }else{
            Integer c = counters.get(str) + 1;
            counters.put(str,c);
        }
        //對元組作為應答
        collector.ack(input);
    }

    /**
     * 初始化
     */
    @Override
    public void prepare(Map stormConf, TopologyContext context, OutputCollector collector){
        this.counters = new HashMap<String, Integer>();
        this.collector = collector;
        this.name = context.getThisComponentId();
        this.id = context.getThisTaskId();
    }

    @Override
    public void declareOutputFields(OutputFieldsDeclarer declarer) {}
}

5、編寫執行程式的入口類TopologyMain

這個類的主要作用是：作為程式的入口，以本地模式執行。
具體程式碼如下：

package com.lyz.storm;
import com.lyz.storm.bolts.WordCounter;
import com.lyz.storm.bolts.WordNormalizer;
import com.lyz.storm.spouts.WordReader;

import backtype.storm.Config;
import backtype.storm.LocalCluster;
import backtype.storm.topology.TopologyBuilder;
import backtype.storm.tuple.Fields;

/**
 * 執行程式的主類，本例項以本地模式執行
 * @author liuyazhuang
 *
 */
public class TopologyMain {
	
	public static void main(String[] args) throws InterruptedException {
		// 定義拓撲
		TopologyBuilder builder = new TopologyBuilder();
		builder.setSpout("word-reader", new WordReader());
		builder.setBolt("word-normalizer", new WordNormalizer()).shuffleGrouping("word-reader");
		builder.setBolt("word-counter", new WordCounter(), 2).fieldsGrouping("word-normalizer", new Fields("word"));

		// 配置
		Config conf = new Config();
		conf.put("wordsFile", "D:/Workspaces/Hadoop/storm-test/src/main/resources/word.txt");
		conf.setDebug(false);

		// 執行拓撲
		conf.put(Config.TOPOLOGY_MAX_SPOUT_PENDING, 1);
		LocalCluster cluster = new LocalCluster();
		cluster.submitTopology("Getting-Started-Topologie", conf, builder.createTopology());
		Thread.sleep(1000);
		cluster.shutdown();
	}
}

6、建立word.txt檔案

在工程的src/main/resources目錄下建立word.txt檔案如下：

Storm test are great is an Storm simple application but very powerful really Storm is great great great great great great great great great great great great great great great great great great great great great great great

至此，整個工程建立完畢。

三、執行程式

我們執行程式的入口類TopologyMain

可以看到控制檯輸出如下日誌：

1501 [Thread-24] INFO  backtype.storm.util  - Async loop interrupted!
-- 單詞數 【word-counter-3】 --
really: 1
but: 1
great: 24
an: 1
storm: 3
1504 [main] INFO  backtype.storm.daemon.task  - Shut down task Getting-Started-Topologie-1-1509248619:3
1504 [main] INFO  backtype.storm.daemon.task  - Shutting down task Getting-Started-Topologie-1-1509248619:2
1504 [Thread-26] INFO  backtype.storm.util  - Async loop interrupted!
-- 單詞數 【word-counter-2】 --
application: 1
is: 2
are: 1
test: 1
simple: 1
powerful: 1
very: 1
1507 [main] INFO  backtype.storm.daemon.task  - Shut down task Getting-Started-Topologie-1-1509248619:2

其中打印出了word.txt檔案中的每個單詞的統計數量。至此，整個應用程式編寫測試完畢。

四、溫馨提示

Storm之——程式設計案例

一、程式需求今天，我們再次為大家帶來一篇關於Storm的文章，以便為大家起到複習Storm的效果。這篇文章的程式設計案例基於Maven實現，主要的功能是：從檔案讀取內容——>切分單詞，去掉首尾空格並將單詞轉化為小寫——>統計單詞數量並列印結果。好了，明確了

hadoop 之 storm （程式設計模型、併發度、架構模型）

目錄 1、程式設計模型 2、併發度 3、架構模型 1、程式設計模型 DataSource：外部資料來源； Spout：接受外部資料來源的元件，將外部資料來源轉化成Storm內部的

Java的資料庫程式設計之入門案例

package test.jdbc; import java.io.IOException; import java.io.InputStream; import java.nio.file.Files; import java.nio.file.Paths; import java.sql.Connect

Storm之——Storm+Kafka+Flume+Zookeeper+MySQL實現資料實時分析(程式案例篇)

一、前言二、簡單介紹為了方便，這裡我們只是簡單的向/home/flume/log.log中追加單詞，每行一個單詞，利用Storm接收每個單詞，將單詞計數更新到資料庫，具體的邏輯為，如果資料庫中沒有相關單詞，則將資料插入資料庫，如果存在相關單詞，則更新資料庫中的計數。具體SQL

openssl之aes加密（AES_cbc_encrypt 與 AES_encrypt 的程式設計案例）

#include<stdio.h>#include<string.h>#include<stdlib.h>#include<openssl/aes.h>#define AES_BITS 128#define MSG_LEN 128int aes_encrypt

55.storm 之 hello word（本地模式）

pro collector base 執行 top 命令 type utc isp strom hello word 概述然後卡一下代碼怎麽實現的：編寫數據源類：Spout。可以使用兩種方式：繼承BaseRichSpout類實現IRichSpout接口主要需要實現或

56.storm 之 hello world （集群模式）

目錄是否代碼 -1 maven 參考 ntb 分享 log文件回顧　　在上一小節，我們在PWTopology1 這一個java類中註解掉了集群模式，使用本地模式大概了解一下storm的工作流程。這一節我們註解掉本地模式相關的代碼，放開集群模式相關代碼，並且將項目打包

《大話設計模式》——讀後感（8）好菜每回味不同——建造者模式之基礎案例（1）

ted builds src ret 分離 args 類圖 rec 方法建造者模式：是將一個復雜的對象的構建與它的表示分離，使得同樣的構建過程可以創建不同的表示。建造者模式通常包括下面幾個角色： 1. builder：給出一個抽象接口，以規範產品對象的各個組成成分的

Storm之路-WordCount-實例

ade debug clas boolean gif import oot 遠程 lex 初學storm，有不足的地方還請糾正。網上看了很多wordcount實例，發現都不是我想要的。實現場景：統計shengjing.txt詞頻到集合，一次打印結果。 ● 消息源Sp

Storm筆記整理（二）：Storm本地開發案例—總和計算與單詞統計

大數據實時計算 Storm [TOC] 概述在Strom的API中提供了LocalCluster對象，這樣在不用搭建Storm環境或者Storm集群的情況下也能夠開發Storm的程序，非常方便。基於Maven構建工程項目，其所需要的依賴如下： <dependency>

PHP Socket 編程之9個主要函數的使用之測試案例

客戶 alt sockets 參考作用 ket mysq nec udp php的socket編程算是比較難以理解的東西吧，不過，我們只要理解socket幾個函數之間的關系，以及它們所扮演的角色，那麽理解起來應該不是很難了，在筆者看來，socket編程，其實就是建立一個網

C++基礎學習之程式設計模組(4)

函式和二維陣列在C++中，二維陣列的定義完全與一維陣列不同： int data[3][4] = {{1, 2, 3, 4}, {9, 8, 7, 6}, {2, 4, 6, 8}}; data不能當作是一維陣列的指標然後去訪問12個元素，data[0~2]每個都是一個一維陣列

Linux網路程式設計案例分析

本程式碼來自於博主：輝夜星辰本篇主要對執行程式碼中出現的問題進行分析，程式碼本身的內容後續展開討論。伺服器端程式碼 1 /* 2 Linux網路程式設計之TCP程式設計,伺服器端讀資料 3 socket函式之後，返回值serfd，作為後面所有網路程式設計函式

【 MATLAB 】訊號處理工具箱之 fft 案例分析

上篇博文：【 MATLAB 】訊號處理工具箱之fft簡介及案例分析介紹了MATLAB訊號處理工具箱中的訊號變換 fft 並分析了一個案例，就是被噪聲汙染了的訊號的頻譜分析。這篇博文繼續分析幾個小案例： Gaussian Pulse 這個案例是將高斯脈衝從時域變換到頻域，高斯脈衝的資

Spark Streaming整合Spark SQL之wordcount案例

完整原始碼地址： https://github.com/apache/spark/blob/v2.3.2/examples/src/main/scala/org/apache/spark/examples/streaming/SqlNetworkWordCount.scala 案例原

《遊戲人工智慧程式設計案例精粹(修訂版)》pdf格式下載電子書免費下載

《遊戲人工智慧程式設計案例精粹(修訂版)》pdf格式下載電子書免費下載: https://u253469.ctfile.com/fs/253469-302448508 內容簡介《遊戲人工智慧程式設計案例精粹(修訂版)》由Mat Buckland著，羅岱等人譯，是遊戲人工智慧方面的經典之作，

Unity實戰之Protobuf案例應用

轉自https://blog.csdn.net/jxw167/article/details/80127696 Protobuf 全稱Protocol Buffers 是一種輕便高效的結構化資料儲存格式，可以用於結構化資料序列化，很適合做資料儲存或 RPC 資料交換格式。它可用於通訊協議、資料儲

C程式設計--案例（2018年江蘇大學程式設計考研試題 -- 程式設計題）

題目（總）：解答(答案為博主自已所寫，並非最優程式碼，僅供參考) 第一題題目定義一個函式,計算並返回如下算式的值:函式式見上，在主函式中輸入10組實數a、b、c的值。。。。。。參考程式碼（答案並非最優程式碼，僅供參考

C程式設計--案例（2017年江蘇大學程式設計考研試題 -- 程式設計題）

題目（總）：解答(答案為博主自已所寫，並非最優程式碼，僅供參考) 第一題題目切比雪夫多項式（運用遞迴函式計算）參考程式碼（答案並非最優程式碼，僅供參考） #include<stdio.h>

C程式設計--案例（2016年江蘇大學程式設計考研試題 -- 程式設計題）

題目（總）：解答(答案為博主自已所寫，並非最優程式碼，僅供參考) 第一題題目已知檔案Coefficient.txt存有多個方程中係數（具體見題目總）。。。。（檔案讀寫 + 一元二次方程的處理）參考程式碼（答案並非最優

Storm之——程式設計案例

一、程式需求

二、程式實現

1、建立工程

2、編寫Spout類WordReader

3、編寫第一個bolt類WordNormalizer

4、編寫第二個bolt類WordCounter

5、編寫執行程式的入口類TopologyMain

6、建立word.txt檔案

三、執行程式

四、溫馨提示

相關推薦