storm1.2.1-wordcount可靠的單詞計數

阿新 • • 發佈：2019-01-23

專案原始碼下載：

https://download.csdn.net/download/adam_zs/10294019

測試程式運行了5次，每次失敗的訊息都會再次傳送。

SentenceSpout->SplitSentenceBolt->WordCountBolt->ReportBolt
這個TopologyBuilder順序如上，
在SentenceSpout中定義ConcurrentHashMap<UUID, Values> pending用來儲存傳送訊息的msgId,values;
在SplitSentenceBolt如果訊息接收處理成功this.outputCollector.ack(tuple);失敗this.outputCollector.fail(tuple);
根據程式列印結果看到在WordCountBolt，ReportBolt中msgId為空，經測試在WordCountBolt，ReportBolt中設定this.outputCollector.fail(tuple)，顯示的結果都是#####[ack]######；
所以在WordCountBolt，ReportBolt中設定的ack,fail無效；
總結：我寫的這個程式只能保證SentenceSpout->SplitSentenceBolt的訊息傳遞的可靠性；

package com.wangzs.chapter1.wordcountreliable;

import java.util.Map;
import java.util.UUID;
import java.util.concurrent.ConcurrentHashMap;

import org.apache.storm.spout.SpoutOutputCollector;
import org.apache.storm.task.TopologyContext;
import org.apache.storm.topology.OutputFieldsDeclarer;
import org.apache.storm.topology.base.BaseRichSpout;
import org.apache.storm.tuple.Fields;
import org.apache.storm.tuple.Values;
import org.apache.storm.utils.Utils;

/**
 * @title: 資料來源 <br/>
 * @author: wangzs <br/>
 * @date: 2018年3月18日
 */
public class SentenceSpout extends BaseRichSpout {

	private ConcurrentHashMap<UUID, Values> pending;
	private SpoutOutputCollector spoutOutputCollector;
	private String[] sentences = { "a b c d", "a b c ", "a b", "a" };

	@Override
	public void open(Map map, TopologyContext topologycontext, SpoutOutputCollector spoutoutputcollector) {
		this.spoutOutputCollector = spoutoutputcollector;
		this.pending = new ConcurrentHashMap<UUID, Values>();
	}

	@Override
	public void nextTuple() {
		for (String sentence : sentences) {
			Values values = new Values(sentence);
			UUID msgId = UUID.randomUUID();
			this.spoutOutputCollector.emit(values, msgId);
			this.pending.put(msgId, values);
			System.out.println("SentenceSpout==> " + values + " msgId=" + msgId);
		}
		Utils.sleep(1000);
	}

	@Override
	public void declareOutputFields(OutputFieldsDeclarer outputfieldsdeclarer) {
		outputfieldsdeclarer.declare(new Fields("sentence"));
	}

	@Override
	public void ack(Object msgId) {
		System.out.println("#####[ack]###### msgId=" + msgId + " values=" + this.pending.get(msgId));
		this.pending.remove(msgId);
	}

	@Override
	public void fail(Object msgId) {
		System.out.println("#####[fail]###### msgId=" + msgId + " values=" + this.pending.get(msgId));
		this.spoutOutputCollector.emit(this.pending.get(msgId), msgId);
	}

}

package com.wangzs.chapter1.wordcountreliable;

import java.util.Map;

import org.apache.storm.task.OutputCollector;
import org.apache.storm.task.TopologyContext;
import org.apache.storm.topology.OutputFieldsDeclarer;
import org.apache.storm.topology.base.BaseRichBolt;
import org.apache.storm.tuple.Fields;
import org.apache.storm.tuple.Tuple;
import org.apache.storm.tuple.Values;

/**
 * @title: 分隔單詞 <br/>
 * @author: wangzs <br/>
 * @date: 2018年3月18日
 */
public class SplitSentenceBolt extends BaseRichBolt {
	private OutputCollector outputCollector;

	@Override
	public void execute(Tuple tuple) {
		String sentence = tuple.getStringByField("sentence");
		String[] words = sentence.split(" ");
		for (String word : words) {
			this.outputCollector.emit(new Values(word));
		}
		System.out.println("SplitSentenceBolt==> " + sentence + " msgId=" + tuple.getMessageId());
		if (sentence.equals("a b c d")) {
			this.outputCollector.fail(tuple);
		} else {
			this.outputCollector.ack(tuple);
		}
	}

	@Override
	public void prepare(Map map, TopologyContext topologycontext, OutputCollector outputcollector) {
		this.outputCollector = outputcollector;
	}

	@Override
	public void declareOutputFields(OutputFieldsDeclarer outputfieldsdeclarer) {
		outputfieldsdeclarer.declare(new Fields("word"));
	}

}

package com.wangzs.chapter1.wordcountreliable;

import java.util.HashMap;
import java.util.Map;

import org.apache.storm.task.OutputCollector;
import org.apache.storm.task.TopologyContext;
import org.apache.storm.topology.OutputFieldsDeclarer;
import org.apache.storm.topology.base.BaseRichBolt;
import org.apache.storm.tuple.Fields;
import org.apache.storm.tuple.Tuple;
import org.apache.storm.tuple.Values;

/**
 * @title: 實現單詞計數 <br/>
 * @author: wangzs <br/>
 * @date: 2018年3月18日
 */
public class WordCountBolt extends BaseRichBolt {
	private OutputCollector outputCollector;
	private HashMap<String, Integer> counts = null;

	@Override
	public void prepare(Map map, TopologyContext topologycontext, OutputCollector outputcollector) {
		this.outputCollector = outputcollector;
		this.counts = new HashMap<String, Integer>();
	}

	@Override
	public void execute(Tuple tuple) {
		String word = tuple.getStringByField("word");
		Integer count = counts.get(word);
		if (count == null) {
			count = 0;
		}
		count++;
		this.counts.put(word, count);
		this.outputCollector.emit(new Values(word, count));
		this.outputCollector.ack(tuple);
		System.out.println("WordCountBolt==> " + word + " msgId=" + tuple.getMessageId());
	}

	@Override
	public void declareOutputFields(OutputFieldsDeclarer outputfieldsdeclarer) {
		outputfieldsdeclarer.declare(new Fields("word", "count"));
	}

}

package com.wangzs.chapter1.wordcountreliable;

import org.apache.storm.Config;
import org.apache.storm.LocalCluster;
import org.apache.storm.topology.TopologyBuilder;
import org.apache.storm.tuple.Fields;
import org.apache.storm.utils.Utils;

/**
 * @title: 可靠的單詞計數 <br/>
 * @author: wangzs <br/>
 * @date: 2018年3月18日
 */
public class WordCountTopology {
	public static void main(String[] args) {
		SentenceSpout sentenceSpout = new SentenceSpout();
		SplitSentenceBolt splitSentenceBolt = new SplitSentenceBolt();
		WordCountBolt wordCountBolt = new WordCountBolt();
		ReportBolt reportBolt = new ReportBolt();

		TopologyBuilder builder = new TopologyBuilder();
		builder.setSpout("sentenceSpout-1", sentenceSpout);
		builder.setBolt("splitSentenceBolt-1", splitSentenceBolt).shuffleGrouping("sentenceSpout-1");
		builder.setBolt("wordCountBolt-1", wordCountBolt).fieldsGrouping("splitSentenceBolt-1", new Fields("word"));
		builder.setBolt("reportBolt-1", reportBolt).globalGrouping("wordCountBolt-1");

		Config config = new Config();
		LocalCluster cluster = new LocalCluster();
		// 本地提交
		cluster.submitTopology("wordCountTopology-1", config, builder.createTopology());
		Utils.sleep(10000);
		cluster.killTopology("wordCountTopology-1");
		cluster.shutdown();
	}
}

執行結果：

storm1.2.1-wordcount可靠的單詞計數

storm1.2.1-wordcount可靠的單詞計數

RHEL7.0下安裝Storm1.2.1叢集

storm1.2.1-單機部署，執行自己開發的jar

Hadoop WordCount單詞計數原理

算法競賽訓練指南2.1 計數方法

34 文本樣式 1 word-spacing單詞間距 letter-spacing 字母間距 2 text-align 文本對齊方式 justify 兩端對齊 3 text-indent 首行縮進

Hadoop之MapReduce過程，單詞計數WordCount

（2.1.27.13）Java併發程式設計：Lock之CountDownLatch計數式獨享鎖

Scala +Spark+Hadoop+Zookeeper+IDEA實現WordCount單詞計數（簡單例項）

3. 串的處理在實際的開發工作中，對字串的處理是最常見的程式設計任務。本題目即是要求程式對使用者輸入的串進行處理。具體規則如下： 1. 把每個單詞的首字母變為大寫。 2. 把數字與

hadoop入門（六）JavaAPI+Mapreduce例項wordCount單詞計數詳解

Linux 單詞計數 WordCount 以及程式碼案例

Scala+Spark+Hadoop+IDEA實現WordCount單詞計數，上傳並執行任務（簡單例項-下）

Hadoop實戰（一），單詞計數（wordcount）

map/reduce例項wordCount單詞計數實現功能

(轉) Hadoop1.2.1安裝

《實體解析與信息質量》 - 2.2.1 復習題

2.2.1 PREFACE NUMBERING 序言頁碼

USACO Section 2.1 Healthy Holsteins

Tomcat version 6.0 only supports J2EE 1.2, 1.3, 1.4, and Java EE 5 Web modules

storm1.2.1-wordcount可靠的單詞計數

相關推薦