kafka-sparkstreaming---學習1

阿新 • • 發佈：2018-03-31

dsd pub row tap str shm UNC obj cts

---恢復內容開始---

import java.util.*;

import org.apache.spark.SparkConf;
import org.apache.spark.TaskContext;
import org.apache.spark.api.java.*;
import org.apache.spark.api.java.function.*;
import org.apache.spark.streaming.Seconds;
import org.apache.spark.streaming.api.java.*;
import org.apache.spark.streaming.kafka010. 
*;
import org.apache.kafka.clients.consumer.ConsumerRecord;
import org.apache.kafka.common.TopicPartition;
import org.apache.kafka.common.serialization.StringDeserializer;
import scala.Tuple2;

/**
 */
public class KafkaSparkStreamingDemo {
    public static void main(String[] args) throws InterruptedException {

        SparkConf conf  
= new SparkConf();
        conf.setAppName("kafkaSpark");
        conf.setMaster("local[4]");
        //創建Spark流應用上下文
        JavaStreamingContext streamingContext = new JavaStreamingContext(conf, Seconds.apply(5));

        Map<String, Object> kafkaParams = new HashMap<>();
        kafkaParams.put( 
"bootstrap.servers", "s202:9092,s203:9092");
        kafkaParams.put("key.deserializer", StringDeserializer.class);
        kafkaParams.put("value.deserializer", StringDeserializer.class);
        kafkaParams.put("group.id", "g6");
        kafkaParams.put("auto.offset.reset", "latest");
        kafkaParams.put("enable.auto.commit", false);

        Collection<String> topics = Arrays.asList("mytopic1");

        final JavaInputDStream<ConsumerRecord<String, String>> stream =
                KafkaUtils.createDirectStream(
                        streamingContext,
                        LocationStrategies.PreferConsistent(),
                        ConsumerStrategies.<String, String>Subscribe(topics, kafkaParams)
                );

        //壓扁
        JavaDStream<String> wordsDS = stream.flatMap(new FlatMapFunction<ConsumerRecord<String,String>, String>() {
            public Iterator<String> call(ConsumerRecord<String, String> r) throws Exception {
                String value = r.value();
                List<String> list = new ArrayList<String>();
                String[] arr = value.split(" ");
                for (String s : arr) {
                    list.add(s);
                }
                return list.iterator();
            }
        });

        //映射成元組
        JavaPairDStream<String, Integer> pairDS = wordsDS.mapToPair(new PairFunction<String, String, Integer>() {
            public Tuple2<String, Integer> call(String s) throws Exception {
                return new Tuple2<String, Integer>(s, 1);
            }
        });

        //聚合
        JavaPairDStream<String, Integer> countDS = pairDS.reduceByKey(new Function2<Integer, Integer, Integer>() {
            public Integer call(Integer v1, Integer v2) throws Exception {
                return v1 + v2;
            }
        });
        //打印
        countDS.print();

        streamingContext.start();

        streamingContext.awaitTermination();
    }
}

上面是java版。

---恢復內容結束---

kafka-sparkstreaming---學習1

dsd pub row tap str shm UNC obj cts ---恢復內容開始--- import java.util.*; import org.apache.spark.SparkConf; import org.apache.spark.TaskCon

kafka學習(1)linux下的安裝和啟動，以及Java示例程式碼

1. 安裝 1.1 下載kafka並解壓 wget http://mirror.bit.edu.cn/apache/kafka/0.11.0.0/kafka_2.11-0.11.0.0.tgz tar -zxvf kafka_2.11-0.11.0.0.tgz 1.2 修改

1,Kafka系列學習筆記-認識kafka

慕課學習筆記https://www.imooc.com/learn/1043 1，Kafka概念 1>what? LinkedIn 開源分散式資料同步系統Databus

Kafka 學習筆記（5）—— flume + kafka 整合（1）

1 需求分析採集訂單系統應用列印的日誌檔案。日誌檔案使用 log4j 生成，滾動生成。將採集的日誌檔案儲存到 kafka中。（source）輸入： tail -F xx.log

kafka消息通信原理學習(1)

coord 例子 eba alt sub 序列化 strac system str 關於 Topic 和 Partition：　　Topic：在 kafka 中，topic 是一個存儲消息的邏輯概念，可以認為是一個消息集合。每條消息發送到 kafka 集群的消息都有一個

Spark學習（二）---kafka+SparkStreaming的搭建與連線

環境說明：三臺機器（Centos 6.5）： Master 192.168.203.148 Slave1 192.168.203.149 Slave2 192.168.203.150 第一步：環境 spark環境配置： spark安裝很簡單，可以參考網上教程，說下spar

SparkStreaming學習筆記:獲取kafka資料

在Spark Streaming中消費 Kafka 資料的時候，有兩種方式分別是： 1.基於 Receiver-based 的 createStream 方法。receiver從Kafka中獲取的資料都是儲存在Spark Executor的記憶體中的，然後Spark St

dubbo學習(1)--簡單的入門搭建實例

實現類 set ng- dds 更新輸出 block sys 註冊轉載請註明源文出處：http://www.cnblogs.com/lighten/p/6828026.html 1 簡介 dubbo是一個分布式服務框架，由阿裏巴巴的工程師開發，致力於提供

Java學習（三）JSP學習1

rtm 斷開三大指令保持 web應用對比 c語言 let 新建一、理解JSP技術　　JSP全名為Java Server Pages，中文名叫java服務器頁面，其根本是一個簡化的Servlet設計，它是由Sun Microsystems公司倡導、許多公司參

Python Tkinter學習(1)——第一個Tkinter程序

這一 tkinter courier 訪問 elf creat int 學習開始註：本文可轉載，轉載請註明出處：http://www.cnblogs.com/collectionne/p/6885066.html。 Tkinter介紹 Python支持多個圖形庫

C#學習1

可視化編程最新可視化 XML 結構類庫 net 整體 asp C#主要有"安德斯~海爾斯伯"格主持開發,最新版本為5.0， .NET框架為.NET Framework4.5 Visual C#.NET特點：可視化編程、面向對象、事件驅動、支持數據庫編程、web編程 .

servlet學習(1)

sun公司 troy clas dream 簡單 har pack res generics 1.Servlet是sun公司提供的一門用於開發動態web資源的技術。 2.Servlet在web應用的位置： 3.創建Servlet的三種方式： (1)實現

大數據平臺學習-1

div hadoop nutch 基本映射數據分布數據 ast 計算引擎數據平臺架構圖 HDFS：Hadoop分布式文件系統(HDFS)被設計成適合運行在通用硬件(commodity hardware)上的分布式文件系統。它和現有的分布式文件系統有很多共同點。但同

JavaWeb學習入門之——圖書館管理系統開發（Hibernate學習1）

pass ica void 技術分享 gets 學習 images 創建 driver 最近看了看JavaWeb的書籍，才感覺到大二時候學的JavaWeb才僅僅只是個入門。最尷尬的當初還沒咋學一直在看.NET，現在看起來JavaWeb，各種框架各種頭疼啊。看了幾個例子之後覺

c++開始學習1

namespace oct sca 命名基本 float print name cst 慕課-c++遠征之起航篇 1、c++與c的不同數據類型：共同：基本：（int、char、float、double），構造：（數組、struct、union、emum），指針類型，空

html 學習1

logs log 一份 pre nbsp span 學習 doc code <!doctype html> <html> <body> <p>一份耕耘，一份收獲。</p> <p>含義 <q>

wireshark 學習 1

ifconf wlan fig bsp con del 正在 type res wireshark 調試WiFi 安裝之後的啟動腳步。 #！/bin/bash iw dev mon0 del iw dev wlp3s0 interface add mon0 type

rn學習1：

https you abs exp 1.8 -a eating oca 2.0 /usr/local/bin/react-native -> /usr/local/lib/node_modules/react-native-cli/index.js/usr/local

CC2540藍牙模塊學習(1)

undefine har hand 創建 .com ble 變量 tar 監管本篇隨筆摘自於：http://www.cnblogs.com/yygsj/p/5135150.html#undefined 一、整體 1.TI的藍牙平臺支持2種協議棧/應用配置：單一設備配

oc學習1——基本數據類型

.com block 技術 eight bsp height com width 面向　　OC是在C語言的基礎上進行擴展的一種面向對象的編程語言。很多基礎知識都和C語言中的非常類似。首先介紹一下OC中的基本數據類型，整體框架如下圖： oc學習1——基本數據類型

kafka-sparkstreaming---學習1

相關推薦