Spark Streaming示例(scala篇)

阿新 • • 發佈：2019-02-17

本段程式碼運行於Intellij IDEA中,與linux 中nc進行互動

1.Scala程式碼:

import org.apache.spark.SparkConf
import org.apache.spark.streaming.dstream.{DStream, ReceiverInputDStream}
import org.apache.spark.streaming.{Seconds, StreamingContext}

object StreamingWordCount {
def main(args: Array[String]) {

//程式在執行時receiver會獨佔一個執行緒,所以streaming程式至少要兩個執行緒,防止starvation scenario

val conf: SparkConf = new SparkConf().setMaster("local[2]").setAppName("StreamingWordCount")

//所有流功能的主要入口
val ssc: StreamingContext = new StreamingContext(conf , Seconds(5))

//指定從TCP源資料流的離散流,接收到的每一行資料都是一行文字
val stream: ReceiverInputDStream[String] = ssc.socketTextStream("hadoop-1707-003",6666)

//將接收到的文字壓平,轉換,聚合

val dStream: DStream[(String, Int)] = stream.flatMap(_.split(" ")).map((_,1)).reduceByKey(_ + _)

dStream.print()

// Spark Streaming 只有建立在啟動時才會執行計算，在它已經開始之後，並沒有真正地處理。
//---------------------------------------
//啟動計算
ssc.start()
//等待計算終止
ssc.awaitTermination()
//true 會把內部的sparkcontext同時停止
//false 只會停止streamingcontext 不會停sparkcontext

ssc.stop(true)
}

}

2.linux中nc

2.1.下載nc

2.2.解壓nc

rpm -ivh nc-1.84-22.el6.x86_64.rpm

2.3.開啟nc命令

nc -lk 6666

3.執行scala程式碼,並在nc上輸入

執行結果如圖:

Spark Streaming示例(scala篇)

2.linux中nc

Spark Streaming示例(scala篇)

flume+spark streaming+redis完整篇

scala spark-streaming整合kafka （spark 2.3 kafka 0.10）

使用java和scala編寫spark-WordCount示例

二、spark SQL互動scala操作示例

Spark Streaming狀態管理函式（二）——updateStateByKey的使用（scala版）

Spark Streaming狀態管理函式（三）——MapWithState的使用（scala版）

十、spark graphx的scala示例

十二、spark MLlib的scala示例

Spark修煉之道（進階篇）——Spark入門到精通：第十四節 Spark Streaming 快取、Checkpoint機制

Spark修煉之道（進階篇）——Spark入門到精通：第十六節 Spark Streaming與Kafka

Spark修煉之道（進階篇）——Spark入門到精通：第十三節 Spark Streaming—— Spark SQL、DataFrame與Spark Streaming

Spark 入門之 Scala 語言解釋及示例講解

Scala和Java二種方式實戰Spark Streaming開發

【十五】Spark Streaming整合Kafka使用Direct方式（使用Scala語言）

兩種模型選擇和超引數調整方法及Spark MLlib使用示例(Scala/Java/Python)

Spark修煉之道（進階篇）——Spark入門到精通：第十節 Spark Streaming（一)

【八】Spark Streaming 用foreachRDD把結果寫入Mysql中Local模式（使用Scala語言）

SODBASE CEP學習進階篇（七）續：SODBASE CEP與Spark streaming整合-低延遲規則管理與分散式快取整合

整合Kafka到Spark Streaming——程式碼示例和挑戰

Spark Streaming示例(scala篇)

2.linux中nc

相關推薦