kafka資料快取到redis的全路徑操作流程

阿新 • • 發佈：2018-11-19

第一步：配置redis客戶端

spark中配置redis客戶端的程式碼參考：

import org.apache.commons.pool2.impl.GenericObjectPoolConfig

import redis.clients.jedis.JedisPool

object RedisClient extends Serializable {

val redisHost = "192.168.16.100"

val redisPort = 6379

val redisTimeout = 30000

lazy val pool = new JedisPool(new GenericObjectPoolConfig(), redisHost, redisPort, redisTimeout)

lazy val hook = new Thread {

override def run = {

println("Execute hook thread: " + this)

pool.destroy()

}

sys.addShutdownHook(hook.run)

}

若出錯可能缺少jar包，需要引入common-pool2-2.2.jar 和 jedis-2.6.jar

第二步：資料輸入到kafka中，本列使用sparkstream

①Kafka生產資料

package Traffic

import java.util.Properties

import kafka.producer.{KeyedMessage, Producer, ProducerConfig}

import org.apache.spark.{SparkConf, SparkContext}

import org.codehaus.jettison.json.JSONObject

/**

* Created by Administrator on 2017/10/14.

* 功能：SparkStream作為kafka的生產者，將制定檔案資料打到kafka中

object KafkaEventProducer {

def main(args: Array[String]): Unit = {

//建立topic

val topic="car_event"

val brokers="192.168.17.108:9092"

val props=new Properties()

//把broker put進去

props.put("metadata.broker.list",brokers)

//把kafka編譯器放進去

props.put("serializer.class","kafka.serializer.StringEncoder")

//配置kafka的config(配置)

val kafkaconfig=new ProducerConfig(props)

val producer=new Producer[String,String](kafkaconfig)

//配置spark的config

val conf=new SparkConf().setAppName("KafkaEventProducer").setMaster("local[2]")

val sc=new SparkContext(conf)

//從path中載入資料

// val filePath="data/shuju.txt"

val filePath="c://test//shuju.txt"

//載入資料並進行切分

val records=sc.textFile(filePath)

.filter(!_.startsWith(";"))

.map(_.split(",")).collect()

//對資料進行預處理形成Json形式

for(temp <-records)

{

val event=new JSONObject()

//因為要put很多資料，這樣看起來很規範

event

.put("camer_id",temp(0)) //相機編號

.put("car_id",temp(2)) //車牌號

.put("event_time",temp(4)) //時間

.put("car_speed",temp(6)) //速度

.put("car_speed",temp(13)) //車道編號

//生產event資訊 topic 是往哪個topic中生產資料 event.toString是生產的真正的內容

producer.send(new KeyedMessage[String,String](topic,event.toString))

println("Message Sent: "+event)

Thread.sleep(200) //休息200微秒

}

sc.stop()

}

需要commons-pool2-2.2.jar,jedis-2.6.1.jar和json-lib-2.3-jdk15.jar

②啟動kafka 建立car_event 和 topic

start-kafka.sh

kafka-topics.sh --create --zookeeper hadoop:2181 --topic car_event --partitions 1 --replication-factor 1

Created topic "car_event".

第三小步：啟動car_event的topic的消費者，此步僅僅是為了驗證資料的

Kafka-console-consumer.sh --topic car_event --zookeeper hadoop:2181

第三步：idea中部署kafka打入redis的程式碼，如下所示:

package Traffic

import java.text.SimpleDateFormat

import java.util.Calendar

import kafka.serializer.{StringDecoder, StringEncoder}

import org.apache.spark.streaming.kafka.KafkaUtils

import org.apache.spark.streaming.{Seconds, StreamingContext}

import org.apache.spark.{SparkConf, SparkContext}

import net.sf.json.JSONObject

/**

* Created by Administrator on 2017/10/14.

* 功能：從kafka中獲取資料寫入到redis中

object CarEventAnalysis {

def main(args: Array[String]): Unit = {

//配置SparkStrteaming

val conf=new SparkConf().setAppName("CarEventAnalysis").setMaster("local[2]")

val sc=new SparkContext(conf)

val ssc=new StreamingContext(sc,Seconds(5))

val dbindex=1 //指定是用哪個資料庫進行連線

//從kafka中讀取資料(用直連的方法)

val topics=Set("car_event")

// 只要和brokers相關的都要寫全

val brokers="192.168.17.108:9092"

//配置kafka引數

val kafkaParams=Map[String,String](

"metadata.broker.list"->brokers,

"serializer.class"->"kafka.serializer.StringEncoder"

)

//建立一個流這是一個模板程式碼引數中的兩個String代表的是kafka的鍵值對的資料，及key和value

val kafkaStream=KafkaUtils.createDirectStream[String,String,

StringDecoder,StringDecoder](ssc,kafkaParams,topics)

//從kafka中將資料讀出

val events=kafkaStream.flatMap(line=>{

//轉換為object

val data=JSONObject.fromObject(line._2) // ._2是真正的資料

// println(data)

//必須用Some修飾data option有兩個子類 none 代表無值 some代表有值

// 加上some表示一定有值，後面有x.getString和x.getInt,保證程式能知道有值

Some(data)

})

//從kafka中取出卡口編號和速度資料

val carspeed=events.map(x=>(x.getString("camer_id"),x.getInt("car_speed")))

//把資料變成(camer_id,(car_speed,1))

.mapValues((x:Int)=>(x,1.toInt))

//每隔10秒計算一次前20秒的速度（4個rdd） Tuple2表示兩個引數

// (速度，數量) （速度,數量）

.reduceByKeyAndWindow((a:Tuple2[Int,Int], b:Tuple2[Int,Int]) =>

{(a._1 + b._1,a._2 + b._2)},Seconds(20),Seconds(10))

// carspeed 速度之和數量之和

// carspeed.map{case(key,value)=>(key,value._1/value._2.toFloat)}

carspeed.foreachRDD(rdd=>{

rdd.foreachPartition(partitionofRecords=>{

//得到連線池的一個資源

val jedis=RedisClient.pool.getResource

// camer_id 卡口以及總的速度

partitionofRecords.foreach(pair=>{

val camer_id=pair._1 //卡口

val total_speed=pair._2._1 //總的速度

val count=pair._2._2 //總的數量

val now=Calendar.getInstance().getTime() //獲取當前的時間

val minuteFormat=new SimpleDateFormat("HHmm") //獲取分鐘格式

val dayFormat=new SimpleDateFormat("yyyyMMdd") //獲取天格式

val time = minuteFormat.format(now) //獲取分鐘

val day = dayFormat.format(now) //獲取天

//開始往redis中插入資料

if(count!=0){

jedis.select(dbindex) //用選擇的資料庫

// set進去一個map

jedis.hset(day + "_" + camer_id, time ,total_speed + "_" + count)

// 從redis中取資料

val foreachdata=jedis.hget(day + "_" + camer_id, time)

println(foreachdata)

}

})

RedisClient.pool.returnResource(jedis)

})

println("----------計算開始---------------------------")

ssc.start()

ssc.awaitTermination()

}

第四步： idea中執行第三步部署好的kafka打入redis的程式碼

記得要引入ezmorph-1.0.6.jar, commons-collections-3.2.jar ,

commons-lang-2.3.jar,commons-pool2-2.2.jar, 共四個jar

第五步：執行第二步的往kafka中打資料的程式

第六步：登入到redis的客戶端，驗證資料是否存入redis中

redis-cli -p 12002

Select 資料庫名稱

kafka資料快取到redis的全路徑操作流程

第一步：配置redis客戶端 spark中配置redis客戶端的程式碼參考： import org.apache.commons.pool2.impl.GenericObjectPoolConfig import redis.clients.jedis.JedisPoo

kafka 資料儲存結構+原理+基本操作命令

資料儲存結構： Kafka中的Message是以topic為基本單位組織的，不同的topic之間是相互獨立的。每個topic又可以分成幾個不同的partition(每個topic有幾個partition是在建立topic時指定的)，每個partition儲存一部分Message。 partition是以檔

javaSE File, 獲取目錄下的所有檔案或資料夾的全路徑(遍歷目錄)。 listFiles(), listRoots()

Demo.java：package cn.xxx.demo; import java.io.File; public class Demo { public static void main(String[] args) { function_2(); } pu

Redis(高併發，高可用（叢集），高資料)快取資料的流程

為什麼要用redis：現在我們資料每次都是從資料庫讀取，這樣當網站訪問量達到高峰時段，對資料庫壓力很大，並且影響執行效率。我們需要將這部分廣告資料快取起來。 1.查詢的時候走快取,增刪改的時候同步更新快取 2.查詢的時候:先查redis，根據key去查 1>.如果redis有，直接返

C# 選擇檔案、選擇資料夾、開啟檔案（或者資料夾）路徑中獲取檔案全路徑、目錄、副檔名、檔名稱追加、拷貝、刪除、移動檔案、建立目錄修改檔名、資料夾名！！

https://www.cnblogs.com/zhlziliaoku/p/5241097.html 1、選擇檔案用OpenDialog OpenFileDialog dialog = new OpenFileDialog(); dialog.Multiselect = true;/

資料列表的全選、反選以及批量操作

資料列表的全選、反選以及批量操作 html部分程式碼： 1、全選的checkbox： <input type="checkbox" value="" id="all_columnId"> 2、每條資料前邊的checkbox:<input type="checkbox" name="colu

Redis資料結構以及Strings型操作

Redis資料結構圖： Strings型 <String key,String value>： keys * 　　檢視所有key get 　　獲取key的value值 append 　　向key對應的value追加內容　　

redis中各種資料型別對應的jedis操作命令

一、常用資料型別簡介： redis常用五種資料型別:string,hash,list,set,zset(sorted set). 1.String型別 String是最簡單的型別，一個key對應一個value String型別的資料最大1G。 String

讀取大檔案資料進入redis作為快取:贈(廣播變數)

在專案中使用Redis做快取檔案(目的等同於廣播變數): package com.app import com.utils.{JedisConnectionPool, RptUtils} import org.apache.commons.lang.StringUtils import

SpringBoot之資料快取Cache操作

一、前言快取要解決的問題：一個程式的瓶頸在於資料庫，我們也知道記憶體的速度是大大快於硬碟的速度的。當我們需要重複地獲取相同的資料的時候，我們一次又一次的請求資料庫或者遠端服務，導致大量的時間耗費在資料庫查詢或者遠端方法呼叫上，導致程式效能的惡化，這便是資料快取要解決的問題。

Springboot使用Redis進行資料快取

1.以往都是在後臺直接讀取資料庫，如果操作過快會給資料庫不小的壓力，因此java引入了非關係型資料庫Redis進行資料快取，減輕了資料庫的負擔！使用測試Redis非關係型資料庫，通過查詢關係型資料庫，檢視Redis快取情況首先引入pom.xml中的依賴： //jsa

Android SQLite資料快取操作

import android.content.Context; import android.database.sqlite.SQLiteDatabase; import android.database.sqlite.SQLiteOpenHelper; pu

java 堆棧方法區資料存放操作流程

棧： 1 基礎資料型別 byte short int long float double char boolean 2 方法的形式引數，方法呼叫完後從棧空間回收 3 引用物件的地址，引用完後，棧空間地址立即被回收，堆空間等待GC a) 棧內的資料執行緒之間獨立 b

Memcached,Redis,MongoDB（資料快取系統）方案分析與對比

一、問題每次查詢的資料量極大，需要讓伺服器更加快速地響應使用者的請求。二、解決方案 1. 通過高速伺服器Cache快取資料庫資料 2. 記憶體資料庫三、主流Cache和資料庫對比普通關係資料庫 mysql 記憶體資料庫 redis no

kafka原始碼解析之十六生產者流程(客戶端如何向topic傳送資料)

客戶端向topic傳送資料分為兩種方式：1.非同步，2同步。其配置為producer.type，如果為sync，則是同步傳送；如果為async，則是非同步傳送。客戶端程式碼如下： import kafka.javaapi.producer.Producer; import

Memcache,Redis,MongoDB（資料快取系統）方案對比與分析

應該說Memcached和Redis都能很好的滿足解決我們的問題，它們效能都很高，總的來說，可以把Redis理解為是對Memcached的拓展，是更加重量級的實現，提供了更多更強大的功能。具體來說： 1.效能上：效能上都很出色，具體到細節，由於Redis只使用單核，而Memcached可以使

Ajax非同步載入資料及Redis快取

針對網頁分類條目的動態載入，圖為頁面的Head部分。 //categoryListServlet準備分類資料 ProductService service = new ProductService(); List<Category> ca

簡單Storm消費Kafka資料並存儲到redis例項（訂單資訊處理）

maven依賴 <dependencies> <dependency> <groupId>org.apache.storm</groupId> <artifactId&g

快取操作流程邏輯

以載入圖文資料的listview：要儲存的資料：json資料+圖片資料（bitmap） 1、判斷快取中是否存在該快取json資料 // 判斷快取中是否有資料 JSONArray categorydata = (JSONArr

C/C++獲取資料夾下所有檔案的名字及全路徑

在實際中，會遇到需要通過程式獲取當前路徑下所有檔案的名稱，以下函式可以實現獲取所給路徑下檔名及檔案對應的全路徑；需要包含文章末尾的兩個標頭檔案#include <vector> #include"dirent.h" #include"unistd.h" usi

kafka資料快取到redis的全路徑操作流程

相關推薦