Spark Streaming：快取與持久化機制

阿新 • • 發佈：2019-01-07

快取與持久化機制 與RDD類似，Spark Streaming也可以讓開發人員手動控制，將資料流中的資料持久化到記憶體中。對DStream呼叫persist()方法，就可以讓Spark Streaming自動將該資料流中的所有產生的RDD，都持久化到記憶體中。如果要對一個DStream多次執行操作，那麼，對DStream持久化是非常有用的。因為多次操作，可以共享使用記憶體中的一份快取資料。對於基於視窗的操作，比如reduceByWindow、reduceByKeyAndWindow，以及基於狀態的操作，比如updateStateByKey，預設就隱式開啟了持久化機制。即Spark Streaming預設就會將上述操作產生的Dstream中的資料，快取到記憶體中，不需要開發人員手動呼叫persist()方法。對於通過網路接收資料的輸入流，比如socket、Kafka、Flume等，預設的持久化級別，是將資料複製一份，以便於容錯。相當於是，用的是類似MEMORY_ONLY_SER_2

。 與RDD不同的是，預設的持久化級別，統一都是要序列化的。

Spark Streaming：快取與持久化機制

Spark Streaming：快取與持久化機制

Spark Streaming核心概念與編程

Spark學習（拾）- Spark Streaming進階與案例實戰

Spark學習（玖）- Spark Streaming核心概念與程式設計

Spark Streaming ：基本工作原理

spark的反壓與推測機制

Spark Streaming：大規模流式資料處理

Spark學習——Spark Streaming：大規模流式資料處理

Spring框架：Spring與持久化

2.Spark Streaming：基本工作原理

Redis系列(三)：Redis的持久化機制(RDB、AOF)

Spark修煉之道（進階篇）——Spark入門到精通：第十四節 Spark Streaming 快取、Checkpoint機制

SODBASE CEP學習進階篇（七）續：SODBASE CEP與Spark streaming整合-低延遲規則管理與分散式快取整合

Kafka：ZK+Kafka+Spark Streaming集群環境搭建（二）VMW安裝四臺CentOS，並實現本機與它們能交互，虛擬機內部實現可以上網。

Spark Streaming筆記整理（三）：DS的transformation與output操作

kafka（六）：與spark streaming對接，spark streaming接收kafka資料來源

Spark-Streaming獲取kafka資料的兩種方式：Receiver與Direct的方

Spark修煉之道（進階篇）——Spark入門到精通：第十六節 Spark Streaming與Kafka

Spark修煉之道（進階篇）——Spark入門到精通：第十三節 Spark Streaming—— Spark SQL、DataFrame與Spark Streaming

Spark Streaming（二十七）DStream的轉換、輸出、快取持久化、檢查點

Spark Streaming：快取與持久化機制

相關推薦