Flink實時計算-- Checkpoint和Savepoint 區別與理解

阿新 • • 發佈：2022-03-30

1. 什麼是Savepoint和Checkpoint

Savepoint 是一項可讓我們為整個流應用程式生成”某個時間”點快照的能力。快照包含有關您輸入源的位置資訊，以及資料來源讀取到的偏移量資訊以及整個應用程式狀態資訊。

我們可以使用 Chandy-Lamport 演算法的變體在不停止應用程式的情況下獲得全部狀態的一致性快照。

儲存點包含兩個主要元素：

首先，Savepoint 包括一個包含（通常是很大的）二進位制檔案的目錄，該二進位制檔案表示在 Savepoint和Checkpoint 生成映象時流應用程式的整個狀態


一個（相對較小的）元資料檔案，包含指向所有檔案的指標（路徑），這些檔案是儲存點的一部分，並存儲在所選的分散式檔案系統或資料儲存中。

Checkpoint 是 Apache Flink 用於故障恢復的內部機制，包括應用程式狀態快照以及輸入源讀取到的偏移量。

如果程式發生故障，Flink 會通過從 Checkpoint 載入應用程式狀態並從恢復的讀取偏移量繼續讀取來恢復應用程式，就像什麼也沒發生一樣。

2.Flink Savepoints和Checkpoints的3個不同點

2.1 目標

從概念上講，Flink 的 Savepoint 和 Checkpoint 的不同之處很像傳統資料庫中備份與恢復日誌之間的區別。Checkpoint 的主要目標是充當 Flink 中的恢復機制，以確保能從潛在的故障中恢復。相反，Savepoint 的主要目標是充當手動備份之後重啟、恢復暫停作業的方法。

2.2 實現

Checkpoint 和 Savepoint 在實現上也有不同。Checkpoint 的設計輕量並快速。它們可能（但不一定必須）充分利用底層狀態後端的不同功能儘可能快速地恢復資料。基於 RocksDB 的狀態後端可以使用 RocksDB 的內部格式，而不是 Flink 的原生格式進行增量 Checkpoint。加速了 RocksDB 的 Checkpoint 過程，從而使它們成為更輕量級的檢查點機制的一個例項。相反，Savepoint 的設計重點是資料的可移植性，並支援對作業做任何更改，這些更改會使資料的生產和恢復成本更高。

2.3 生命週期

Checkpoint 是自動和定期的。它們由 Flink 自動，定期地建立和刪除，不需與使用者進行互動，以確保在作業意外失敗的情況下可以恢復。相反，Savepoint 是由使用者手動建立和管理的（即，排程、建立、刪除）。

3. 何時使用 Savepoint ?

儘管流處理應用程式處理的是連續產生的資料（”運動中”的資料），但在某些情況下，應用程式可能需要重新處理以前處理過的資料。Apache Flink 中的 Savepoint 允許您在以下情況下執行此操作：

部署新版本的流應用程式，包括上線新功能，修復Bug或更好的機器學習模型。
為應用程式引入 A/B 測試，使用相同的源資料流測試程式的不同版本，從相同的時間點開始測試而不用犧牲先前的狀態。
在需要更多資源的情況下重新對應用程式擴容。
將流應用程式遷移到 Flink 的新版本上，或遷移到另一個叢集。

參考：

Flink Savepoints和Checkpoints的3個不同點

Flink實時計算-- Checkpoint和Savepoint 區別與理解

1. 什麼是Savepoint和Checkpoint Savepoint 是一項可讓我們為整個流應用程式生成”某個時間”點快照的能力。快照包含有關您輸入源的位置資訊，以及資料來源讀取到的偏移量資訊以及整個應用程式狀態資訊。

Flink實時計算-Checkpoint和Savepoin

來源：https://zhuanlan.zhihu.com/p/79526638 前言為了保證程式的容錯恢復以及程式啟動時其狀態恢復，幾乎所有公司的實時任務都會開啟 Checkpoint 或者觸發 Savepoint 進行狀態儲存。為了使得使用者更加理解這兩點

Flink實時計算-深入理解 Checkpoint和Savepoint

前言為了保證程式的容錯恢復以及程式啟動時其狀態恢復，幾乎所有公司的實時任務都會開啟 Checkpoint 或者觸發 Savepoint 進行狀態儲存。為了使得使用者更加理解這兩點區別，本文結合 Flink 1.9 版本，重點講述 Fli

詳談MySQL和MariaDB區別與效能全面對比

MariaDB資料庫介紹 MariaDB資料庫管理系統是MySQL的一個分支，主要由開源社群在維護，採用GPL授權許可。開發這個分支的原因之一是：甲骨文公司收購了MySQL後，有將MySQL閉源的潛在風險，因此社群採用分支的方式來避

js中!和!!的區別與用法

js中!的用法是比較靈活的，它除了做邏輯運算常常會用！做型別判斷，可以用！與上物件來求得一個布林值，

vue watch 和 computed 區別與使用

目錄computed 和 watch 的說明與區別computed 計算屬性說明:watch 監聽屬性說明：watch 和 computed 的區別是：使用參考官方文件computed 使用watch 使用與解釋

Flink開發-Flink的計算模型和介面

Flink的計算模型和介面開發模型開發步驟：資料輸入資料轉換資料輸出 1.資料輸入- DataSource

Flink實時計算pv、uv的幾種方法

本文首發於：Java大資料與資料倉庫，Flink實時計算pv、uv的幾種方法實時統計pv、uv是再常見不過的大資料統計需求了，前面出過一篇SparkStreaming實時統計pv,uv的案例，這裡用Flink實時計算pv,uv。

like %和-的區別與使用

萬用字元的分類:　　%百分號萬用字元:表示任何字元出現任意次數(可以是0次).

ROS中spin()和spinOnce()區別與詳解

一.函式意義首先要知道，spin()和spinOnce()叫ROS訊息回撥處理函式。它倆通常會出現在ROS的主迴圈中，程式需要不斷呼叫ros::spin()或 ros::spinOnce()，兩者區別在於前者呼叫後不會再返回，也就是你的主程式到這兒

jmeter中TPS和吞吐量區別與聯絡

定義吞吐量：吞吐量是指單位時間內系統能夠完成的工作量，它衡量的是軟體系統伺服器的處理能力，就是在一秒中統計所完成的工作量。

flink實時計算叢集安裝部署

1.官網下載flink安裝包 # wget https://archive.apache.org/dist/flink/flink-1.13.1/flink-1.13.1-bin-scala_2.11.tgz

CSS3中transition和animation區別的理解

CSS3屬性中關於製作動畫的三個屬性：Transform,Transition,Animation。 1、transform：描述了元素的靜態樣式，本身不會呈現動畫效果，可以對元素進行旋轉rotate、扭曲skew、縮放scale和移動translate以及矩陣變形

Collection和Collections區別的理解

技術標籤：javajava 1.Collection: 是集合類的上層介面。本身是一個Interface，裡面包含了一些集合的基本操作。

袋鼠雲：基於Flink構建實時計算平臺的總體架構和關鍵技術點

數棧是雲原生—站式資料中臺PaaS，我們在github和gitee上有一個有趣的開源專案：FlinkX，FlinkX是一個基於Flink的批流統一的資料同步工具，既可以採集靜態的資料，也可以採集實時變化的資料，是全域、異構、批流一體

python3中的eval和exec的區別與聯絡

看了很多網上的方法，寫入檔案後開啟檔案看確實不再是亂碼，但是從檔案中讀入json時發現了亂碼，可能是讀檔案預設的編碼格式不對。下面讀寫方法可行。

轉發和重定向的區別與聯絡

轉發和重定向的區別與聯絡一. 區別 1. 區別一 1.1 request.getRequestDispatcher().forward()方法,只能將請求轉發給同一個WEB應用中的元件；

詳解Mybatis中的 ${} 和 #{}區別與用法

Mybatis 的Mapper.xml語句中parameterType向SQL語句傳參有兩種方式：#{}和${} 我們經常使用的是#{},一般解說是因為這種方式可以防止SQL注入，簡單的說#{}這種方式SQL語句是經過預編譯的，它是把#{}中間的引數轉義成字

MySQL的檢視和索引用法與區別詳解

MySQL的檢視簡單來說MySQL的檢視就是對SELECT 命令的定義的一個快捷鍵，我們查詢時會用到非常複雜的SELECT語句，而這個語句我們以後還會經常用到，我們可以經這個語句生產檢視。檢視是一個虛擬的表，它不儲存資料，

淺談SpringMVC的攔截器（Interceptor）和Servlet 的過濾器（Filter）的區別與聯絡及SpringMVC 的配置檔案

1.過濾器: 　　依賴於servlet容器。在實現上基於函式回撥，可以對幾乎所有請求進行過濾，但是缺點是一個過濾器例項只能在容器初始化時呼叫一次。使用過濾器的目的是用來做一些過濾操作，獲取我們想要獲取的資料.

Flink實時計算-- Checkpoint和Savepoint 區別與理解

1. 什麼是Savepoint和Checkpoint

2.Flink Savepoints和Checkpoints的3個不同點

2.1 目標

2.2 實現

2.3 生命週期

3. 何時使用 Savepoint ?

相關推薦