精通Apache Flink必讀系列文章
Flink是最接近於谷歌Dataflow大資料分析平臺的設計的開源分散式計算引擎,其核心設計理念與Spark有很大的不同。
從設計出發點,Flink是一個流計算處理計算引擎,把批處理視為無限流計算的一種特例,Spark是批處理計算引擎,把流處理視為迷你批處理,因為設計上的差異,導致在對處理時延要求高的場景中,Flink更加合適。
從生態上來說,二者都有SQL、機器學習、圖計算等基本的元件,但是Spark在豐富程度、成熟度方面比Flink有優勢。
關於Flink的資料已經相當多了,筆者就不做畫蛇添足寫了,要掌握Flink的精妙,必須要了解其底層的基本原理,以下是必讀的資料:
理解Flink的設計原則
Google Stream 101越了批處理的流處理世界
Google Stream 102超越了批處理的流處理世界
Flink原理和實現
Flink的架構和拓撲概覽
理解 Flink 中的計算資源
Flink如何生成ExecutionGraph及物理執行圖
Flink 生成StreamGraph
Flink Window的實現原理
Flink中的狀態管理
Flink中的反壓Back-Pressure
Flink Operator Chain原理
Flink記憶體管理
Flink非同步快照機制-Failover
資料流的型別和操作
Flink SQL
Flink SQL的大部分程式碼實現是阿里巴巴的Blink團隊貢獻給Apache的。
Flink SQL 核心功能解密
Flink SQL維表Join和非同步優化
Flink SQL 非同步IO設計
Flink SQL資料去重的技巧和思考
Flink SQL TOP N的挑戰與實現
Flink SQL 流計算“撤回(Retraction)”案例分析
Flink SQL 解決熱點問題的大殺器MiniBatch
Flink Table API&SQL的概念和通用API
Flink CEP複雜事件處理
Flink-CEP論文與原始碼解讀之狀態與狀態轉換
Flink之CEP-API簡介
Flink之CEP案例分析-網路攻擊檢測
Flink-CEP之NFA
Flink-CEP之NFA編譯器
Flink-CEP之模式流與運算子
Flink事務
Flink Streaming Ledger 支援流式處理ACID事務!
Flink原始碼解析
Apache Flink原始碼解析 DataStream API
Flink Exactly Once語義
flink的兩階段提交協議-實現端到端的Exactly Once語義
Flink案例
Flink在唯品會的實踐
Flink在美團的實踐應用
Flink在G7的實踐
Flink在餓了麼的應用
基於Flink的實時特徵平臺在Flink的應用
未完待續!
---------------------
作者:列國周遊
來源:CSDN
原文:https://blog.csdn.net/ffjl1985/article/details/81775019
版權宣告:本文為博主原創文章,轉載請附上博文連結!