1. 程式人生 > >精通Apache Flink必讀系列文章

精通Apache Flink必讀系列文章

Flink是最接近於谷歌Dataflow大資料分析平臺的設計的開源分散式計算引擎,其核心設計理念與Spark有很大的不同。

從設計出發點,Flink是一個流計算處理計算引擎,把批處理視為無限流計算的一種特例,Spark是批處理計算引擎,把流處理視為迷你批處理,因為設計上的差異,導致在對處理時延要求高的場景中,Flink更加合適。

從生態上來說,二者都有SQL、機器學習、圖計算等基本的元件,但是Spark在豐富程度、成熟度方面比Flink有優勢。

關於Flink的資料已經相當多了,筆者就不做畫蛇添足寫了,要掌握Flink的精妙,必須要了解其底層的基本原理,以下是必讀的資料:

理解Flink的設計原則
Google Stream 101越了批處理的流處理世界

Google Stream 102超越了批處理的流處理世界

Flink原理和實現
Flink的架構和拓撲概覽

理解 Flink 中的計算資源

Flink如何生成ExecutionGraph及物理執行圖

Flink 生成StreamGraph

Flink Window的實現原理

Flink中的狀態管理

Flink中的反壓Back-Pressure

Flink Operator Chain原理

Flink記憶體管理

Flink非同步快照機制-Failover

資料流的型別和操作

Flink SQL
Flink SQL的大部分程式碼實現是阿里巴巴的Blink團隊貢獻給Apache的。

Flink SQL 核心功能解密

Flink SQL維表Join和非同步優化

Flink SQL 非同步IO設計

Flink SQL資料去重的技巧和思考

Flink SQL TOP N的挑戰與實現

Flink SQL 流計算“撤回(Retraction)”案例分析

Flink SQL 解決熱點問題的大殺器MiniBatch

Flink Table API&SQL的概念和通用API

Flink CEP複雜事件處理
Flink-CEP論文與原始碼解讀之狀態與狀態轉換

Flink之CEP-API簡介

Flink之CEP案例分析-網路攻擊檢測

Flink-CEP之NFA

Flink-CEP之NFA編譯器

Flink-CEP之模式流與運算子

Flink事務
Flink Streaming Ledger 支援流式處理ACID事務!

Flink原始碼解析
Apache Flink原始碼解析 DataStream API

Flink Exactly Once語義
flink的兩階段提交協議-實現端到端的Exactly Once語義

Flink案例
Flink在唯品會的實踐

Flink在美團的實踐應用

Flink在G7的實踐

Flink在餓了麼的應用

基於Flink的實時特徵平臺在Flink的應用

未完待續!
--------------------- 
作者:列國周遊 
來源:CSDN 
原文:https://blog.csdn.net/ffjl1985/article/details/81775019 
版權宣告:本文為博主原創文章,轉載請附上博文連結!