Flink---基本介紹
阿新 • • 發佈:2019-01-06
Flink介紹
Flink是Apache開源的一款流式計算框架,具有高吞吐、低延時、容錯性好(能保障Exactly Once語義),以及能同時支援流處理和批處理的特點;
Flink not only provides real-time streaming with high throughput and exactly-once guarantees, but it’s also an engine for batch data processing.
Flink技術棧
- 部署方式:Flink支援部署在主流的資源管理框架上,比如Hadoop YARN, Apache Mesos, and Kubernetes等,同時也支援單機部署;
核心要素
- Checkpoint:Exactly-Once語義實現的關鍵;
- State:如果當前事件的處理結果與之前事件有關,則稱為有狀態處理;相反,如果當前事件的處理結果只與事件本身相關,則為無狀態的;
- Window:流計算的基本單元,window將無限的流分隔成有限大小的bucket進行處理;
- Time:定義事件的順序;
參考: