2021年大数据Flink(十七):Flink四大基石
目錄
Flink四大基石
Checkpoint
State
Time
Window
Flink四大基石
Flink之所以能這么流行,離不開它最重要的四個基石:Checkpoint、State、Time、Window。
?
Checkpoint
這是Flink最重要的一個特性。
Flink基于Chandy-Lamport算法實現了一個分布式的一致性的快照,從而提供了一致性的語義。
Chandy-Lamport算法實際上在1985年的時候已經被提出來,但并沒有被很廣泛的應用,而Flink則把這個算法發揚光大了。
Spark最近在實現Continue streaming,Continue streaming的目的是為了降低處理的延時,其也需要提供這種一致性的語義,最終也采用了Chandy-Lamport這個算法,說明Chandy-Lamport算法在業界得到了一定的肯定。
https://zhuanlan.zhihu.com/p/53482103
State
提供了一致性的語義之后,Flink為了讓用戶在編程時能夠更輕松、更容易地去管理狀態,還提供了一套非常簡單明了的State API,包括ValueState、ListState、MapState,BroadcastState。
Time
除此之外,Flink還實現了Watermark的機制,能夠支持基于事件的時間的處理,能夠容忍遲到/亂序的數據。
Window
另外流計算中一般在對流數據進行操作之前都會先進行開窗,即基于一個什么樣的窗口上做這個計算。Flink提供了開箱即用的各種窗口,比如滑動窗口、滾動窗口、會話窗口以及非常靈活的自定義的窗口。
總結
以上是生活随笔為你收集整理的2021年大数据Flink(十七):Flink四大基石的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 2021年大数据Flink(十六):流批
- 下一篇: 2021年大数据Flink(十八):Fl