Flink on Zeppelin 流计算处理最佳实践
簡介: 歡迎釘釘掃描文章底部二維碼進入 EMR Studio 用戶交流群 直接和講師交流討論~ 點擊以下鏈接直接觀看直播回放:https://developer.aliyun.com/live/247106
開源大數(shù)據(jù)社區(qū) & 阿里云 EMR 系列直播 第十二期
主題:Flink on Zeppelin 流計算處理最佳實踐
講師:簡鋒,阿里云 EMR 數(shù)據(jù)開發(fā)平臺 負責(zé)人
內(nèi)容框架:
- 大數(shù)據(jù)概覽
- Flink 學(xué)習(xí)框架
- EMR Studio 上的流計算最佳實踐
- 演示
直播回放:掃描文章底部二維碼加入釘群觀看回放,或進入鏈接https://developer.aliyun.com/live/247106
一、大數(shù)據(jù)概覽
- 大數(shù)據(jù)處理 ETL (Data ?→ Data)
- 大數(shù)據(jù)分析 BI ? (Data ?→ ?Dashboard)
- 機器學(xué)習(xí) ? ?AI ? (Data ?→ ?Model)
二、Flink 學(xué)習(xí)框架
Flink 要點
- Stateful
- Time
- Flink Architecture
- Flink API
- Flink Configuration
- Flink Log
Stateful:
- Why
?? 流計算的及時性
?? 流計算的 unbounded
- When
?? Window
?? Join
?? Pattern
- How
?? statebackend
Time
- Event time
- Processing time
- Watermark
Flink Architecture
Flink API
Flink Configuration
- Cluster Configuration
- Job Configuration
- Statebackend
- Resource Manager
- SQL/Python
參考文檔:https://ci.apache.org/projects/flink/flink-docs-release-1.13/docs/deployment/config/
Flink Log
三、EMR Studio 上的流計算最佳實踐
EMR Studio 特性:
- 兼容開源組件
EMR Studio 在開源軟件 Apache Zeppelin,Jupyter Notebook, Apache Airflow 的基礎(chǔ)上優(yōu)化了做了優(yōu)化和增強。
- 支持連接多個集群
- 適配多個計算引擎
- 交互式開發(fā) + 作業(yè)調(diào)度無縫銜接
- 適用多種大數(shù)據(jù)應(yīng)用場景
- 計算存儲分離
Flink Clients
Flink on Zeppelin (Phase 1) - Interactive Flink Client
Flink on Zeppelin (Phase 2) - Interactive JobManager
Flinkon Zeppelin 主要 Feature
四、演示
具體產(chǎn)品介紹和演示,可以點擊以下鏈接直接觀看回放:
https://developer.aliyun.com/live/247106
原文鏈接
本文為阿里云原創(chuàng)內(nèi)容,未經(jīng)允許不得轉(zhuǎn)載。
總結(jié)
以上是生活随笔為你收集整理的Flink on Zeppelin 流计算处理最佳实践的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 浅谈 Linux 高负载的系统化分析
- 下一篇: “不服跑个分?” 是噱头还是实力?