日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 >

Spark Streaming 执行流程

發布時間:2025/5/22 35 豆豆
生活随笔 收集整理的這篇文章主要介紹了 Spark Streaming 执行流程 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

?

Spark Streaming 是基于spark的流式批處理引擎,其基本原理是把輸入數據以某一時間間隔批量的處理,當批處理間隔縮短到秒級時,便可以用于處理實時數據流。

本節描述了Spark Streaming作業的執行流程。

圖1 Spark Streaming作業的執行流程

具體流程:

  • 客戶端提交作業后啟動Driver,Driver是park作業的Master。
  • 每個作業包含多個Executor,每個Executor以線程的方式運行task,Spark Streaming至少包含一個receiver task。
  • Receiver接收數據后生成Block,并把BlockId匯報給Driver,然后備份到另外一個Executor上。
  • ReceiverTracker維護Reciver匯報的BlockId。
  • Driver定時啟動JobGenerator,根據Dstream的關系生成邏輯RDD,然后創建Jobset,交給JobScheduler。
  • JobScheduler負責調度Jobset,交給DAGScheduler,DAGScheduler根據邏輯RDD,生成相應的Stages,每個stage包含一到多個task。
  • TaskScheduler負責把task調度到Executor上,并維護task的運行狀態。
  • 當tasks,stages,jobset完成后,單個batch才算完成。
  • http://www.cnblogs.com/shenh062326/p/3946341.html

    總結

    以上是生活随笔為你收集整理的Spark Streaming 执行流程的全部內容,希望文章能夠幫你解決所遇到的問題。

    如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。