日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

4、2 核心组件

發布時間:2023/12/18 编程问答 37 豆豆
生活随笔 收集整理的這篇文章主要介紹了 4、2 核心组件 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

?

1、Stage:虛的
  一組RDD構成的鏈條并行的task集合,同一Stage的所有任務有著相同的Shuffle依賴。階段的劃分按照shuffle標記來進行的。一個階段含多個RDD,先有RDD后有Stage一個階段含多個taskstage通過ShuffleDependency劃分,一個stage都是NarrowDependency階段類型有兩種,ShuffleMapStage和ResultStage。
- ShuffleMapStage
     中間環節該階段任務的結果是下一個階段任務的輸入。需要跟蹤每個分區所在的節點。任務執行期間的中間過程,保存task的輸出數據供下一個reduce進行fetch。該階段可以單獨提交。
- ResultStage結果階段直接執行rdd的action操作。對一些分區應用計算函數(不一定需要在所有分區進行計算,比如說first(),take(3))。2、Task:運行在一個節點上,實的 一個task包含一個RDD整個的變換的過程從最后一個RDD的每個分區往前找他的依賴,就是它的任務;最后一個RDD的分區數就是該階段的task數是spark執行單位,有兩種類型。- ShuffelMapTask在ShuffleMapStage由多個ShuffleMapTask組成。- ResultTaskResultStage由多個ResultTask組成,結果任務直接task后,將結果回傳給driver。3、job一個action就是一個job4、Application一個應用可含多個job。

?5、SparkContext

spark上下文是spark程序的主入口點,表示到spark集群的連接。可以創建RDD、累加器和廣播變量。 每個jvm只能有個active的上下文,如果要創建新的上下文,必須stop掉原來的。

?

轉載于:https://www.cnblogs.com/lybpy/p/9769913.html

總結

以上是生活随笔為你收集整理的4、2 核心组件的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。