當前位置：首頁 >

spark2

發(fā)布時間：2025/3/15 25 豆豆

生活随笔收集整理的這篇文章主要介紹了 spark2 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

特點

通用批處理迭代式計算交互查詢流處理

組件

spark core:任務調度內存管理容錯機制內部定義了RDDs? 提供了很多API ，為其他組件提供底層的服務

spark sql：報表統(tǒng)計

streaming :從kafka接收數(shù)據(jù)做實時統(tǒng)計

mlib：mll 支持橫向擴展，機器學習

graphx:處理圖圖計算如社交網(wǎng)絡圖

cluster managers:集群管理

緊密集成優(yōu)點

節(jié)省組件組合時的部署測試時間

與hadoop比較

時效性高（基于內存）機器學習等領域

RDD

分布式數(shù)據(jù)集。不可變、可分區(qū)、可并行計算

允許用戶在執(zhí)行多個查詢時顯式將工作集緩存在內存中

后續(xù)查詢能重用工作集

RDD屬性

分片partition

轉載于:https://www.cnblogs.com/NeverGiveUp0/p/11112659.html

總結

以上是生活随笔為你收集整理的spark2的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內容還不錯，歡迎將生活随笔推薦給好友。