日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

两款高性能并行计算引擎Storm和Spark比较

發布時間:2025/4/5 编程问答 43 豆豆
生活随笔 收集整理的這篇文章主要介紹了 两款高性能并行计算引擎Storm和Spark比较 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

2019獨角獸企業重金招聘Python工程師標準>>>

Spark基于這樣的理念,當數據龐大時,把計算過程傳遞給數據要比把數據傳遞給計算過程要更富效率。每個節點存儲(或緩存)它的數據集,然后任務被提交給節點。

所以這是把過程傳遞給數據。這和Hadoop?map/reduce非常相似,除了積極使用內存來避免I/O操作,以使得迭代算法(前一步計算輸出是下一步計算的輸入)性能更高。

Shark只是一個基于Spark的查詢引擎(支持ad-hoc臨時性的分析查詢)

而Storm的架構和Spark截然相反。Storm是一個分布式流計算引擎。每個節點實現一個基本的計算過程,而數據項在互相連接的網絡節點中流進流出。和Spark相反,這個是把數據傳遞給過程。

兩個框架都用于處理大量數據的并行計算。

Storm在動態處理大量生成的“小數據塊”上要更好(比如在Twitter數據流上實時計算一些匯聚功能或分析)。

Spark工作于現有的數據全集(如Hadoop數據)已經被導入Spark集群,Spark基于in-memory管理可以進行快訊掃描,并最小化迭代算法的全局I/O操作。

不過Spark流模塊(Streaming?Module)倒是和Storm相類似(都是流計算引擎),盡管并非完全一樣。

Spark流模塊先匯聚批量數據然后進行數據塊分發(視作不可變數據進行處理),而Storm是只要接收到數據就實時處理并分發。

不確定哪種方式在數據吞吐量上要具優勢,不過Storm計算時間延遲要小。

總結下,SparkStorm設計相反,而Spark?Steaming才和Storm類似,前者有數據平滑窗口(sliding?window),而后者需要自己去維護這個窗口。

轉載于:https://my.oschina.net/u/2338362/blog/508017

總結

以上是生活随笔為你收集整理的两款高性能并行计算引擎Storm和Spark比较的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。