日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

spark和MR比较

發布時間:2024/8/22 编程问答 32 如意码农
生活随笔 收集整理的這篇文章主要介紹了 spark和MR比较 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

MapReduce: 分布式的計算框架
缺點:執行速度慢
IO瓶頸 ==> 磁盤IO 網絡IO
shuffle機制:數據需要輸出到磁盤,而且每次shuffle都需要進行排序操作
框架的機制:
只有Map和Reduce兩個算子,對于比較復雜的任務,需要構建多個job來執行
當存在job依賴的時候,job之間的數據需要落盤(輸出到HDFS上)

Spark:基于內存的分布式計算框架==>是一個執行引擎
用RDD進行各種運算,有多種算子(具體可以參考源碼)
起源于加州大學伯克利分校的AMPLib實驗室
官網:http://spark.apache.org/
官方博客:https://databricks.com/blog

運行環境:

MR運行在YARN上,

spark

local:本地運行
standalone:使用Spark自帶的資源管理框架,運行spark的應用
yarn:將spark應用類似mr一樣,提交到yarn上運行
mesos:類似yarn的一種資源管理框架

總結

以上是生活随笔為你收集整理的spark和MR比较的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。