日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

MapReduce 计算框架如何运作

發布時間:2024/7/5 编程问答 33 豆豆
生活随笔 收集整理的這篇文章主要介紹了 MapReduce 计算框架如何运作 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

learn from 從0開始學大數據(極客時間)

1. MapReduce 作業啟動和運行機制


作業涉及三類關鍵進程:

  • 大數據應用進程
    這類進程是啟動 MapReduce 程序的主入口,主要是指定 Map 和 Reduce 類、輸入輸出文件路徑等,并提交作業給 Hadoop 集群(JobTracker 進程)

  • JobTracker 進程
    這類進程根據輸入數據量,命令下面提到的 TaskTracker 進程啟動相應數量的 Map 和 Reduce 進程任務,并管理整個作業生命周期的任務調度和監控
    JobTracker 進程在整個 Hadoop 集群全局唯一

  • TaskTracker 進程
    負責啟動和管理 Map 進程、 Reduce 進程
    因為每個數據塊都有對應的 map 函數,TaskTracker 進程通常和 HDFS 的 DataNode 進程啟動在同一個服務器

JobTracker 進程和 TaskTracker 進程是主從關系

  • 主服務器負責 分配服務器資源、作業執行的調度
  • 從服務器完成具體的計算操作

2. MapReduce 數據合并與連接機制


分布式計算需要將不同服務器上的相關數據合并到一起進行下一步計算,這就是 shuffle

總結

以上是生活随笔為你收集整理的MapReduce 计算框架如何运作的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。