日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

Mapreduce基本工作流程

發布時間:2025/3/16 编程问答 25 豆豆
生活随笔 收集整理的這篇文章主要介紹了 Mapreduce基本工作流程 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
MapReduce分布式計算框架
基本流程:
1,大數據經split劃分成大小相等的數據塊(數據塊的大小一般等于HDFS一個塊的大小)以及用戶作業程序。
2,系統中有一個負責調度的Master節點和許多的Map工作節點,Reduce工作節點
3,用戶作業程序提交給Master節點,Master節點尋找合適的Map節點,并將數據傳給Map節點,并且Master也尋找合適的Reduce節點并將數據傳給Reduce節點
4,Master節點啟動Map節點執行程序,Map節點盡可能的讀取本地或本機架上的數據塊進行計算。(數據本地化是Mapreduce的核心特征)
5,每個Map節點處理讀取的數據塊,并做一些數據整理,并且將中間結果放在本地而非HDFS中,同時通知Master節點Map工作完成,并告知中間結果的存儲位置。
6,Master節點等所有Map工作完成后,開始啟動Reduce節點,Reduce節點通過Master節點掌握的中間結果的存儲位置來遠程讀取中間結果。
7,Reduce節點將中間結果處理后將結果輸出到一個文件中。
從用戶作業程序角度來看:
一個作業執行過程中有一個Jobtracker和多個Tasktracker,分別對應于HDFS中的namenode和datanode。Jobclient在用戶端把已配置參數打包成jar文件存儲在HDFS,并把存儲路徑提交給Jobtracker,然后Jobtracker創建每一個Task,并且分發到Tasktracker服務中去執行。



































































總結

以上是生活随笔為你收集整理的Mapreduce基本工作流程的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。