日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

hadoop2.x学习01

發布時間:2024/3/13 编程问答 47 豆豆
生活随笔 收集整理的這篇文章主要介紹了 hadoop2.x学习01 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

hadoop2.x學習01

最新的發行版本已經是2.7了,我圍繞2.5展開學習。

hadoop2.x是在hadoop0.23之后發行的正式版2.2。
本身是來自于lucene和nutch,在ggl的論文MR、GFS、BigTable組合下生成了hadoop,對海量數據進行分析處理。

相比于hadoop1.x,2.x版本新增加了一個資源調度模塊yarn,正是2.x版本的最強之處。2.x版本分為4個模塊,hadoop common公共模塊即1.x的hadoop core核心模塊、hadoop hdfs存儲模塊、hadoop yarn調度模塊、hadoop MR數據處理模塊。

hadoop hdfs是一個高性能分布式存儲系統。大數據量文件按塊劃分存儲到機柜機架集群中。分布式系統具有高度的內聚性和透明性。hdfs系統中分為name node和datanodes兩種節點。namenode存儲文件的元數據如文件名,文件目錄結構,文件屬性(生成時間,文件權限),以及文件的塊列表和塊所在datanode。datanode是集群中的任一計算機,其功能為在本地文件系統存儲文件的塊數據以及塊數據的校驗和。通常集群中存在secondary namenode用來監控HDSF狀態的輔助后臺程序,每隔一段時間獲取HDFS元數據的快照,作為災難備份,在主namenode發生問題時繼續管理datanode。

hadoop yarn是一個資源調度管理系統。yarn分為resource manager和node manager兩種節點??蛻舳瞬僮髡埱筮M入resourcemanager,在RM中生成applicationmaster數據appms。
appms中包含數據的元信息,以及為請求所分配的資源使用方案。
RM將APPMS的信息分配到Nodemanager中,NM處理RM發來的信息,以及APPMS中的信息,分配任務,生成container來執行任務。

總結

以上是生活随笔為你收集整理的hadoop2.x学习01的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。