日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 运维知识 > windows >内容正文

windows

Hadoop分布式文件系统HDFS的工作原理详述

發布時間:2025/3/17 windows 21 豆豆
生活随笔 收集整理的這篇文章主要介紹了 Hadoop分布式文件系统HDFS的工作原理详述 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

Hadoop分布式文件系統(HDFS)是一種被設計成適合運行在通用硬件上的分布式文件系統。HDFS是一個高度容錯性的系統,適合部署在廉價的機器上。它能提供高吞吐量的數據訪問,非常適合大規模數據集上的應用。要理解HDFS的內部工作原理,首先要理解什么是分布式文件系統。

1.分布式文件系統?
多臺計算機聯網協同工作(有時也稱為一個集群)就像單臺系統一樣解決某種問題,這樣的系統我們稱之為分布式系統。?
分布式文件系統是分布式系統的一個子集,它們解決的問題就是數據存儲。換句話說,它們是橫跨在多臺計算機上的存儲系統。存儲在分布式文件系統上的數據自動分布在不同的節點上。?
分布式文件系統在大數據時代有著廣泛的應用前景,它們為存儲和處理來自網絡和其它地方的超大規模數據提供所需的擴展能力。

2.分離元數據和數據:NameNode和DataNode?
存儲到文件系統中的每個文件都有相關聯的元數據。元數據包括了文件名、i節點(inode)數、數據塊位置等,而數據則是文件的實際內容。?
在傳統的文件系統里,因為文件系統不會跨越多臺機器,元數據和數據存儲在同一臺機器上。?
為了構建一個分布式文件系統,讓客戶端在這種系統中使用簡單,并且不需要知道其他客戶端的活動,那么元數據需要在客戶端以外維護。HDFS的設計理念是拿出一臺或多臺機器來保存元數據,并讓剩下的機器來保存文件的內容。?
NameNode和DataNode是HDFS的兩個主要組件。其中,元數據存儲在NameNode上,而數據存儲在DataNode的集群上。NameNode不僅要管理存儲在HDFS上內容的元數據,而且要記錄一些事情,比如哪些節點是集群的一部分,某個文件有幾份副本等。它還要決定當集群的節點宕機或者數據副本丟失的時候系統需要做什么。?
存儲在HDFS上的每份數據片有多份副本(replica)保存在不同的服務器上。在本質上,NameNode是HDFS的Master(主服務器),DataNode是Slave(從服務器)。

3.HDFS寫過程?
NameNode負責管理存儲在HDFS上所有文件的元數據,它會確認客戶端的請求,并記錄下文件的名字和存儲這個文件的DataNode集合。它把該信息存儲在內存中的文件分配表里。?
例如,客戶端發送一個請求給NameNode,說它要將“zhou.log”文件寫入到HDFS。那么,其執行流程如圖1所示。具體為:?
第一步:客戶端發消息給NameNode,說要將“zhou.log”文件寫入。(如圖1中的①)?
第二步:NameNode發消息給客戶端,叫客戶端寫到DataNode A、B和D,并直接聯系DataNode B。(如圖1中的②)?
第三步:客戶端發消息給DataNode B,叫它保存一份“zhou.log”文件,并且發送一份副本給DataNode A和DataNode D。(如圖1中的③)?
第四步:DataNode B發消息給DataNode A,叫它保存一份“zhou.log”文件,并且發送一份副本給DataNode D。(如圖1中的④)?
第五步:DataNode A發消息給DataNode D,叫它保存一份“zhou.log”文件。(如圖1中的⑤)?
第六步:DataNode D發確認消息給DataNode A。(如圖1中的⑤)?
第七步:DataNode A發確認消息給DataNode B。(如圖1中的④)?
第八步:DataNode B發確認消息給客戶端,表示寫入完成。(如圖1中的⑥)?
?
圖1 HDFS寫過程示意圖?
在分布式文件系統的設計中,挑戰之一是如何確保數據的一致性。對于HDFS來說,直到所有要保存數據的DataNodes確認它們都有文件的副本時,數據才被認為寫入完成。因此,數據一致性是在寫的階段完成的。一個客戶端無論選擇從哪個DataNode讀取,都將得到相同的數據。

4.HDFS讀過程?
為了理解讀的過程,可以認為一個文件是由存儲在DataNode上的數據塊組成的。客戶端查看之前寫入的內容的執行流程如圖2所示,具體步驟為:?
第一步:客戶端詢問NameNode它應該從哪里讀取文件。(如圖2中的①)?
第二步:NameNode發送數據塊的信息給客戶端。(數據塊信息包含了保存著文件副本的DataNode的IP地址,以及DataNode在本地硬盤查找數據塊所需要的數據塊ID。) (如圖2中的②)?
第三步:客戶端檢查數據塊信息,聯系相關的DataNode,請求數據塊。(如圖2中的③)?
第四步:DataNode返回文件內容給客戶端,然后關閉連接,完成讀操作。(如圖2中的④)?
?
圖2 HDFS讀過程示意圖?
客戶端并行從不同的DataNode中獲取一個文件的數據塊,然后聯結這些數據塊,拼成完整的文件。

5.通過副本快速恢復硬件故障?
當一切運行正常時,DataNode會周期性發送心跳信息給NameNode(默認是每3秒鐘一次)。如果NameNode在預定的時間內沒有收到心跳信息(默認是10分鐘),它會認為DataNode出問題了,把它從集群中移除,并且啟動一個進程去恢復數據。DataNode可能因為多種原因脫離集群,如硬件故障、主板故障、電源老化和網絡故障等。?
對于HDFS來說,丟失一個DataNode意味著丟失了存儲在它的硬盤上的數據塊的副本。假如在任意時間總有超過一個副本存在(默認3個),故障將不會導致數據丟失。當一個硬盤故障時,HDFS會檢測到存儲在該硬盤的數據塊的副本數量低于要求,然后主動創建需要的副本,以達到滿副本數狀態。

6.跨多個DataNode切分文件?
在HDFS里,文件被切分成數據塊,通常每個數據塊64MB~128MB,然后每個數據塊被寫入文件系統。同一個文件的不同數據塊不一定保存在相同的DataNode上。這樣做的好處是,當對這些文件執行運算時,能夠通過并行方式讀取和處理文件的不同部分。?
當客戶端準備寫文件到HDFS并詢問NameNode應該把文件寫到哪里時,NameNode會告訴客戶端,那些可以寫入數據塊的DataNode。寫完一批數據塊后,客戶端會回到NameNode獲取新的DataNode列表,把下一批數據塊寫到新列表中的DataNode上。


轉載于:https://blog.51cto.com/zhan2015/1709972

總結

以上是生活随笔為你收集整理的Hadoop分布式文件系统HDFS的工作原理详述的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 丰满双乳秘书被老板狂揉捏 | 亚洲av人人夜夜澡人人 | 久久久天堂 | 色www情| 欧美精品色视频 | 欧美一级片免费看 | 日本久久片 | 热99视频 | 日韩欧洲亚洲 | 绯色av一区二区三区高清 | 亚洲精品乱码久久久久久9色 | 国产人与禽zoz0性伦 | 天堂av2018 | 91 高清 在线 制服 偷拍 | 精品美女在线观看 | 欧美精品自拍偷拍 | 午夜视频大全 | 亚洲一区二区三区网站 | juliaann欧美二区三区 | 天天插天天干天天操 | 五月激情六月 | 国产毛片久久久久久国产毛片 | 天天干天天舔天天操 | 天堂在线视频网站 | 后入内射欧美99二区视频 | 在线看黄色片 | 美女a视频 | 日韩精品无码一区二区三区 | 亚洲激情视频在线播放 | 在线你懂的| 欧美精品在线观看一区二区 | 日本黄网站 | 特黄大片又粗又大又暴 | 俄罗斯色片 | 葵司av电影 | 日日干夜夜草 | 久草视频首页 | 毛片aa| 狠狠干2020| 9l视频自拍蝌蚪9l视频成人 | 日韩性网站 | 欧美极品在线播放 | 成人自拍在线 | 爱情岛论坛自拍亚洲品质极速最新章 | 亚洲色大成网站www www.97ai.com | 久久久精品欧美 | 亚洲色图视频在线观看 | 婷色| 国产精品三级在线观看无码 | 日本在线视频不卡 | 给我看高清的视频在线观看 | 四虎最新网址在线观看 | 国产高潮在线观看 | 久久久久久久蜜桃 | 黄色小说在线看 | 亚洲制服另类 | 久久不射电影网 | 国产盗摄一区二区三区在线 | 红桃一区二区三区 | 手机在线看片日韩 | 亚洲色成人一区二区三区小说 | 高清国产在线观看 | 成人软件在线观看 | av中文网站 | 蜜桃视频在线播放 | 男女做那个的全过程 | 一区二区伦理 | 色婷婷丁香| 欧美调教视频 | 国产精品91在线观看 | 男人视频网 | 一区二区三区在线播放 | 国产高清av | 男女羞羞在线观看 | 九九精品视频在线观看 | 麻豆免费视频网站 | 一区二区在线视频 | 欧美日韩在线视频一区二区 | 免费成人看视频 | 性感美女视频一二三 | 色综合视频在线观看 | 亚洲丝袜天堂 | 国产欧美日韩综合精品一区 | heyzo久久| 欧美整片在线观看 | 国产无遮挡又黄又爽在线观看 | 男女无遮挡做爰猛烈视频 | 日本电影大尺度免费观看 | 国产视频精选 | 国产伦精品一区二区三区视频我 | 一级黄色片免费观看 | 久国产视频 | 国产青草视频在线观看 | 国产欧美日本在线 | 亚洲精品久久久久久动漫器材一区 | 日韩av高清在线观看 | 日韩a级黄色片 | 91偷拍视频 | 精品自拍av|