日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

HDFS优缺点

發布時間:2023/12/2 编程问答 51 豆豆
生活随笔 收集整理的這篇文章主要介紹了 HDFS优缺点 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

HDFS架構簡述

一、HDFS簡介

HDFS(Hadoop distributed File System):Hadoop分布式文件系統。是基于流數據模式訪問和處理超大文件的需要而開發的,可以運行于廉價的服務器上。它所具有的高容錯,高可靠性,高可擴展性,高獲得性,高吞吐率等特征為海量數據提供了不怕故障的存儲,為超大數據集的應用帶來了很多便利。簡單來說就是把一個超大號文件按一定大小分割并放置在多臺服務器上,這樣多臺服務器同時工作,效率超高,而且安全性也會提高。

二、HDFS組成結構以及各部分作用

HDFS主要由四個部分組成,分別為Client,nameNode、DataNode、以及Secondary NameNode組成。
2.1Client(客戶端)

  • 文件切分:文件上傳HDFS的時候,client根據需求將文件切分成一個一個的小數據塊(block),然后進行存儲。
  • 每個小數據塊(block)在其他服務器上都有副本,client會與namenode進行通信,獲取文件及其副本位置,為以后做打算。
  • 與DataNode進行通信,讀取或寫入數據。
  • client可以管理HDFS,比如啟動或關閉。

2.2nameNode(管理者)
nameNode在HDFS是管理者的作用,類似于現實世界中的國王地位,客戶端和secondary nameNode都是與他進行通信,然后由他發號施令來操作DataNode。主要作用有:

  • 管理HDFS的名稱空間
  • 管理數據塊(block)映射信息
  • 配置副本策略
  • 處理客戶端請求

2.3DataNode(執行者)
DataNode在文檔中的角色是slave,翻譯過來就是奴隸的意思(所以大家知道他的地位了吧),主要就是存儲數據塊和讀寫數據塊用的:

  • 存儲實際的數據塊(block)
  • 執行數據塊的讀寫操作

2.4secondary nameNode
他是nameNode的死忠,幫助nameNode完成一些工作,并且在nameNode要掛的時候給他續命,主要作用如下:

  • 定期合并nameNode中的fsimage(映像文件)和fsedits(日志),并推送給nameNode,避免nameNode中的fsedits過大。
  • 在緊急情況下,可輔助恢復nameNode。

三、副本放置策略

第一個副本:放置在上傳文件的DN;如果是集群外提交,則隨機挑選一臺磁盤不太滿,CPU不太忙的節點。
第二個副本:放置在于第一個副本不同的 機架的節點上。

-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

以上轉載自?https://blog.csdn.net/a15732111571/article/details/89570865

------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

優點:

數據冗余,硬件容錯

適合存儲大文件

處理流式數據

可構建在廉價機器上

缺點:

不能低延遲的數據訪問

不適合存儲小文件(原因及解決方法:存儲每份數據文件對應一個元數據,多份文件需要存儲多份元數據,耗費進程,解決方法:Hadoop Archive 將小文件打包成xxx.har,對于hadoop只有一份元數據,每個文件的名字由har自管理)

轉載于:https://www.cnblogs.com/xin-qing3/p/11258374.html

總結

以上是生活随笔為你收集整理的HDFS优缺点的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。