日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 运维知识 > windows >内容正文

windows

分布式文件系统—HDFS—入门简介

發布時間:2024/4/15 windows 47 豆豆
生活随笔 收集整理的這篇文章主要介紹了 分布式文件系统—HDFS—入门简介 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

原文作者:Zh_Y_G

原文地址:HDFS入門簡介

目錄

HDFS是什么?

設計目標:

安裝配置

HDFS讀寫流程圖解

CheckPoint


HDFS是什么?

  • 易于擴展的分布式文件系統
  • 運行在大量普通廉價機器上提供容錯機制
  • 為大量用戶提供性能不錯的存取服務
  • 設計目標:

  • 自動快速檢測應對硬件錯誤
  • 流式訪問數據,以流的方式訪問數據,設計用于數據的批量處理
  • 缺點:不適合存儲大量小文件;不適合低延遲的數據訪問;不支持多用戶寫入及任意修改文件
  • 移動計算不移動數據(大數據基本原則,空間換時間)
  • 簡單一致性模型
  • 異構平臺可移植性
  • 安裝配置

    hdfs://(協議頭)host(主機名):port(端口號)/

    查看${HADOOP_HOME}/bin和${HADOOP_HOME}/sbin

    #學會help(很多地方都可以查看幫助文檔) hdfs dfsadmin -help

    HDFS的基本組件

  • namenode:管理整個文件系統的元數據,負責管理元數據、維護目錄結構、響應客戶端請求
  • datanode:復制管理用戶的文件數據塊,負責管理用戶提交的數據 心跳機制 塊報告
  • secondarynamenode:namenode的助理,幫助加載元數據,緊急情況下(例如namenode宕機),可以幫助恢復數據
  • HDFS讀寫流程圖解

    1. 寫數據流程

    ?

    節點服務器傳輸數據方式:網絡傳輸,以package包的形式(第8步,上傳數據的時候會把package先放到緩存隊列,如果此時package出錯的話,會默認重傳 4次)
    這里的話,追加一些問題(分布式系統之間可能故障,而且網絡的不可靠性都是設計人員需要考慮的問題):socket(長連接),http(短連接),還有其他的方式,比如管道、FIFO、消息隊列

    1)為什么使用長鏈接?

    最簡單分布式系統是一直存在的,很少是短時間的訪問,維持心跳機制

    2)什么是心跳機制?

    namenode啟動的時候,會有一個加載元數據(數據的數據,類似于表的索引)和塊報告(datanode會定時(可以再配置文件中設置,所以一定要時間同步)對塊信息進行統計)的過程,namenode通過心跳機制維護整個集群的可用性。如果塊報告上傳失敗,namenode不會更新元數據,在塊報告的時候就會將其刪除掉。

    3)安全模式

    什么時候進入安全模式?剛剛啟動(namenode加載元數據的時候(先加載元數據鏡像到內存中,在將edits日志的操作在內存中執行一遍,namenode進入安全模式,進行塊報告,閾值安全的話30秒退出安全模式))閾值低于0.999f(默認)datanode存活數量小于0

    4)怎么解除安全模式?

  • 格式化集群(需要刪除namenode.dir的配置路徑)基本不會采用這種方式
  • 強制離開安全模式:hdfs dfsadmin -safemode leave
  • # 檢測集群文件、節點、塊是否出現問題hdfs fsck /
  • #刪除損壞塊的block:hdfs fsck / -delete
  • 調低閾值(在配置文件 safemode)
  • 2. 讀數據流程

    ?

    磁盤故障

    多個副本策略

    namenode故障宕機

    簡單方案:secondarynamenode取出fsimage文件copy到namenode的元數據存儲目錄下

    完美解決:在namenode上掛多塊磁盤,配置fs.namenode.name.dir(用,分割磁盤 )

    CheckPoint

    觸發條件:

  • 事務達到1000000條(默認)
  • 1小時(默認)
  • <property><name>dfs.namenode.checkpoint.dir</name><value>/hadoop/data/name</value> </property> <!--日志文件edits的檢測目錄--> <property><name>dfs.namenode.checkpoint.edits.dir</name><value>/hadoop/data/edits</value> </property> <!--時間一小時--> <property><name>dfs.namenode.checkpoint.period</name><value>3600</value> </property> <!--事物達到1000000--> <property><name>dfs.namenode.checkpoint.txns</name><value>1000000</value> </property>


    注:namenode存儲元數據,secondarynamenode執行checkpoint的時候去namenode下載edits和fsimage
    注意的問題客戶端和服務器端解釋

  • 客戶端的配置文件決定副本數量,而不是服務器
  • 文件存儲以塊的形式存儲在服務器上(客戶端決定文件切分,塊大小)
  • 超強干貨來襲 云風專訪:近40年碼齡,通宵達旦的技術人生

    總結

    以上是生活随笔為你收集整理的分布式文件系统—HDFS—入门简介的全部內容,希望文章能夠幫你解決所遇到的問題。

    如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。