日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 >

HBase数据存取流程

發(fā)布時間:2024/10/12 71 豆豆
生活随笔 收集整理的這篇文章主要介紹了 HBase数据存取流程 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.
一、HBase的特點是什么 1.HBase一個分布式的基于列式存儲或者行式存儲的數(shù)據(jù)庫,基于hadoop的hdfs存儲,zookeeper進行管理。 2.HBase適合存儲半結(jié)構(gòu)化或非結(jié)構(gòu)化數(shù)據(jù),對于數(shù)據(jù)結(jié)構(gòu)字段不夠確定或者雜亂無章很難按一個概念去抽取的數(shù)據(jù)。 3.HBase為null的記錄不會被存儲. 4.數(shù)據(jù)存儲模式為key,value模式:(Table,Rowkey,Column,Timestamp)-> value? 5.HBase是主從架構(gòu)。Hmaster作為主節(jié)點,Hregionserver作為從節(jié)點。 二、HBase存數(shù)據(jù)流程

?

流程:Client請求Zookeeper確定meta表所在的RegionServer所在的地址,接著根據(jù)Rowkey找到數(shù)據(jù)所歸屬的RegionServer;用戶提交put或delete請求時HbaseClient會將put或delete請求添加到本地buffer中,符合一定條件 會通過異步批量提交服務(wù)器處理。 接著數(shù)據(jù)到達(dá)Region后,服務(wù)端處理流程如下:

?

流程:RegionServer去獲取RowLock,region更新共享鎖;接著Hbase會先寫寫日志W(wǎng)AL(數(shù)據(jù)可靠性)再寫緩存MemStore(閾值默認(rèn)64M,每個列族對應(yīng)一個Store下的MemStore);然后釋放鎖后將日志落到HDFS;若MemStore達(dá)到閾值則將緩存數(shù)據(jù)落磁盤StoreFile,最后多個StoreFile發(fā)生合并;若StoreFile很大會觸發(fā)split操作,將當(dāng)前region分割成2個Region,并同步到Hmaster。 三、HBase取數(shù)據(jù)流程 HbaseClient的操作和存數(shù)據(jù)類似

服務(wù)器操作流程:

?

RegionServer收到get請求后,對當(dāng)前Region進行Scan,接著會根據(jù)列族對Store進行Scan,同時會對對應(yīng)的MemStore進行Scan;最后找到我們要的數(shù)據(jù)返回給Client。注意:一個StoreScanner會對應(yīng)多個StoreFileScanner,整個過程是一個層級關(guān)系。


四、HBase存取優(yōu)化 檢索優(yōu)化(BloomFilter):應(yīng)用BloomFilter來提高隨機讀的性能,BloomFilter是列族級別的配置 五、HBase API使用

?

轉(zhuǎn)載于:https://www.cnblogs.com/nicoleljc/p/9976555.html

與50位技術(shù)專家面對面20年技術(shù)見證,附贈技術(shù)全景圖

總結(jié)

以上是生活随笔為你收集整理的HBase数据存取流程的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。