當(dāng)前位置:
首頁 >
HBase数据存取流程
發(fā)布時間:2024/10/12
71
豆豆
生活随笔
收集整理的這篇文章主要介紹了
HBase数据存取流程
小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.
一、HBase的特點是什么 1.HBase一個分布式的基于列式存儲或者行式存儲的數(shù)據(jù)庫,基于hadoop的hdfs存儲,zookeeper進行管理。 2.HBase適合存儲半結(jié)構(gòu)化或非結(jié)構(gòu)化數(shù)據(jù),對于數(shù)據(jù)結(jié)構(gòu)字段不夠確定或者雜亂無章很難按一個概念去抽取的數(shù)據(jù)。 3.HBase為null的記錄不會被存儲. 4.數(shù)據(jù)存儲模式為key,value模式:(Table,Rowkey,Column,Timestamp)-> value? 5.HBase是主從架構(gòu)。Hmaster作為主節(jié)點,Hregionserver作為從節(jié)點。 二、HBase存數(shù)據(jù)流程
四、HBase存取優(yōu)化 檢索優(yōu)化(BloomFilter):應(yīng)用BloomFilter來提高隨機讀的性能,BloomFilter是列族級別的配置 五、HBase API使用
?
流程:Client請求Zookeeper確定meta表所在的RegionServer所在的地址,接著根據(jù)Rowkey找到數(shù)據(jù)所歸屬的RegionServer;用戶提交put或delete請求時HbaseClient會將put或delete請求添加到本地buffer中,符合一定條件 會通過異步批量提交服務(wù)器處理。 接著數(shù)據(jù)到達(dá)Region后,服務(wù)端處理流程如下:?
流程:RegionServer去獲取RowLock,region更新共享鎖;接著Hbase會先寫寫日志W(wǎng)AL(數(shù)據(jù)可靠性)再寫緩存MemStore(閾值默認(rèn)64M,每個列族對應(yīng)一個Store下的MemStore);然后釋放鎖后將日志落到HDFS;若MemStore達(dá)到閾值則將緩存數(shù)據(jù)落磁盤StoreFile,最后多個StoreFile發(fā)生合并;若StoreFile很大會觸發(fā)split操作,將當(dāng)前region分割成2個Region,并同步到Hmaster。 三、HBase取數(shù)據(jù)流程 HbaseClient的操作和存數(shù)據(jù)類似服務(wù)器操作流程:
?
RegionServer收到get請求后,對當(dāng)前Region進行Scan,接著會根據(jù)列族對Store進行Scan,同時會對對應(yīng)的MemStore進行Scan;最后找到我們要的數(shù)據(jù)返回給Client。注意:一個StoreScanner會對應(yīng)多個StoreFileScanner,整個過程是一個層級關(guān)系。
四、HBase存取優(yōu)化 檢索優(yōu)化(BloomFilter):應(yīng)用BloomFilter來提高隨機讀的性能,BloomFilter是列族級別的配置 五、HBase API使用
?
轉(zhuǎn)載于:https://www.cnblogs.com/nicoleljc/p/9976555.html
與50位技術(shù)專家面對面20年技術(shù)見證,附贈技術(shù)全景圖總結(jié)
以上是生活随笔為你收集整理的HBase数据存取流程的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 淘宝保价险怎么申请
- 下一篇: AES加密算法的详细简介