HBase数据模型:rowkey timestamp 列族 cell
-
rowkey:唯一標(biāo)識(shí)一行記錄
-
timestamp:時(shí)間戳,版本的概念,必須要給出時(shí)間戳,默認(rèn)當(dāng)前系統(tǒng)時(shí)間
-
列族:一組列的集合
-
HBase能存儲(chǔ)10億級(jí)別的行和百萬(wàn)級(jí)別的列
-
列族是最小的控制單元,不能控制列,所有列都具備相同的公共屬性,沒(méi)法改變某個(gè)列的屬性
-
cell中可以存儲(chǔ)多條記錄,根據(jù)版本號(hào)來(lái)區(qū)分,是追加不是覆蓋
-
默認(rèn)只保留一個(gè)版本
-
刪除數(shù)據(jù)并非立即刪除,只是給個(gè)失效標(biāo)記,在文件合并的時(shí)候刪除
-
rowkey + cf + colume + timestamp 四項(xiàng)結(jié)合才能唯一確定cell數(shù)據(jù)
-
列族理論上有無(wú)限個(gè)列,沒(méi)有限制 列可以動(dòng)態(tài)加入
-
調(diào)優(yōu)、權(quán)限控制都是針對(duì)cf列族
-
hbase會(huì)將同一列族中的數(shù)據(jù)保存在同一目錄下
-
一個(gè)表對(duì)應(yīng)hdfs上的一個(gè)目錄
-
每個(gè)cf對(duì)應(yīng)一個(gè)文件,多個(gè)列族對(duì)應(yīng)多個(gè)文件
總結(jié)
以上是生活随笔為你收集整理的HBase数据模型:rowkey timestamp 列族 cell的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: idea设置java scala等代码自
- 下一篇: HBase原理