2021年大数据HBase(三):HBase数据模型!!!【建议收藏】
全網最詳細的大數據HBase文章系列,強烈建議收藏加關注!
新文章都已經列出歷史文章目錄,幫助大家回顧前面的知識重點。
目錄
系列歷史文章
前言
Hbase數據模型
術語:
系列歷史文章
2021年大數據HBase(十七):HBase的360度全面調優
2021年大數據HBase(十六):HBase的協處理器(Coprocessor)
2021年大數據HBase(十五):HBase的Bulk Load批量加載操作
2021年大數據HBase(十四):HBase的原理及其相關的工作機制
2021年大數據HBase(十三):HBase讀取和存儲數據的流程
2021年大數據HBase(十二):Apache Phoenix 二級索引
2021年大數據HBase(十一):Apache Phoenix的視圖操作
2021年大數據HBase(十):Apache Phoenix的基本入門操作
2021年大數據HBase(九):Apache Phoenix的安裝
2021年大數據HBase(八):Apache Phoenix的基本介紹
2021年大數據HBase(七):Hbase的架構!【建議收藏】
2021年大數據HBase(六):HBase的高可用!【建議收藏】
2021年大數據HBase(五):HBase的相關操作-JavaAPI方式!【建議收藏】
2021年大數據HBase(四):HBase的相關操作-客戶端命令式!【建議收藏】
2021年大數據HBase(三):HBase數據模型
2021年大數據HBase(二):HBase集群安裝操作
2021年大數據HBase(一):HBase基本簡介
前言
?2021大數據領域優質創作博客,帶你從入門到精通,該博客每天更新,逐漸完善大數據各個知識體系的文章,幫助大家更高效學習。
有對大數據感興趣的可以關注微信公眾號:三幫大數據
HBase數據模型
在HBASE中,數據存儲在具有行和列的表中。這是看起來關系數據庫(RDBMS)一樣,但將HBASE表看成是多個維 度的Map結構更容易理解術語:
- 表(Table) : HBase中數據都是以表形式來組織的, HBase中的表由多個行組成
- 行鍵(row key):
- HBase中的行有一個rowkey(行鍵)和 一個或者多個列組成, 列的值與rowkey、列相關聯
- 行在存儲是按行鍵的字典序排序
- 行鍵的設計非常重要, 盡量讓相關的行存儲在一起
- 列(Column): HBase中的列有列族(column family) 和列限定符(列名)(Column Qualifier)組成
- 表示如下 : 列族名:列限定符 例如: C1:USER_ID C1:SEX
- 列族(Column Family):
- 出于性能原因, 列族將一組列及其值組織在一起
- 每個列族都有一組存儲屬性: 例如 是否應該換成在內存中, 數據如何被壓縮等
- 表中的每一行都有相同的列族, 但在列族中不存儲任何內容
- 所有的列族的數據全部都存儲在一塊(文件系統HDFS)
- Hbase官方建議所有的列族保持一樣的列, 并且將同一類的列放在一個列族中
- 列標識符(Column Qualifier)
- 列族中包含一個個的列限定符, 這樣可以為存儲的數據提供索引
- 列族在創建表的時候是固定的, 但列限定符是不做限制的
- 不同的列可能會存在不同的列標識符
- 單元格(Cell): 單元格是行、列族和列限定符的組合,包含一個值和一個時間戳, 數據以二進制存儲
- 版本號(verson num): 每條數據都會有版本號的概念
- 每條數據都可以有多個版本號, 默認值為系統時間戳, 類型為Long
- 時間戳(timeStamp): 每個數據都會有時間戳的概念
- 在向Hbase插入更新數據的時候, HBase默認會將當前操作的時間記錄下來, 當然也可以人為指定時間
- 不同版本的數據按照時間倒序排序, 即最新的數據排在最前面
- 📢博客主頁:https://lansonli.blog.csdn.net
- 📢歡迎點贊 👍 收藏 ?留言 📝 如有錯誤敬請指正!
- 📢本文由 Lansonli 原創,首發于 CSDN博客🙉
- 📢大數據系列文章會每天更新,停下休息的時候不要忘了別人還在奔跑,希望大家抓緊時間學習,全力奔赴更美好的生活?
總結
以上是生活随笔為你收集整理的2021年大数据HBase(三):HBase数据模型!!!【建议收藏】的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 2021年大数据HBase(二):HBa
- 下一篇: 2021年大数据HBase(四):HBa