當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

《HBase权威指南》读书笔记：第一章简介

發布時間：2023/12/10 编程问答 55 豆豆

生活随笔收集整理的這篇文章主要介紹了《HBase权威指南》读书笔记：第一章简介小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

傳統的關系型數據庫無法存放海量數據，因此HBase誕生，解決海量數據存取難題。當然除了HBase，還有很多其他類型的數據庫解決不同的問題。HBase的誕生參考了谷歌的這兩篇論文，值得閱讀：

The Google File System
MapReduce: Simplified Data Processing on Large Clusters

HBase應用邏輯的基本概念有：

表：表有表名，其含有多個row
row：由row key和多個column組成。行級別的數據是原子性的。
column：儲存任意二進制數據。column可以達到上百萬個。數據可以有多個版本，每個版本的數據存在cell中。版本可以設置刪除策略，支持數量、過期時間策略。
column family：由多個column組成。column family只能有幾十個。

HBase支持的操作有：對數據的CRUD、scan、CAS、計數器、coprocessor，還有建表、刪表、增加列族、修改列族、刪除列族。

CURD：用row key去增刪改查
scan：指定row key的范圍，批量取數據
CAS：為確保一致性而提供的操作，check and set，確認版本沒變過的情況下寫入數據
計數器：支持原子性的計數器操作
coprocessor：協處理器，客戶端提交代碼在服務端運行，更快的處理數據

HBase運維層面的基本概念有：

master節點：負責協調region在各個節點中的分布，并將信息儲存在zookeeper中，一個集群內可以起多個master節點，但同一時間只能有一個master掌握實權，其余都是替補。
region server：負責處理針對region的請求。一個region server內可以包含多個region。通常10~1000個region性能最優。客戶端直接與region server相連，請求直接發給它。
region：最小負載單元，每個region包含表名、首行key、末行key。也就是說每個region負責一張表的一部分內容。如果region中數據量過多，則會進行自動拆分，分成兩個region，然后遷移到別的節點。
HFile：包含多個塊，每個塊中儲存某個column數據的一部分。文件末尾是塊的索引。服務啟動時將塊索引加載到內存中。HFile儲存在HDFS中。

架構參考了LSM樹（log-structured sort-and-merge-map）。在HBase中，寫入的數據先寫到write-ahead log，然后放在內存memstore中，等到內存占用達到閾值，做flush，將memstore中的內容寫到HDFS成為HFile。當HFile數量較多時，做compation操作，將小文件合并成大文件。這種架構也被ElasticSearch、Cassandra、InfluxDB采用。

總結

以上是生活随笔為你收集整理的《HBase权威指南》读书笔记：第一章简介的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇： java8 supplier 接口
下一篇： java学习手册下载_java学习手册

日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

编程问答

《HBase权威指南》读书笔记：第一章 简介

總結

《HBase权威指南》读书笔记：第一章简介