日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

hbase简介(大数据技术)

發(fā)布時(shí)間:2023/12/10 编程问答 33 豆豆
生活随笔 收集整理的這篇文章主要介紹了 hbase简介(大数据技术) 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

HBase是什么?
HBase是建立在Hadoop文件系統(tǒng)之上的分布式面向列的數(shù)據(jù)庫。它是一個開源項(xiàng)目,是橫向擴(kuò)展的。
HBase是一個數(shù)據(jù)模型,類似于谷歌的大表設(shè)計(jì),可以提供快速隨機(jī)訪問海量結(jié)構(gòu)化數(shù)據(jù)。它利用了Hadoop的文件系統(tǒng)(HDFS)提供的容錯能力。
它是Hadoop的生態(tài)系統(tǒng),提供對數(shù)據(jù)的隨機(jī)實(shí)時(shí)讀/寫訪問,是Hadoop文件系統(tǒng)的一部分。
人們可以直接或通過HBase的存儲HDFS數(shù)據(jù)。使用HBase在HDFS讀取消費(fèi)/隨機(jī)訪問數(shù)據(jù)。 HBase在Hadoop的文件系統(tǒng)之上,并提供了讀寫訪問。

HBase 和 HDFS
HDFS HBase
HDFS是適于存儲大容量文件的分布式文件系統(tǒng)。 HBase是建立在HDFS之上的數(shù)據(jù)庫。
HDFS不支持快速單獨(dú)記錄查找。 HBase提供在較大的表快速查找
它提供了高延遲批量處理;沒有批處理概念。 它提供了數(shù)十億條記錄低延遲訪問單個行記錄(隨機(jī)存取)。
它提供的數(shù)據(jù)只能順序訪問。 HBase內(nèi)部使用哈希表和提供隨機(jī)接入,并且其存儲索引,可將在HDFS文件中的數(shù)據(jù)進(jìn)行快速查找。
HBase的存儲機(jī)制
HBase是一個面向列的數(shù)據(jù)庫,在表中它由行排序。表模式定義只能列族,也就是鍵值對。一個表有多個列族以及每一個列族可以有任意數(shù)量的列。后續(xù)列的值連續(xù)地存儲在磁盤上。表中的每個單元格值都具有時(shí)間戳。總之,在一個HBase:
? 表是行的集合。
? 行是列族的集合。
? 列族是列的集合。
? 列是鍵值對的集合。
下面給出的表中是HBase模式的一個例子。
Rowide Column Family Column Family Column Family Column Family
col1 col2 col3 col1 col2 col3 col1 col2 col3 col1 col2 col3
1
2
3
面向列和面向行
面向列的數(shù)據(jù)庫是存儲數(shù)據(jù)表作為數(shù)據(jù)列的部分,而不是作為行數(shù)據(jù)。總之它們擁有列族。
行式數(shù)據(jù)庫 列式數(shù)據(jù)庫
它適用于聯(lián)機(jī)事務(wù)處理(OLTP)。 它適用于在線分析處理(OLAP)。
這樣的數(shù)據(jù)庫被設(shè)計(jì)為小數(shù)目的行和列。 面向列的數(shù)據(jù)庫設(shè)計(jì)的巨大表。
下圖顯示了列族在面向列的數(shù)據(jù)庫:

HBase 和 RDBMS
HBase RDBMS
HBase無模式,它不具有固定列模式的概念;僅定義列族。 RDBMS有它的模式,描述表的整體結(jié)構(gòu)的約束。
它專門創(chuàng)建為寬表。 HBase是橫向擴(kuò)展。 這些都是細(xì)而專為小表。很難形成規(guī)模。
沒有任何事務(wù)存在于HBase。 RDBMS是事務(wù)性的。
它反規(guī)范化的數(shù)據(jù)。 它具有規(guī)范化的數(shù)據(jù)。
它用于半結(jié)構(gòu)以及結(jié)構(gòu)化數(shù)據(jù)是非常好的。 用于結(jié)構(gòu)化數(shù)據(jù)非常好。
HBase的特點(diǎn)
? HBase線性可擴(kuò)展。
? 它具有自動故障支持。
? 它提供了一致的讀取和寫入。
? 它集成了Hadoop,作為源和目的地。
? 客戶端方便的Java API。
? 它提供了跨集群數(shù)據(jù)復(fù)制。
在哪里可以使用HBase?
? Apache HBase曾經(jīng)是隨機(jī),實(shí)時(shí)的讀/寫訪問大數(shù)據(jù)。
? 它承載在集群普通硬件的頂端是非常大的表。
? Apache HBase是此前谷歌Bigtable模擬非關(guān)系型數(shù)據(jù)庫。 Bigtable對谷歌文件系統(tǒng)操作,同樣類似Apache HBase工作在Hadoop HDFS的頂部。
HBase的應(yīng)用
? 它是用來當(dāng)有需要寫重的應(yīng)用程序。
? HBase使用于當(dāng)我們需要提供快速隨機(jī)訪問的數(shù)據(jù)。
? 很多公司,如Facebook,Twitter,雅虎,和Adobe內(nèi)部都在使用HBase。
這只是簡單的一部分,需要了解更多請繼續(xù)學(xué)習(xí)

總結(jié)

以上是生活随笔為你收集整理的hbase简介(大数据技术)的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。