kudu NoSQL数据库详解
一、Hbase、Kudu和ClickHouse對比
Hadoop生態(tài)圈中HDFS一直用來保存底層數(shù)據(jù)。Hbase作為一款Nosql也是Hadoop生態(tài)圈的核心組件,它海量的存儲能力,優(yōu)秀的隨機(jī)讀寫能力,能夠處理一些HDFS不足的地方。
Clickhouse是一個用于聯(lián)機(jī)分析(OLAP)的列式數(shù)據(jù)庫管理系統(tǒng)(DBMS)。能夠使用SQL查詢實時生成分析數(shù)據(jù)報告。它同樣擁有優(yōu)秀的數(shù)據(jù)存儲能力。
Apache Kudu是Cloudera Manager公司16年發(fā)布的新型分布式存儲系統(tǒng),結(jié)合CDH和Impala使用可以同時解決隨機(jī)讀寫和sql化數(shù)據(jù)分析的問題。分別彌補(bǔ)HDFS靜態(tài)存儲和Hbase Nosql的不足。
接著說一下Hbase與Kudu,可以說是Kudu師承Hbase,架構(gòu)是類似的master-slave結(jié)構(gòu)。
Hbase的物理模型是master和regionserver,regionserver存儲的是region,region里邊很有很多store,一個store對應(yīng)一個列簇,一個store中有一個memstore和多個storefile,store的底層是hfile,hfile是hadoop的二進(jìn)制文件,其中HFile和HLog是Hbase兩大文件存儲格式,HFile用于存儲數(shù)據(jù),HLog保證可以寫入到HFile中。
Kudu的物理模型是master和tserver,其中table根據(jù)hash和range分區(qū),分為多個tablet存儲到tserver中,tablet分為leader和follower,leader負(fù)責(zé)寫請求,follower負(fù)責(zé)讀請求,總結(jié)來說,一個ts可以服務(wù)多個tablet,一個tablet可以被多個ts服務(wù)(基于tablet的分區(qū),最低為2個分區(qū))。
Clic
總結(jié)
以上是生活随笔為你收集整理的kudu NoSQL数据库详解的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: AE473 奢华光效水晶粒子线帘背景展示
- 下一篇: 2008 奥运会开幕式 色彩绚烂 方块太