Infobright 数据仓库心得总结
?INFOBRIGHT介紹
?
在這里,我將結(jié)合我自己的使用以及對(duì)開(kāi)源數(shù)據(jù)倉(cāng)庫(kù)的了解,INFOBRIGHT做下簡(jiǎn)單的介紹。
INFOBRIGHT產(chǎn)品分為社區(qū)版ICE和企業(yè)版IEE。相信大家對(duì)ICE都有很多的了解。ICE具備了INFOBRIGHT大部分的功能,我列舉如下:
1. 超高的壓縮比例。 普通10:1, 在極限情況下可以達(dá)到40:1 甚至更高。
2. 超強(qiáng)勁的數(shù)據(jù)導(dǎo)入性能。 ICE 有自己專業(yè)的數(shù)據(jù)導(dǎo)入工具BHLOADER, 不過(guò)受到了一些限制,比如不能利用到多核導(dǎo)入。
3. 超強(qiáng)的數(shù)據(jù)查詢能力。 特別適合對(duì)于數(shù)據(jù)統(tǒng)計(jì)以及報(bào)表生成類得查詢。
4. 超大的單表存放規(guī)模。 正是因?yàn)榈谝稽c(diǎn),超強(qiáng)的壓縮比,所以可以存放大量的數(shù)據(jù), 節(jié)約了磁盤的存儲(chǔ),大大節(jié)省了成本。
5. 申請(qǐng)了專利的知識(shí)網(wǎng)格體系,這點(diǎn)是其他開(kāi)源數(shù)據(jù)倉(cāng)庫(kù)哪怕是商業(yè)的數(shù)據(jù)倉(cāng)庫(kù)產(chǎn)品所沒(méi)有的。
6. 與主要的BI分析工具的兼容性。 比如Pentaho等等。
但是除了以上的優(yōu)點(diǎn)外, ICE 有以下的限制:
1. 不支持?jǐn)?shù)據(jù)更新。 這個(gè)限制對(duì)于我們即要求查詢性能外還要對(duì)數(shù)據(jù)庫(kù)進(jìn)行寫入的需求, 造成了很大的不變。 這個(gè)估計(jì)是很多人試用后放棄試用ICE的第一個(gè)原因。
2. 不支持對(duì)多核的使用。 不但不支持查詢的多并發(fā),而且連導(dǎo)入導(dǎo)出也沒(méi)有這樣的支持。這個(gè)也是放棄ICE的一個(gè)原因。 誰(shuí)也不愿意自己的強(qiáng)勁的硬件只能被用到1%,這樣也會(huì)被老板給罵死的,他的錢不能白白的被這樣折騰。
?
3. 只能單機(jī)使用,不具備任何的復(fù)制以及擴(kuò)展。 這點(diǎn)對(duì)于我們現(xiàn)在的大規(guī)模海量數(shù)據(jù)情何以堪那?
?
?
所幸的是, INFOBRIGHT提供了商業(yè)版本IEE。IEE支持ICE的所有優(yōu)點(diǎn),并且彌補(bǔ)了他的不足, 放寬了對(duì)他的限制。 特別是早新的版本4.0.x里面提供了一套令人更加興奮的工具:DLP---分布式數(shù)據(jù)導(dǎo)入工具。DLP 優(yōu)點(diǎn)如下:
1. 減輕了數(shù)據(jù)庫(kù)服務(wù)器的負(fù)載,使它能處理更多的請(qǐng)求。
2. 對(duì)應(yīng)用完全透明, 不用編寫額外的代碼來(lái)處理復(fù)雜的導(dǎo)入工作。
3. 數(shù)據(jù)庫(kù)的導(dǎo)入時(shí)間隨著DLP部署的機(jī)器的增多二線性減少。當(dāng)然,這些機(jī)器可以是非常廉價(jià)的PC服務(wù)器,也可以是舊的機(jī)器。節(jié)省了大量的成本。
4. 減少了對(duì)網(wǎng)絡(luò)帶寬的占用。 DLP在導(dǎo)入之前對(duì)原始數(shù)據(jù)已經(jīng)進(jìn)行了高效的壓縮。
?
?
你還在等什么? 還對(duì)INFOBRIGHT有顧慮嗎? 趕快使用企業(yè)版。 害怕,擔(dān)心,復(fù)雜的業(yè)務(wù)代碼?? 統(tǒng)統(tǒng)走掉吧!!!
轉(zhuǎn)載于:https://blog.51cto.com/yueliangdao0608/721321
總結(jié)
以上是生活随笔為你收集整理的Infobright 数据仓库心得总结的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 2022生源地贷款什么时候到账,一般是在
- 下一篇: 【转】 ID,ClientID和Uniq