HTAP数据库及应用场景简析
HTAP數(shù)據(jù)庫,即交易分析混合負(fù)載型DB,已經(jīng)成為一種流行的新型數(shù)據(jù)庫。不僅概念很火,并且也在逐漸成為除OLTP、OLAP之外,越來越多數(shù)據(jù)庫用戶新的選型規(guī)范。然而,同時又存在一些現(xiàn)象:一是一夜之間,所有的數(shù)據(jù)庫都變成了HTAP數(shù)據(jù)庫;二是除了“能同時承載交易與分析SQL”這一極易模糊的理解之外,基本沒有清晰明確的界定;自然而然,對HTAP的應(yīng)用場景,也是八仙過海,各式各樣,并不清晰的。這些,都導(dǎo)致HTAP有成為一種噱頭的趨勢。
1. HTAP的界定
這里認(rèn)為,HTAP既然要成為一種新的標(biāo)準(zhǔn)與規(guī)范,就必須有盡量明確界定。而達(dá)此目的的最基本原則,就是它在技術(shù)上必須有不同于過去經(jīng)典數(shù)據(jù)庫的能力(不應(yīng)該只是分布式),并且必須對客戶的數(shù)字化進(jìn)程帶來創(chuàng)新與升級,這同時包括業(yè)務(wù)架構(gòu)、應(yīng)用架構(gòu)、數(shù)據(jù)架構(gòu)與技術(shù)架構(gòu)等層面。面向這一原則,其定義與界定可以持續(xù)探討,而本文僅提出如下幾點以供參考:
(1)HTAP在技術(shù)架構(gòu)與設(shè)計目標(biāo)上不應(yīng)該等同于經(jīng)典Oracle與MySQL,或分布式后的類Oracle與MySQL,因為如果經(jīng)典Oracle與MySQL也算是HTAP的話(用“能同時承載交易與分析SQL”來衡量,那肯定是),HTAP的定義,就毫無意義;
(2)HTAP數(shù)據(jù)庫的交易與分析任務(wù)的執(zhí)行,應(yīng)該能做到用戶透明使用且有互不影響的基礎(chǔ),而不應(yīng)該是AP多了大幅影響TP,TP多了大幅影響AP,經(jīng)典Oracle與MySQL正是如此;
(3)HTAP不應(yīng)該面向數(shù)倉類純OLAP的需求。也就是說,其對企業(yè)數(shù)據(jù)架構(gòu)的提升,現(xiàn)階段不應(yīng)該以摒棄數(shù)據(jù)倉庫體系為目標(biāo);
(4)現(xiàn)代的HTAP數(shù)據(jù)庫,應(yīng)該是分布式數(shù)據(jù)庫。
2. HTAP應(yīng)用場景
前面說過,HTAP帶來的,應(yīng)該是業(yè)務(wù)與架構(gòu)的創(chuàng)新與提升,而不僅僅是替換或者性能的提高。由此出發(fā),本文認(rèn)為HTAP的應(yīng)用場景主要集中如下兩個方面:
(1)分析能力內(nèi)嵌的業(yè)務(wù)系統(tǒng)(Analytic-Embeded OLTP)
有了HTAP的能力,未來的交易型業(yè)務(wù)系統(tǒng),都應(yīng)該在業(yè)務(wù)交易側(cè),就天生擁有分析的能力,并且不影響交易的性能與數(shù)據(jù)的一致性。如風(fēng)控、營銷或者其它原來需要在后臺數(shù)據(jù)平臺端通過數(shù)據(jù)遷移與同步才能完成的能力,相當(dāng)一部分,可以遷移到業(yè)務(wù)系統(tǒng)側(cè)實時完成,成為業(yè)務(wù)系統(tǒng)內(nèi)在的功能,使其本身就能完成一定程度的業(yè)務(wù)閉環(huán),這必然是技術(shù)驅(qū)動現(xiàn)代業(yè)務(wù)發(fā)展的重要方向。
未來的業(yè)務(wù)系統(tǒng)應(yīng)該以此標(biāo)準(zhǔn)來設(shè)計,這對現(xiàn)代交易系統(tǒng)的業(yè)務(wù)能力改造與升級有很大的意義。
(2) 以“用”為核的數(shù)據(jù)服務(wù)超市(Data SuperStore)
大多數(shù)的數(shù)據(jù)倉庫(Data Warehouse)體系,都是為“管”而生的,應(yīng)用很難享受到數(shù)據(jù)的紅利。絕大多數(shù)的企業(yè),在花大量精力建立了數(shù)據(jù)倉庫(Data Warehouse)體系后,業(yè)務(wù)系統(tǒng)與人員大多只能通過“請求技術(shù)人員協(xié)助完成”及“把數(shù)據(jù)導(dǎo)到業(yè)務(wù)系統(tǒng)來”兩種方式來使用數(shù)據(jù),這種應(yīng)用與數(shù)據(jù)分隔的現(xiàn)象是大多數(shù)企業(yè)過去很長一段時間及至今都極為關(guān)注的痛點。
面向數(shù)據(jù)消費,在現(xiàn)有數(shù)據(jù)平臺之上,建立以“用”為核,以“管”為基的數(shù)據(jù)服務(wù)平臺,即數(shù)據(jù)中臺這一概念的正確解釋,已經(jīng)成為很多企業(yè)規(guī)劃與實施的重點創(chuàng)新與升級應(yīng)用之一。它不同于Data WareHouse是為了存與管,而是為了讓全企業(yè)的用戶能將數(shù)據(jù)(準(zhǔn)確講是面向業(yè)務(wù)整理后的數(shù)據(jù)資產(chǎn),因不是本文重點,這里不作贅述)當(dāng)作超市的商品一樣自由選擇與消費,從而讓全企業(yè)享受到數(shù)據(jù)的紅利,因此,這里認(rèn)為稱之為數(shù)據(jù)服務(wù)超市(Data SuperStore)更為恰當(dāng)。然而,拋開數(shù)據(jù)資產(chǎn)體系建立等架構(gòu)與模型層面的內(nèi)容不說,應(yīng)該用什么樣的數(shù)據(jù)庫來承載這個SuperStore呢?
面向數(shù)據(jù)消費的 SuperStore,即要承載來自全企業(yè)的大量、高并發(fā)的服務(wù)型查詢需求(QPS的TP型),也要承載大量探索型的統(tǒng)計分析需求(AP型),這種要求顯然不是純OLAP數(shù)據(jù)庫,也不是純OLTP數(shù)據(jù)庫能滿足的,顯然又必須是彈性分布式的。因此,過去相當(dāng)多的數(shù)據(jù)服務(wù)平臺,都是采用多種類型數(shù)據(jù)庫,組合滿足不同需求來設(shè)計的。那么,HTAP數(shù)據(jù)庫,就應(yīng)該是該場景的最佳選擇。
總結(jié)
以上是生活随笔為你收集整理的HTAP数据库及应用场景简析的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: LintCode 183.木材加工
- 下一篇: 【回归预测-ELM预测】基于粒子群算法P