分布式数据库或成为新增量
以下文章來(lái)源于華泰證券:http://www.microbell.com/repinfodetail_775272.html
作者:謝春生、郭雅麗
數(shù)據(jù)庫(kù)行業(yè)螺旋上升,分布式數(shù)據(jù)庫(kù)或成新增量
縱觀計(jì)算機(jī)行業(yè)發(fā)展歷程,計(jì)算載體經(jīng)歷了從大型機(jī)到小型機(jī),再到分布式數(shù)據(jù)中心的演變。在數(shù)據(jù)庫(kù)領(lǐng)域,小型機(jī)時(shí)代促成了 Oracle?等關(guān)系型數(shù)據(jù)庫(kù)興起,分布式架構(gòu)時(shí)代 AWS、Snowflake?等分布式數(shù)據(jù)庫(kù)興起。在計(jì)算載體變革的過(guò)程中,數(shù)據(jù)庫(kù)市場(chǎng)往往不是簡(jiǎn)單的代替舊市場(chǎng),而是不斷創(chuàng)造新的增量。據(jù) Gartner,2018 年全球數(shù)據(jù)庫(kù)管理系統(tǒng)市場(chǎng)規(guī)模達(dá) 461?億美元, 預(yù)計(jì)于 2024?年整體市場(chǎng)規(guī)模達(dá)千億美元,但與此同時(shí)關(guān)系型數(shù)據(jù)庫(kù)市場(chǎng)規(guī)模增長(zhǎng)漸趨平緩。伴隨著分布式計(jì)算架構(gòu)的興起,分布式數(shù)據(jù)庫(kù)或成為數(shù)據(jù)庫(kù)市場(chǎng)新的增量,以史為鑒,該領(lǐng)域也有望誕生新的龍頭。
數(shù)據(jù)、計(jì)算場(chǎng)景變革推動(dòng)分布式數(shù)據(jù)庫(kù)時(shí)代到來(lái)
隨著智能終端的普及及云計(jì)算的興起,據(jù) IDC 全球數(shù)據(jù)產(chǎn)生量從 2010 年的1.2ZB?上升至 2018?年的 33ZB。另一方面,數(shù)據(jù)類(lèi)型不斷豐富,非結(jié)構(gòu)化數(shù)據(jù)逐漸增加。應(yīng)運(yùn)而生的分布式數(shù)據(jù)庫(kù)能夠較好的滿(mǎn)足大數(shù)據(jù)分析的需 ?求。而隨著 Snowflake、Databricks?等廠商推出分布式數(shù)據(jù)庫(kù)產(chǎn)品滿(mǎn)足云計(jì)算、大數(shù)據(jù)的使用需求,分布式數(shù)據(jù)庫(kù)時(shí)代到來(lái)的趨勢(shì)逐步確定。
開(kāi)源或商業(yè)閉源模式均導(dǎo)向企業(yè)級(jí)服務(wù),自研內(nèi)核具有穩(wěn)定性?xún)?yōu)勢(shì)
數(shù)據(jù)庫(kù)在 IT 架構(gòu)中向下對(duì)接操作系統(tǒng),直接調(diào)度硬件,向上則需支撐大量不同形態(tài)的上層應(yīng)用。與應(yīng)用軟件相比,數(shù)據(jù)庫(kù)作為基礎(chǔ)軟件更加注重穩(wěn)定性。開(kāi)源與商業(yè)閉源模式的商業(yè)策略,最終均需要導(dǎo)向優(yōu)質(zhì)的產(chǎn)品及企業(yè)級(jí)服務(wù),為客戶(hù)創(chuàng)造價(jià)值,獲得客戶(hù)及行業(yè)認(rèn)可。另一方面,自研內(nèi)核有助于數(shù)據(jù)庫(kù)廠商從源頭解決問(wèn)題,并且能掌握迭代控制權(quán),同樣是影響穩(wěn)定性的重要因素,因此自研內(nèi)核廠商有望憑借穩(wěn)定性在企業(yè)級(jí)服務(wù)市場(chǎng)獲得優(yōu)勢(shì)。
數(shù)據(jù)庫(kù)的六大評(píng)判維度
我們認(rèn)為評(píng)判數(shù)據(jù)庫(kù)有六大維度,除了上文提到的商業(yè)架構(gòu)、內(nèi)核基礎(chǔ)外,還包括品牌基因、技術(shù)架構(gòu)、商業(yè)落地、人才體系。其中品牌基因影響技術(shù)路線(xiàn)、側(cè)重領(lǐng)域、應(yīng)用場(chǎng)景等。技術(shù)架構(gòu)方面,分析型、大數(shù)據(jù)場(chǎng)景驅(qū)動(dòng)分布式數(shù)據(jù)庫(kù)發(fā)展。商業(yè)落地方面,金融、電信等的落地場(chǎng)景由于具備高并發(fā)、宕機(jī)代價(jià)高的特點(diǎn),因此在這一領(lǐng)域的商業(yè)落地案例一定程度上能夠說(shuō)明數(shù)據(jù)庫(kù)產(chǎn)品穩(wěn)定性高。人才體系則體現(xiàn)了數(shù)據(jù)庫(kù)廠商的生態(tài)建設(shè)成效。
?
風(fēng)險(xiǎn)提示:市場(chǎng)競(jìng)爭(zhēng)加劇,芯片及 AI 行業(yè)發(fā)展導(dǎo)致 IT 投資傾斜。
?
數(shù)據(jù)庫(kù)行業(yè):行業(yè)螺旋上升,分布式數(shù)據(jù)庫(kù)時(shí)代到來(lái)
數(shù)據(jù)庫(kù)發(fā)展需要關(guān)注增量市場(chǎng),分布式數(shù)據(jù)庫(kù)或成新機(jī)遇
數(shù)據(jù)庫(kù)的發(fā)展與計(jì)算載體緊密相關(guān)。數(shù)據(jù)庫(kù)是計(jì)算機(jī)行業(yè)的基礎(chǔ)核心軟件,所有應(yīng)用軟件的運(yùn)行和數(shù)據(jù)處理都要與其進(jìn)行數(shù)據(jù)交互。數(shù)據(jù)庫(kù)的開(kāi)發(fā)難度,不僅體現(xiàn)在與其他基礎(chǔ)器件的適配,更在于如何實(shí)現(xiàn)對(duì)數(shù)據(jù)高效、穩(wěn)定、持續(xù)的管理。從數(shù)據(jù)庫(kù)的發(fā)展歷程來(lái)看, 計(jì)算架構(gòu)的變化,計(jì)算載體的變化、計(jì)算場(chǎng)景的變化,以及計(jì)算數(shù)據(jù)格式的變化都對(duì)數(shù)據(jù)庫(kù)的發(fā)展帶來(lái)的一定的影響。或者說(shuō),在以上計(jì)算環(huán)境變化下,其需要的數(shù)據(jù)庫(kù)類(lèi)型也發(fā)生了變化。
從計(jì)算載體來(lái)看,數(shù)據(jù)的計(jì)算從原來(lái)的大型機(jī)、到小型機(jī)、個(gè)人電腦 PC、互聯(lián)網(wǎng)、移動(dòng)互聯(lián)網(wǎng)、云計(jì)算,以及未來(lái)更多終端的物聯(lián)網(wǎng)智能終端。計(jì)算的載體更加多樣化。
從計(jì)算場(chǎng)景來(lái)看,數(shù)據(jù)計(jì)算也從單獨(dú)的單機(jī)計(jì)算,到互聯(lián)網(wǎng)多群體交互的聯(lián)網(wǎng)計(jì)算和云計(jì)算,以及萬(wàn)物互聯(lián)的高并發(fā)、低時(shí)延的物聯(lián)網(wǎng)計(jì)算。
從計(jì)算架構(gòu)來(lái)看,傳統(tǒng)的 IT 架構(gòu)也正逐步向云架構(gòu)遷移。我們也經(jīng)歷了從 C-S 架構(gòu)到 B-S 架構(gòu),而目前的云原生、分布式計(jì)算架構(gòu)正對(duì)傳統(tǒng)計(jì)算架構(gòu)帶來(lái)深刻變革。而新的計(jì)算架構(gòu)也對(duì)計(jì)算的基礎(chǔ)軟件(操作系統(tǒng)、數(shù)據(jù)庫(kù)、芯片等)提出更高的需求。
圖表1: 計(jì)算的變化
在以上計(jì)算環(huán)境的變化下,我們看到,聯(lián)網(wǎng)的數(shù)據(jù)也在發(fā)生深刻變化。
數(shù)據(jù)的大小。目前聯(lián)網(wǎng)數(shù)據(jù)量也在高速增長(zhǎng)。通信技術(shù)的發(fā)展帶動(dòng)從 2G 到 3G、4G、5G 的演進(jìn),每代通信技術(shù)之間,聯(lián)網(wǎng)的數(shù)據(jù)規(guī)模也呈現(xiàn)(幾個(gè))數(shù)量級(jí)的增加。對(duì)大容量、高性能計(jì)算提出更高要求。
數(shù)據(jù)的類(lèi)型。計(jì)算場(chǎng)景的演變,我們對(duì)數(shù)據(jù)的定義也在發(fā)生變化。圖片、語(yǔ)音、視頻等非結(jié)構(gòu)化數(shù)據(jù)成為增量數(shù)據(jù)的主要類(lèi)型。聯(lián)網(wǎng)的數(shù)據(jù)類(lèi)型也逐步從原來(lái)的結(jié)構(gòu)化數(shù)據(jù)到非結(jié)構(gòu)化數(shù)據(jù)演變,這就對(duì)計(jì)算的并發(fā)性提出了更高的要求。
數(shù)據(jù)的快慢。對(duì)數(shù)據(jù)的高速計(jì)算是計(jì)算機(jī)一直以來(lái)的追求。但原有的 IT 架構(gòu)下,計(jì)算速度的提升存在一定的物理?xiàng)l件限制。經(jīng)典的 IT 架構(gòu)已經(jīng)存在了幾十年的歷史,當(dāng)時(shí)的 IT 架構(gòu)并沒(méi)有完全考慮到目前計(jì)算場(chǎng)景的變化。因此,新的計(jì)算場(chǎng)景下,對(duì)數(shù)據(jù)高速計(jì)算的追求,需要我們從底層基礎(chǔ)軟件的變革開(kāi)始。我們看到無(wú)論芯片、操作系統(tǒng)還是數(shù)據(jù)庫(kù),都在經(jīng)歷深刻變革。
圖表2: 數(shù)據(jù)的變化
在以上計(jì)算和數(shù)據(jù)多個(gè)維度變化的情況下,我們認(rèn)為,數(shù)據(jù)庫(kù)行業(yè)也正在經(jīng)歷歷史演進(jìn)的深刻變革。在傳統(tǒng)計(jì)算環(huán)境和數(shù)據(jù)類(lèi)型方面,傳統(tǒng)數(shù)據(jù)庫(kù)依然發(fā)揮比較重要的作用。但在面向未來(lái)新的計(jì)算場(chǎng)景方面,我們需要的可能是新型的數(shù)據(jù)庫(kù)產(chǎn)品。這種新型數(shù)據(jù)庫(kù),是計(jì)算架構(gòu)遷移、計(jì)算載體演進(jìn)以及計(jì)算環(huán)境變化之后的產(chǎn)物;同時(shí),也是數(shù)據(jù)規(guī)模大幅增加,數(shù)據(jù)結(jié)構(gòu)變化之后所需要的產(chǎn)品。
圖表3: 數(shù)據(jù)庫(kù)發(fā)展
全球關(guān)系型數(shù)據(jù)庫(kù)市場(chǎng)增速漸趨平穩(wěn)。數(shù)據(jù)庫(kù)是對(duì)數(shù)據(jù)的管理,數(shù)據(jù)庫(kù)誕生于上世紀(jì) 60 年代,傳統(tǒng)的數(shù)據(jù)庫(kù)產(chǎn)品面臨的是以事務(wù)型、交易處理為主的任務(wù),事務(wù)支持性能較好的關(guān)系型數(shù)據(jù)庫(kù)如 Oracle、DB2 迅速興起。而近年來(lái),傳統(tǒng)的關(guān)系型數(shù)據(jù)庫(kù)市場(chǎng)增長(zhǎng)漸趨平穩(wěn),據(jù)Gartner,2018?年全球數(shù)據(jù)庫(kù)管理系統(tǒng)(DBMS)市場(chǎng)規(guī)模達(dá)?461?億美元,同比增長(zhǎng)?18.4%,增速達(dá)到近十年峰值。但關(guān)系型數(shù)據(jù)庫(kù)市場(chǎng)增長(zhǎng)漸趨平緩,據(jù) T4.ai?預(yù)測(cè),全球關(guān)系型數(shù)據(jù)庫(kù)市場(chǎng)規(guī)模 2018-2022E?CAGR?為 6%,較 2012-2017?的 11%或?qū)⒂兴陆怠?/p>
數(shù)據(jù)量上升催生分析需求,數(shù)據(jù)庫(kù)市場(chǎng)新機(jī)遇顯現(xiàn)。隨著智能移動(dòng)手機(jī)的普及及云計(jì)算的興起,全球數(shù)據(jù)產(chǎn)生量不斷上升,從 2010?年的 1.2ZB?上升至 2018?年的 33ZB。未來(lái)幾年內(nèi)隨著各類(lèi)智能物聯(lián)設(shè)備的推廣以及云計(jì)算的進(jìn)一步應(yīng)用,數(shù)據(jù)量有望進(jìn)一步上升。隨著數(shù)據(jù)量上升,大數(shù)據(jù)分析的需求逐步顯現(xiàn),傳統(tǒng)的關(guān)系型數(shù)據(jù)庫(kù)在高并發(fā)、分析等方面存在一定的劣勢(shì),應(yīng)運(yùn)而生的分布式數(shù)據(jù)庫(kù)能夠較好的滿(mǎn)足大數(shù)據(jù)分析的需求,或形成數(shù)據(jù)庫(kù)市場(chǎng)新的增量。
圖表4:?全球數(shù)據(jù)庫(kù)市場(chǎng)規(guī)模
圖表5:?全球數(shù)據(jù)產(chǎn)生量
圖表6: 數(shù)據(jù)庫(kù)演進(jìn)
數(shù)據(jù)庫(kù)發(fā)展歷程復(fù)盤(pán):計(jì)算載體變革往往催生新興數(shù)據(jù)庫(kù)龍頭
階段一:大型機(jī)到小型機(jī)時(shí)代促成了 Oracle 的興起
上世紀(jì) 90 年代小型機(jī)興起促成 Oracle 興起。上世紀(jì) 80 年代到 90 年代,IBM PC 兼容機(jī)的出現(xiàn)使新興中小廠商能夠提供價(jià)格更低,并且同樣能兼容多種第三方軟件的計(jì)算機(jī)產(chǎn)品, IBM PC 兼容機(jī)市場(chǎng)份額也因此迅速增長(zhǎng),推動(dòng)了計(jì)算機(jī)在美國(guó)家庭內(nèi)普及。此后, Windows3.0 于 1990 年推出,提供了較為成熟的圖形界面操作系統(tǒng),推動(dòng)了計(jì)算機(jī)的普及。這一階段內(nèi),Oracle?數(shù)據(jù)庫(kù)等產(chǎn)品最終戰(zhàn)勝了主機(jī)數(shù)據(jù)庫(kù)占領(lǐng)了這一新增市場(chǎng),從收入規(guī)模變化看,1990-2000 年 Oracle 營(yíng)業(yè)收入高速增長(zhǎng),期間 CAGR 達(dá)到 27.3%。
圖表7: 90 年代美國(guó)計(jì)算機(jī)銷(xiāo)售快速增長(zhǎng)
圖表8: 90 年代 Oracle 營(yíng)業(yè)收入規(guī)模高速增長(zhǎng)
技術(shù)積累幫助 Oracle 開(kāi)拓小型機(jī)市場(chǎng)。基礎(chǔ)軟件從產(chǎn)品誕生到走向成熟往往需要十年左右的時(shí)間。以 Oracle 為例,公司于上世紀(jì) 80 年代初開(kāi)始產(chǎn)品化,一直處于技術(shù)與商業(yè)的積累過(guò)程。直到 1992 年,公司推出旗艦產(chǎn)品 Oracle7,迅速把握小型機(jī)發(fā)展帶來(lái)的市場(chǎng)機(jī)遇,在與 IBM DB2 for LUW、Informix、Sybase 等著名數(shù)據(jù)庫(kù)廠商的一系列競(jìng)爭(zhēng)后,一躍成為行業(yè)的霸主。
圖表9: Oracle 主要數(shù)據(jù)庫(kù)產(chǎn)品(2010 前)
階段二:小型機(jī)到分布式時(shí)代,AWS 興起分布式架構(gòu)時(shí)代,AWS 等數(shù)據(jù)庫(kù)興起。隨著數(shù)據(jù)量的增長(zhǎng),傳統(tǒng)數(shù)據(jù)庫(kù)面臨挑戰(zhàn),分布式數(shù)據(jù)庫(kù)的訪問(wèn)模式從過(guò)去單一標(biāo)準(zhǔn)化的 SQL,向包括 SQL 在內(nèi)的多種訪問(wèn)模式轉(zhuǎn)化,催生了分布式數(shù)據(jù)庫(kù)的發(fā)展。2005 年起,人們開(kāi)始了針對(duì)分布式數(shù)據(jù)庫(kù)的探索,以 HBase、Cassadra、MongoDB 為代表的 NoSQL 數(shù)據(jù)庫(kù)快速發(fā)展。此類(lèi)數(shù)據(jù)庫(kù)通過(guò)提供 KV 接口、簡(jiǎn)化存儲(chǔ)模型等方式實(shí)現(xiàn)容量水平擴(kuò)展,但對(duì)業(yè)務(wù)的支撐有所減弱。2012 年左右隨著Google 關(guān)于 Spanner 和 F1 論文的發(fā)表,以 Aurora、Spanner 為代表的分布式數(shù)據(jù)庫(kù)迅速發(fā)展。分布式數(shù)據(jù)庫(kù)結(jié)合了非關(guān)系型數(shù)據(jù)庫(kù)的存儲(chǔ)管理能力、關(guān)系數(shù)據(jù)庫(kù)的 ACID 特性和SQL 便利性。從結(jié)果看,分布式技術(shù)歷經(jīng)十年左右的發(fā)展,如今逐步被大量企業(yè)接受,而在這一階段內(nèi),AWS aurora 等新興數(shù)據(jù)庫(kù)逐步興起。
國(guó)產(chǎn)分布式數(shù)據(jù)庫(kù) 2011?年陸續(xù)起步。自 2011?年起,以 Oceanbase、巨杉數(shù)據(jù)庫(kù)、TiDB 為代表的國(guó)產(chǎn)分布式數(shù)據(jù)庫(kù)相繼誕生。三者發(fā)展路徑及商業(yè)化時(shí)間有所區(qū)別,其中Oceanbase?誕生于2011?年,最初主要用于阿里集團(tuán)內(nèi)部,在 2017?年首次實(shí)現(xiàn)商用;巨杉數(shù)據(jù)庫(kù)誕生于 2011?年,于 2013?年正式發(fā)布商用版本,并持續(xù)服務(wù)于金融銀行行業(yè);TiDB于 2015 年發(fā)布,重點(diǎn)經(jīng)營(yíng)開(kāi)源策略。
圖表10: 分布式數(shù)據(jù)庫(kù)發(fā)展歷程
AWS 發(fā)展全新的技術(shù)體系,把握分布式數(shù)據(jù)庫(kù)浪潮。AWS 數(shù)據(jù)庫(kù)平臺(tái)可以視為一個(gè)大型數(shù)據(jù)服務(wù)資源池,在底層共享統(tǒng)一的存儲(chǔ)與計(jì)算資源,在上層則提供了 Aurora、RDS、DynamoDB、Neptune 等數(shù)據(jù)庫(kù)服務(wù)實(shí)例,從而實(shí)現(xiàn)對(duì)更多業(yè)務(wù)場(chǎng)景和服務(wù)模式的覆蓋。
通過(guò)全新的技術(shù)體系,亞馬遜 AWS 滿(mǎn)足了多樣化的計(jì)算需求,2013-2020 年收入 CAGR 達(dá)到 46.7%。并且憑借云計(jì)算業(yè)務(wù)的快速擴(kuò)張,獲得了領(lǐng)先的市場(chǎng)地位。截至 2019 年,據(jù)Canalys,AWS 在云基礎(chǔ)設(shè)施市場(chǎng)份額達(dá)到 32.3%,具有一定的優(yōu)勢(shì)。
圖表11:?AWS?收入及占亞馬遜總收入比
圖表12:?2019?年全球云基礎(chǔ)設(shè)施市場(chǎng)份額
圖表13: AWS 數(shù)據(jù)庫(kù)技術(shù)體系
進(jìn)入戰(zhàn)國(guó)時(shí)代,云計(jì)算場(chǎng)景推動(dòng)分布式數(shù)據(jù)庫(kù)時(shí)代到來(lái)
分布式數(shù)據(jù)庫(kù)滿(mǎn)足云計(jì)算場(chǎng)景的需求
計(jì)算場(chǎng)景不斷變化,云成為重要的計(jì)算場(chǎng)景。不同的計(jì)算場(chǎng)景對(duì)數(shù)據(jù)庫(kù)有不同的要求,隨著數(shù)據(jù)量的不斷增長(zhǎng),傳統(tǒng)的終端計(jì)算場(chǎng)景難以滿(mǎn)足大量的數(shù)據(jù)處理需求。而云計(jì)算將計(jì)算與存儲(chǔ)資源彈性、動(dòng)態(tài)分配,邊緣計(jì)算通過(guò)邊緣節(jié)點(diǎn)提升了計(jì)算的效率,實(shí)現(xiàn)了高效的數(shù)據(jù)處理,云端、邊緣端的計(jì)算場(chǎng)景重要性逐步提升。據(jù) Gartner,全球云計(jì)算市場(chǎng)規(guī)模由2011 年的 910 億美元增長(zhǎng)到 2019 年的 1880 億美元,期間 CAGR 達(dá)到 9.5%。
圖表14: 全球云計(jì)算市場(chǎng)規(guī)模
分布式數(shù)據(jù)庫(kù)能夠較好滿(mǎn)足云計(jì)算場(chǎng)景的需求。分布式數(shù)據(jù)庫(kù)將數(shù)據(jù)庫(kù)進(jìn)行資源池化管理, 具備多模式、多租戶(hù)、HTAP、彈性擴(kuò)張、高可用等特性,與云計(jì)算、分布式應(yīng)用開(kāi)發(fā)模式相匹配。分布式數(shù)據(jù)庫(kù)包括底層數(shù)據(jù)庫(kù)資源池化管理、多模式兩大重要特點(diǎn)。
(1)底層數(shù)據(jù)庫(kù)資源池化管理:指以資源池的方式,上層應(yīng)用中所有模塊在底層數(shù)據(jù)庫(kù)資源池中創(chuàng)建獨(dú)立的數(shù)據(jù)庫(kù)實(shí)例,服務(wù)于自身業(yè)務(wù)。每一個(gè)數(shù)據(jù)庫(kù)實(shí)例可以提供完全不同的兼容 MySQL、PostgreSQL、MongoDB、S3?等接口,也可以將所使用的底層物理資源擴(kuò)展到多個(gè)服務(wù)器中做到自由伸縮,同時(shí)也能夠保障不同實(shí)例之間的數(shù)據(jù)可以根據(jù)策略做到物理或邏輯層面的相互隔離。在這種體系架構(gòu)中,應(yīng)用程序依然能保持獨(dú)立的微服務(wù)形態(tài)。
(2)“多模式”特性:指同一套分布式架構(gòu)底座同時(shí)支撐上層超過(guò)一種數(shù)據(jù)訪問(wèn)接口, 訪問(wèn)方式包括但不限于 SQL?引擎、類(lèi)似 JSON?的半結(jié)構(gòu)化數(shù)據(jù)、S3?的非結(jié)構(gòu)化數(shù)據(jù)、KV 鍵值對(duì)存儲(chǔ)、圖數(shù)據(jù)庫(kù)接口、時(shí)序型數(shù)據(jù)接口等。通過(guò)此種方式,可以對(duì)存儲(chǔ)于不同的物理服務(wù)器、不同格式的數(shù)據(jù)進(jìn)行數(shù)據(jù)結(jié)構(gòu)與算法的優(yōu)化,從而形成“數(shù)據(jù)服務(wù)平臺(tái)”,突破數(shù)據(jù)庫(kù)類(lèi)型的限制,對(duì)上層不同類(lèi)型的應(yīng)用同時(shí)提供多種類(lèi)型的數(shù)據(jù)服務(wù)。
圖表15: 云原生概念變遷
分布式數(shù)據(jù)庫(kù)滿(mǎn)足云原生需求,或?qū)⒊蔀樾碌脑鲩L(zhǎng)點(diǎn):從云原生概念變遷看,云原生使用微服務(wù)、容器等技術(shù),目的在于提供更加敏捷的服務(wù)支持,協(xié)助業(yè)務(wù)更易于實(shí)現(xiàn)擴(kuò)展及持續(xù)交互。分布式數(shù)據(jù)庫(kù)通常是基于一個(gè)數(shù)據(jù)集合,這些數(shù)據(jù)分布在由計(jì)算機(jī)網(wǎng)絡(luò)連接起來(lái)的若干節(jié)點(diǎn)上,每個(gè)節(jié)點(diǎn)可以管理本地的數(shù)據(jù)應(yīng)用,也可以參與全局?jǐn)?shù)據(jù)應(yīng)用,同時(shí)這些數(shù)據(jù)在邏輯上形成一個(gè)整體,由統(tǒng)一的數(shù)據(jù)庫(kù)管理系統(tǒng)進(jìn)行管理。從架構(gòu)上看,分布式數(shù)據(jù)庫(kù)提供了靈活的數(shù)據(jù)服務(wù)支持,實(shí)際上是一種“云原生”的架構(gòu)體現(xiàn)。
圖表16: 全球數(shù)據(jù)庫(kù)市場(chǎng)規(guī)模(分類(lèi)別)
大數(shù)據(jù)向分布式數(shù)據(jù)庫(kù)傾斜,或形成新增量。以 Hadoop 為代表的第一代大數(shù)據(jù)系統(tǒng)框架對(duì)大數(shù)據(jù)技術(shù)的落地起了重要的作用。Hadoop 起源于 2004 年,并于 2006 年成為一套獨(dú)立完整的軟件。Hadoop 主要包括文件系統(tǒng) HDFS 及計(jì)算系統(tǒng) MapReduce,采用計(jì)算存儲(chǔ)一體化的方式,將巨大的數(shù)據(jù)集分派到由普通計(jì)算機(jī)組成的集群中的多個(gè)節(jié)點(diǎn)進(jìn)行存儲(chǔ), 并能對(duì)數(shù)據(jù)進(jìn)行索引和跟蹤。但隨著數(shù)據(jù)量和分析需求的復(fù)雜性的進(jìn)一步增加,Hadoop 中“Map+Reduce 模型不適合描述復(fù)雜的數(shù)據(jù)處理過(guò)程”、“查詢(xún)效率較低”、“時(shí)刻在線(xiàn)處理導(dǎo)致使用成本高”等問(wèn)題逐步顯現(xiàn),分布式數(shù)據(jù)庫(kù)或成為大數(shù)據(jù)領(lǐng)域的新選擇。
圖表17: Hadoop 生態(tài)模型
Snowflake、Databricks 引領(lǐng)數(shù)據(jù)湖興起
數(shù)據(jù)倉(cāng)庫(kù)性能較強(qiáng),數(shù)據(jù)湖更具靈活性。數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)湖側(cè)重點(diǎn)有所區(qū)別,數(shù)據(jù)倉(cāng)庫(kù)關(guān)注的是數(shù)據(jù)使用效率和數(shù)據(jù)管理,為企業(yè)各級(jí)別、業(yè)務(wù)線(xiàn)的決策制定提供統(tǒng)一的數(shù)據(jù)支持,其數(shù)據(jù)主要來(lái)源于業(yè)務(wù)系統(tǒng),存儲(chǔ)格式以結(jié)構(gòu)化為主,并且歷經(jīng)加工清洗,數(shù)據(jù)形態(tài)顯得更加范式化、模型化,因此數(shù)據(jù)的靈活度較低。相比之下,數(shù)據(jù)湖則是以原生格式(或者經(jīng)過(guò)粗加工后)進(jìn)行積累和沉淀,格式豐富多樣,有結(jié)構(gòu)化、半結(jié)構(gòu)化、非結(jié)構(gòu)化類(lèi)型, 強(qiáng)調(diào)數(shù)據(jù)的原始性、靈活性和可用性。相比數(shù)據(jù)倉(cāng)庫(kù),數(shù)據(jù)湖所儲(chǔ)存的數(shù)據(jù)類(lèi)型更加豐富, 同時(shí)開(kāi)放存儲(chǔ)讓上層引擎靈活度增加,引擎可隨意讀寫(xiě)數(shù)據(jù)湖中數(shù)據(jù),兼容的寬松性強(qiáng)。但另一方面,數(shù)據(jù)湖中文件系統(tǒng)直接訪問(wèn)使得很多更高階的功能很難實(shí)現(xiàn),如細(xì)粒度權(quán)限管理、讀寫(xiě)接口升級(jí)等。
圖表18: 數(shù)據(jù)湖 vs?數(shù)據(jù)倉(cāng)庫(kù)
Snowflake:提供數(shù)據(jù)倉(cāng)庫(kù)、數(shù)據(jù)湖等多種產(chǎn)品
Snowflake 滿(mǎn)足并發(fā)性、可擴(kuò)展性、易用性、平臺(tái)中立性的需求。公司完全基于公有云,提供包括數(shù)據(jù)倉(cāng)庫(kù)(Data?Warehouse)、數(shù)據(jù)湖(Data?Lake)在內(nèi)的多種產(chǎn)品,支持非結(jié)構(gòu)化數(shù)據(jù)、數(shù)據(jù)可視化和分析。公司意在打造綜合性的云數(shù)據(jù)平臺(tái),其數(shù)據(jù)庫(kù)可在三大公有云 AWS、Azure 和 Google Cloud Platform 上部署,對(duì)于企業(yè)多云異構(gòu)的復(fù)雜環(huán)境有適用性、中立性,同時(shí)亦提供數(shù)據(jù)交換功能,解決了過(guò)去用戶(hù)面臨著投入高、靈活度低等問(wèn)題,可吸引中小型客戶(hù)。據(jù)公司財(cái)報(bào),截至 2020 年 7 月,公司有 3117 個(gè)企業(yè)客戶(hù),同比增長(zhǎng)超 100%,截至 2021 財(cái)年 Q3,公司的數(shù)據(jù)提供商已經(jīng)突破 100 家。
圖表19: Snowflake 數(shù)據(jù)湖產(chǎn)品 vs 數(shù)據(jù)倉(cāng)庫(kù)產(chǎn)品
圖表20: Hadoop vs?snowflake
數(shù)據(jù)倉(cāng)庫(kù)滿(mǎn)足多種使用場(chǎng)景需求。其中彈性數(shù)據(jù)倉(cāng)庫(kù)的系統(tǒng)會(huì)隨著負(fù)載變化自動(dòng)擴(kuò)展或收縮,根據(jù)需要向主機(jī)復(fù)制數(shù)據(jù),且并不限制處理請(qǐng)求的數(shù)量,從而實(shí)現(xiàn)數(shù)據(jù)服務(wù)彈性。數(shù)據(jù)倉(cāng)庫(kù)采取 Shared-nothing 架構(gòu),在節(jié)點(diǎn)之間不共享任何數(shù)據(jù),此外 Snowflake 基于Multi-cluster, shared data 的概念,將存儲(chǔ)和計(jì)算分離,解決了升級(jí)擴(kuò)容時(shí)需要重新分配節(jié)點(diǎn)資源等痛點(diǎn)。在數(shù)據(jù)支持方面,Snowfalke 支持結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù)的組合使用,可以接收 JSON、XML 或 Avro 格式的數(shù)據(jù),并且支持嵌套和重復(fù)數(shù)據(jù)類(lèi)型,從而滿(mǎn)足傳統(tǒng)數(shù)據(jù)庫(kù)、Hadoop 等半結(jié)構(gòu)化使用場(chǎng)景的使用需求。
圖表21: Snowflake 數(shù)據(jù)倉(cāng)庫(kù)架構(gòu)
Snowflake 數(shù)據(jù)湖產(chǎn)品強(qiáng)調(diào)查詢(xún)性能、數(shù)據(jù)管道集成可擴(kuò)展、安全等。利用內(nèi)置數(shù)據(jù)治理和安全性的同時(shí)實(shí)現(xiàn)快速的數(shù)據(jù)訪問(wèn),具備較好的查詢(xún)性能,并且對(duì)數(shù)據(jù)轉(zhuǎn)換進(jìn)行了良好的支持,通過(guò)云的模式為客戶(hù)省去運(yùn)維成本。在查詢(xún)性能方面,支持即時(shí)和幾乎無(wú)限的可擴(kuò)展性和并發(fā)性;此外,通過(guò)集成和可擴(kuò)展的數(shù)據(jù)管道,實(shí)現(xiàn)簡(jiǎn)化數(shù)據(jù)管道開(kāi)發(fā)以?xún)?yōu)化性能。依靠管道實(shí)時(shí)可靠地?cái)U(kuò)展來(lái)處理繁重的數(shù)據(jù)工作量和可擴(kuò)展的數(shù)據(jù)轉(zhuǎn)換;在安全方面, 則提供了安全的數(shù)據(jù)協(xié)作功能。
圖表22: Snowflake 數(shù)據(jù)湖
Snowflake 服務(wù)各行業(yè)客戶(hù)。以 hookit 為例,據(jù)公司官網(wǎng),Snowflake 為 hookit 構(gòu)建具有可擴(kuò)展性的多集群共享數(shù)據(jù)架構(gòu)數(shù)據(jù)庫(kù),提高了 Hookit 的運(yùn)營(yíng)效率。查詢(xún)效率提高 30 倍,每天可自動(dòng)評(píng)估社交帖子 5 億條,數(shù)據(jù)倉(cāng)庫(kù)基礎(chǔ)架構(gòu)成本降低 40%,消除了 88%的內(nèi)部支持請(qǐng)求,提升了客戶(hù)的運(yùn)行效率,使客戶(hù)能夠?qū)W⒂诋a(chǎn)品創(chuàng)新。
圖表23: Snowflake 客戶(hù)
Databricks:Lakehouse 概念,幫助客戶(hù)構(gòu)建統(tǒng)一分析平臺(tái)
Databricks?推出?Lakehouse?概念。Lakehouse?是由“Data?Lakes”與“Data?Warehouses”融合而成。普通的數(shù)據(jù)湖在數(shù)據(jù)質(zhì)量、一致性/隔離性、混合處理追加讀取等方面不如數(shù)據(jù)倉(cāng)庫(kù)。Lakehouse 兼容了數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)湖的優(yōu)勢(shì),在數(shù)據(jù)湖的低成本存儲(chǔ)上實(shí)現(xiàn)數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)結(jié)構(gòu)和管理功能。Lakehouse 功能包括事務(wù)支持、模式執(zhí)行和治理、BI 支持、存儲(chǔ)與計(jì)算分離、開(kāi)放性、支持多種數(shù)據(jù)類(lèi)型、各種工作負(fù)載、端到端流。
圖表24: Lakehouse
為客戶(hù)提供統(tǒng)一分析平臺(tái)提升效率:構(gòu)建統(tǒng)一分析平臺(tái),簡(jiǎn)化跨功能團(tuán)隊(duì)的分析工作流程, 使用單一平臺(tái)查詢(xún)、調(diào)試和探索流式處理和批次數(shù)據(jù),以及構(gòu)建和部署 ML 模型。打造交互式工作空間,促進(jìn)與共享筆記本環(huán)境的合作,使數(shù)據(jù)科學(xué)家能夠快速實(shí)時(shí)在模型上進(jìn)行重復(fù)。同時(shí)簡(jiǎn)化管理,使公司無(wú)需人工干預(yù)即可完全自動(dòng)化作業(yè)調(diào)度、監(jiān)控和集群管理。以RB?為例,Databricks?為 RB?提供了一個(gè)統(tǒng)一的數(shù)據(jù)分析平臺(tái),該平臺(tái)在數(shù)據(jù)科學(xué)和工程領(lǐng)域營(yíng)造了可擴(kuò)展的協(xié)作環(huán)境,使數(shù)據(jù)團(tuán)隊(duì)能夠更快地進(jìn)行創(chuàng)新,并為業(yè)務(wù)提供 ML?驅(qū)動(dòng)的見(jiàn)解。據(jù)公司官網(wǎng),該方案使得公司業(yè)務(wù)可支持量提高 10?倍,數(shù)據(jù)從 80TB?壓縮到 2TB,降低了運(yùn)營(yíng)成本,24*7?個(gè)任務(wù)的數(shù)據(jù)管道性能提高 2?倍。
圖表25: Databricks 客戶(hù)
數(shù)據(jù)庫(kù)六大評(píng)判維度
綜合前文數(shù)據(jù)庫(kù)行業(yè)的發(fā)展歷程,我們總結(jié)了數(shù)據(jù)庫(kù)的幾個(gè)評(píng)判維度,主要包括品牌基因、商業(yè)模式、內(nèi)核基礎(chǔ)、技術(shù)架構(gòu)、商業(yè)落地、人才體系。
品牌基因:品牌定位和創(chuàng)始團(tuán)隊(duì)背景
關(guān)注品牌基因。包含品牌的背景,商用首發(fā)時(shí)間,資金背景,創(chuàng)始團(tuán)隊(duì)背景、廠商主營(yíng)業(yè)務(wù)等。品牌基因反映出數(shù)據(jù)庫(kù)的品牌特性,商用首發(fā)時(shí)間較早的數(shù)據(jù)庫(kù)廠商往往在傳統(tǒng)數(shù)據(jù)庫(kù)領(lǐng)域具有較為深厚的積累,近年來(lái)新誕生的勢(shì)力包括獨(dú)立創(chuàng)新品牌和大廠的數(shù)據(jù)庫(kù)產(chǎn)品。從創(chuàng)始團(tuán)隊(duì)背景看,則反映出數(shù)據(jù)庫(kù)產(chǎn)品的技術(shù)背景,當(dāng)前國(guó)產(chǎn)數(shù)據(jù)庫(kù)創(chuàng)始團(tuán)隊(duì)多來(lái)自國(guó)內(nèi)頂尖院校、海外數(shù)據(jù)庫(kù)廠商或國(guó)內(nèi)互聯(lián)網(wǎng)大企業(yè)內(nèi)部培育。此外,由于大數(shù)據(jù)時(shí)代數(shù)據(jù)庫(kù)的作用日益重要,在傳統(tǒng)的數(shù)據(jù)庫(kù)廠商之外,金融服務(wù)廠商、ICT 等主營(yíng)業(yè)務(wù)非數(shù)據(jù)庫(kù)的廠商也推出了自己的數(shù)據(jù)庫(kù)產(chǎn)品。主營(yíng)業(yè)務(wù)非數(shù)據(jù)庫(kù)的廠商基于特定場(chǎng)景延伸出的數(shù)據(jù)庫(kù)產(chǎn)品針對(duì)特定的行業(yè)可能存在一定的競(jìng)爭(zhēng)優(yōu)勢(shì)。但與此同時(shí),相比獨(dú)立數(shù)據(jù)庫(kù)廠商, 此類(lèi)廠商的發(fā)展路徑及方向可能會(huì)受到母公司策略方向的制約。
圖表26: 數(shù)據(jù)庫(kù)品牌基因?qū)Ρ?/strong>
商業(yè)模式:基礎(chǔ)軟件需要企業(yè)級(jí)服務(wù),開(kāi)源具有兩面性
數(shù)據(jù)庫(kù)是基礎(chǔ)軟件,穩(wěn)定性較為重要。基礎(chǔ)軟件指操作系統(tǒng)、數(shù)據(jù)庫(kù)、中間件等服務(wù)于軟件開(kāi)發(fā)者的,最底層的軟件。此類(lèi)軟件直接調(diào)度 CPU、內(nèi)存、磁盤(pán)、網(wǎng)絡(luò)等硬件設(shè)備,因此穩(wěn)定性較為重要。數(shù)據(jù)庫(kù)在 IT 架構(gòu)中扮演著承上啟下的角色,向下對(duì)接操作系統(tǒng),需要直接調(diào)度各類(lèi)硬件,分布式數(shù)據(jù)庫(kù)還需要協(xié)調(diào)多臺(tái)服務(wù)器形成整體的可管理集群,深度參與跨節(jié)點(diǎn)事務(wù)控制及網(wǎng)絡(luò)優(yōu)化以獲得最佳性能;向上則需要支撐大量不同形態(tài)的上層應(yīng)用。與應(yīng)用軟件相比,數(shù)據(jù)庫(kù)作為基礎(chǔ)軟件更加注重穩(wěn)定性。
圖表27: 數(shù)據(jù)庫(kù)在 IT 架構(gòu)中的位置
開(kāi)源具備兩面性,企業(yè)級(jí)服務(wù)廠商具備穩(wěn)定性?xún)?yōu)勢(shì)。開(kāi)源將二次修改使用源代碼的權(quán)利公開(kāi),有助于快速的積累用戶(hù),當(dāng)客戶(hù)將包含開(kāi)源產(chǎn)品的內(nèi)容通過(guò)閉源方式銷(xiāo)售時(shí)則需要支付費(fèi)用,廠商實(shí)現(xiàn)用戶(hù)資源變現(xiàn)。但相比企業(yè)級(jí)服務(wù),開(kāi)源往往通過(guò)技術(shù)社區(qū)的方式維系, 缺乏法律合約關(guān)系,開(kāi)發(fā)者響應(yīng)速度難以保障,并且在社區(qū)參與者過(guò)多的情況下維護(hù)難度也有所提升。相比之下,企業(yè)級(jí)服務(wù)具有穩(wěn)定性的優(yōu)勢(shì)。因此對(duì)于數(shù)據(jù)庫(kù)等重視穩(wěn)定性的基礎(chǔ)軟件,企業(yè)級(jí)服務(wù)產(chǎn)品具備一定的優(yōu)勢(shì)。
圖表28: 基礎(chǔ)軟件 VS 應(yīng)用軟件
圖表29: 各開(kāi)源產(chǎn)品協(xié)議調(diào)整情況
開(kāi)源或閉源模式均需導(dǎo)向企業(yè)級(jí)服務(wù)。開(kāi)源具有兩面性,通過(guò)將二次修改使用源代碼的權(quán)利公開(kāi),打造開(kāi)發(fā)者生態(tài),有助于快速的積累用戶(hù)。但開(kāi)源和閉源并非不會(huì)改變,同一家數(shù)據(jù)庫(kù)廠商可能在不同的階段選擇開(kāi)源或閉源,此外,在同一時(shí)期,也可能同時(shí)發(fā)布開(kāi)源、閉源的不同版本產(chǎn)品。如 Oceanbase、GaussDB?均經(jīng)歷過(guò)開(kāi)源與閉源的切換。但一般來(lái)說(shuō)開(kāi)源版本往往較低,企業(yè)級(jí)服務(wù)需要最新,最穩(wěn)定的性能,因此閉源模式的產(chǎn)品較為適合。
內(nèi)核基礎(chǔ):原廠自研能力關(guān)鍵,掌控核心代碼或成重要競(jìng)爭(zhēng)力
企業(yè)級(jí)原廠服務(wù)有助于從源頭解決問(wèn)題。企業(yè)級(jí)服務(wù)包括企業(yè)級(jí)原廠服務(wù)及第三方支持服務(wù)。企業(yè)級(jí)原廠服務(wù)指掌握每一行核心代碼,可以從源頭解決軟件核心問(wèn)題的廠商,企業(yè)通過(guò)購(gòu)買(mǎi)其產(chǎn)品及服務(wù),可以獲得系統(tǒng)故障過(guò)后第一手的服務(wù)承諾。而第三方支持服務(wù), 如同數(shù)據(jù)庫(kù)行業(yè)中各類(lèi)運(yùn)維服務(wù)商,在成熟的市場(chǎng)體系下可以協(xié)助客戶(hù)以更低的成本獲取常規(guī)服務(wù)支持,但由于第三方支持服務(wù)商往往不具備產(chǎn)品的核心研發(fā)能力,因此往往作為服務(wù)輔助。
圖表30: 企業(yè)級(jí)原廠服務(wù) VS 第三方支持服務(wù)
企業(yè)級(jí)原廠服務(wù)掌握迭代控制權(quán),有助于持續(xù)發(fā)展。開(kāi)源社區(qū)及第三方廠商雖然擁有更改源代碼的能力,但其更改存在不被主流社區(qū)接納,最終與主社區(qū)脫節(jié)的風(fēng)險(xiǎn),因此穩(wěn)定性上存在一定隱患。相比之下,企業(yè)級(jí)原廠服務(wù)掌握迭代控制權(quán),有助于持續(xù)發(fā)展。在分布式數(shù)據(jù)庫(kù)的廠商選擇上同樣如此,具有全面掌握所有核心代碼主導(dǎo)權(quán)的廠商所提供的企業(yè)級(jí)原廠服務(wù)能形成更加有力的技術(shù)支持。國(guó)內(nèi)商業(yè)閉源的分布式數(shù)據(jù)庫(kù)廠商大多為主研發(fā), 具備企業(yè)級(jí)服務(wù)基因。
圖表31: 企業(yè)級(jí)原廠服務(wù) VS 開(kāi)源數(shù)據(jù)庫(kù)
關(guān)注是否為完全自研可控。數(shù)據(jù)庫(kù)內(nèi)核是否自研關(guān)系到數(shù)據(jù)庫(kù)廠商是否完全能掌握迭代控制權(quán),目前國(guó)產(chǎn)數(shù)據(jù)庫(kù)多采取具備自主知識(shí)產(chǎn)權(quán)的自研內(nèi)核。選取具備自研內(nèi)核的數(shù)據(jù)庫(kù)產(chǎn)品有助于提升產(chǎn)品升級(jí)迭代的穩(wěn)定性和可控性,對(duì)于重視穩(wěn)定性的基礎(chǔ)軟件領(lǐng)域,自研可控是重要的考慮因素。
圖表32: 數(shù)據(jù)庫(kù)內(nèi)核自研情況
技術(shù)架構(gòu):不同數(shù)據(jù)庫(kù)適用于不同場(chǎng)景
關(guān)系型數(shù)據(jù)庫(kù) vs 非關(guān)系型數(shù)據(jù)庫(kù)。根據(jù)數(shù)據(jù)存儲(chǔ)結(jié)構(gòu)區(qū)分,可以分為關(guān)系型數(shù)據(jù)庫(kù)、非關(guān)系型數(shù)據(jù)庫(kù),其中非關(guān)系型數(shù)據(jù)庫(kù)根據(jù)存儲(chǔ)方式又可以分為鍵值數(shù)據(jù)庫(kù)、列數(shù)據(jù)庫(kù)、文檔數(shù)據(jù)庫(kù)、圖數(shù)據(jù)庫(kù)等。非關(guān)系型數(shù)據(jù)庫(kù)在讀寫(xiě)性能、擴(kuò)展性上具有一定的優(yōu)勢(shì),因此較適應(yīng)大數(shù)據(jù)、高并發(fā)等場(chǎng)景,而關(guān)系型數(shù)據(jù)庫(kù)具備強(qiáng)一致性,遵循 ACID 原則,因此在事務(wù)支持中具備優(yōu)勢(shì)。
圖表33: 關(guān)系型數(shù)據(jù)庫(kù) vs 非關(guān)系型數(shù)據(jù)庫(kù)
圖表34: 非關(guān)系型數(shù)據(jù)庫(kù)分類(lèi)
集中式數(shù)據(jù)庫(kù) vs 分布式數(shù)據(jù)庫(kù)。根據(jù)系統(tǒng)架構(gòu)分,可以分為集中式數(shù)據(jù)庫(kù)、分布式數(shù)據(jù)庫(kù)。分布式數(shù)據(jù)庫(kù)在可擴(kuò)展性、高并發(fā)支持方面具有優(yōu)勢(shì),集中式數(shù)據(jù)庫(kù)在事務(wù)性支持上遵循ACID 原則,在事務(wù)支持上具備優(yōu)勢(shì)。從優(yōu)劣勢(shì)看,分布式數(shù)據(jù)庫(kù)的優(yōu)劣勢(shì)與非關(guān)系型數(shù)據(jù)庫(kù)類(lèi)似,而近年來(lái),分布式數(shù)據(jù)庫(kù)不斷發(fā)展,在提供高彈性、支持高并發(fā)的同時(shí),與關(guān)系型數(shù)據(jù)庫(kù)強(qiáng)事務(wù)性支持的特性進(jìn)一步結(jié)合。
圖表35: 集中式數(shù)據(jù)庫(kù) vs 分布式數(shù)據(jù)庫(kù)
磁盤(pán)數(shù)據(jù)庫(kù) vs 內(nèi)存數(shù)據(jù)庫(kù)。根據(jù)存儲(chǔ)設(shè)備分,可以分為磁盤(pán)數(shù)據(jù)庫(kù)、內(nèi)存數(shù)據(jù)庫(kù)。內(nèi)存數(shù)據(jù)庫(kù)指將數(shù)據(jù)放在內(nèi)存中直接操作的數(shù)據(jù)庫(kù),具備讀寫(xiě)速度快的優(yōu)勢(shì)。相比之下,磁盤(pán)數(shù)據(jù)庫(kù)在容量大小、數(shù)據(jù)安全性能方面具有一定的優(yōu)勢(shì)。從內(nèi)存數(shù)據(jù)庫(kù)及磁盤(pán)數(shù)據(jù)庫(kù)的特點(diǎn)看,內(nèi)存數(shù)據(jù)庫(kù)適用于對(duì)讀寫(xiě)要求較高,快速開(kāi)發(fā)的場(chǎng)景。
圖表36: 內(nèi)存數(shù)據(jù)庫(kù) vs 磁盤(pán)數(shù)據(jù)庫(kù)
數(shù)據(jù)庫(kù)技術(shù)架構(gòu)評(píng)判要點(diǎn)與計(jì)算場(chǎng)景、數(shù)據(jù)類(lèi)型相關(guān)。計(jì)算場(chǎng)景的變化、數(shù)據(jù)結(jié)構(gòu)的豐富等,催生出不同的數(shù)據(jù)庫(kù)需求。縱觀數(shù)據(jù)庫(kù)的發(fā)展歷程,我們總結(jié)出了以下幾個(gè)評(píng)判數(shù)據(jù)庫(kù)技術(shù)架構(gòu)的要點(diǎn),不同的場(chǎng)景對(duì)每個(gè)維度的側(cè)重有所不同。
查詢(xún):隨著數(shù)據(jù)類(lèi)型的豐富,傳統(tǒng)的關(guān)系型數(shù)據(jù)庫(kù)難以滿(mǎn)足需求,新興的非關(guān)系型數(shù)據(jù)庫(kù)增加了針對(duì)多種非結(jié)構(gòu)化數(shù)據(jù)類(lèi)型的查詢(xún)方法,數(shù)據(jù)庫(kù)查詢(xún)方式?jīng)Q定了其適用的數(shù)據(jù)類(lèi)型。在數(shù)據(jù)類(lèi)型日益豐富的今天,查詢(xún)方法是評(píng)判數(shù)據(jù)庫(kù)的重要維度。
容量大小&彈性:隨著數(shù)據(jù)量的不斷提升,容量大小和彈性的重要性逐步上升。
(1)容量大小:內(nèi)存數(shù)據(jù)庫(kù)受限于物理內(nèi)存大小,相較于磁盤(pán)數(shù)據(jù)庫(kù)容量上存在劣勢(shì),因此使用場(chǎng)景也相應(yīng)受到限制;
(2)彈性:分布式數(shù)據(jù)庫(kù)支持通過(guò)添加服務(wù)器的橫向擴(kuò)展方式,使數(shù)據(jù)庫(kù)獲得了更高的性能,而傳統(tǒng)的集中式關(guān)系型數(shù)據(jù)庫(kù)支持提升處理器性能的方式縱向擴(kuò)展,相比之下彈性較弱。面對(duì)高并發(fā)的分析型、大數(shù)據(jù)類(lèi)任務(wù),分布式數(shù)據(jù)庫(kù)就體現(xiàn)出一定的優(yōu)勢(shì)。
事務(wù)支持:事務(wù)支持要求具備一致性原則,傳統(tǒng)的關(guān)系型數(shù)據(jù)庫(kù)在事務(wù)支持方面遵循了ACID 原則,包括原子性、一致性、隔離性、持久性,從而實(shí)現(xiàn)較好的事務(wù)支持。非關(guān)系型數(shù)據(jù)庫(kù)在事務(wù)支持方面僅能遵循大部分 BASE 原則,即基本可用、軟狀態(tài)、最終一致性,在事務(wù)支持上相對(duì)較弱。
安全性:數(shù)據(jù)安全性是評(píng)判數(shù)據(jù)庫(kù)的重要維度之一,隨著云計(jì)算、大數(shù)據(jù)等新技術(shù)在數(shù)據(jù)庫(kù)領(lǐng)域逐步應(yīng)用,安全性的概念也不斷延伸,不僅包括容災(zāi)能力,還包括數(shù)據(jù)安全、數(shù)據(jù)協(xié)同的權(quán)限管控等方面。
成本:成本包括硬件成本、軟件成本、運(yùn)維成本等,云數(shù)據(jù)庫(kù)通過(guò)云模式降低了運(yùn)維成本及硬件采購(gòu)成本。此外,隨著分析場(chǎng)景的豐富,在評(píng)判數(shù)據(jù)庫(kù)成本時(shí)應(yīng)該采取動(dòng)態(tài)的視角, 考慮包括彈性擴(kuò)容成本、后續(xù)運(yùn)維成本在內(nèi)的各項(xiàng)成本。
落地情況:中標(biāo)客戶(hù)行業(yè)&應(yīng)用場(chǎng)景
關(guān)注數(shù)據(jù)庫(kù)的落地情況。不同行業(yè)對(duì)數(shù)據(jù)庫(kù)的需求有所區(qū)別,處理事務(wù)的復(fù)雜性、對(duì)安全穩(wěn)定的要求、付費(fèi)意愿均會(huì)產(chǎn)生不同。一般來(lái)說(shuō),金融、電信類(lèi)場(chǎng)景由于處理量大,宕機(jī)代價(jià)較高,因此對(duì)于安全、穩(wěn)定性有較強(qiáng)的訴求,能夠首先在金融、電信類(lèi)場(chǎng)景落地通常意味著在性能、安全等方面達(dá)到了較高的標(biāo)準(zhǔn);因此金融、電信等領(lǐng)域落地情況可以大致作為數(shù)據(jù)庫(kù)安全、穩(wěn)定性的篩選維度之一;此外金融、電信、互聯(lián)網(wǎng)類(lèi)場(chǎng)景往往具備高并發(fā)特征,需要不斷擴(kuò)展,并且往往能夠積累下大量數(shù)據(jù),為分析打下了良好的基礎(chǔ),適合分布式數(shù)據(jù)庫(kù),因此分布式數(shù)據(jù)庫(kù)的選擇可以重點(diǎn)關(guān)注以上行業(yè)的案例。在此之外,能夠積極向其他場(chǎng)景延伸則體現(xiàn)出數(shù)據(jù)庫(kù)產(chǎn)品的延伸性,有助于不斷打開(kāi)新的市場(chǎng)空間。從國(guó)內(nèi)分布式數(shù)據(jù)庫(kù)當(dāng)前的落地情況看,金融、黨政、電信也是目前主要的落地場(chǎng)景,除此之外,互聯(lián)網(wǎng)、電力能源、教育也是重要的落地場(chǎng)景。
圖表37: 代表客戶(hù)及覆蓋行業(yè)
公開(kāi)的人才體系:自營(yíng)培訓(xùn)認(rèn)證體系、企業(yè)技術(shù)級(jí)社區(qū)
公開(kāi)人才體系體現(xiàn)生態(tài)建設(shè)成效。公開(kāi)的人才體系包含自營(yíng)社區(qū)、培訓(xùn)認(rèn)證等部分。數(shù)據(jù)庫(kù)廠商推出培訓(xùn)認(rèn)證,系統(tǒng)的培養(yǎng)廠商數(shù)據(jù)庫(kù)人才,在提升數(shù)據(jù)庫(kù)人才水平的同時(shí)培養(yǎng)了使用者的使用習(xí)慣,有助于生態(tài)的建設(shè)。另一方面,通過(guò)自營(yíng)社區(qū)論壇,能夠提供開(kāi)發(fā)者交流的空間,有助于使用者拓展技術(shù)前沿視野,在提升使用者水平的同時(shí),促進(jìn)技術(shù)生態(tài)發(fā)展,一定程度上社區(qū)論壇的活躍度能夠反映數(shù)據(jù)庫(kù)的生態(tài)建設(shè)成效。
圖表38: 國(guó)產(chǎn)數(shù)據(jù)庫(kù)廠商公開(kāi)人才體系
圖表39: 商用首發(fā)及行業(yè)重要協(xié)議發(fā)布時(shí)間對(duì)比
圖表40: 數(shù)據(jù)庫(kù)比較維度
國(guó)內(nèi)數(shù)據(jù)庫(kù)市場(chǎng):新興與傳統(tǒng)廠商并存
人大金倉(cāng):背靠 CETC 中國(guó)電子科技集團(tuán),老牌數(shù)據(jù)庫(kù)
背靠 CETC 中國(guó)電子科技集團(tuán),擁有三類(lèi)核心產(chǎn)品。人大金倉(cāng)背靠 CETC 中國(guó)電子科技集團(tuán),由中國(guó)人民大學(xué)最早一批從事數(shù)據(jù)庫(kù)研究的專(zhuān)家于 1999 年發(fā)起創(chuàng)立,先后承擔(dān)了國(guó)家“863”、“核高基”等重大專(zhuān)項(xiàng)。人大金倉(cāng)擁有三類(lèi)核心產(chǎn)品,分別為數(shù)據(jù)存儲(chǔ)計(jì)算、數(shù)據(jù)采集交換以及數(shù)據(jù)應(yīng)用分析。其中金倉(cāng)交易型數(shù)據(jù)庫(kù) KingbaseES,是入選國(guó)家自主創(chuàng)新產(chǎn)品目錄的數(shù)據(jù)庫(kù)產(chǎn)品,也是國(guó)家級(jí)、省部級(jí)實(shí)際項(xiàng)目中應(yīng)用較為廣泛的國(guó)產(chǎn)數(shù)據(jù)庫(kù)產(chǎn)品。
圖表41: 人大金倉(cāng)發(fā)展史
分布式數(shù)據(jù)庫(kù)產(chǎn)品 KSOne 具備應(yīng)用透明,支持水平擴(kuò)展等特點(diǎn)。人大金倉(cāng)旗下的 KSOne 是一款面向交易型業(yè)務(wù)場(chǎng)景、實(shí)時(shí)分析場(chǎng)景、時(shí)間序列等場(chǎng)景的 HTAP 分布式數(shù)據(jù)庫(kù)產(chǎn)品, 具有可橫向彈性伸縮、高可用、可跨域分布部署、應(yīng)用透明度高等特點(diǎn)。該產(chǎn)品采用分布式集群架構(gòu),支持水平數(shù)據(jù)分片等智能分片算法。此外,支持并行加載與并行計(jì)算,數(shù)據(jù)導(dǎo)入速度達(dá)到 50GB/分鐘,有助于進(jìn)行實(shí)時(shí)分析。
圖表42: 人大金倉(cāng)數(shù)據(jù)庫(kù)產(chǎn)品
人大金倉(cāng)主要致力于為政務(wù)、能源、國(guó)防、金融、公安、電信等國(guó)家企事業(yè)單位提供解決方案。據(jù)公司官網(wǎng),人大金倉(cāng)為北京市資源中心構(gòu)建大數(shù)據(jù)平臺(tái),面向大數(shù)據(jù)中心用戶(hù)以及委辦局用戶(hù)提供數(shù)據(jù)管理和服務(wù),用戶(hù)可利用北京市大數(shù)據(jù)管理平臺(tái)的能力和服務(wù),開(kāi)展數(shù)據(jù)的管理、處理、分析與可視化等工作,支撐各類(lèi)業(yè)務(wù)應(yīng)用。
圖表43: 人大金倉(cāng)北京市資源中心大數(shù)據(jù)平臺(tái)示意圖
武漢達(dá)夢(mèng):背靠中國(guó)電子,主攻混合型數(shù)據(jù)庫(kù) HTAP
背靠 CEC 中國(guó)電子,主攻混合型數(shù)據(jù)庫(kù) HTAP。武漢達(dá)夢(mèng)成立于 2000 年,為中國(guó)電子信息產(chǎn)業(yè)集團(tuán)(CEC)旗下基礎(chǔ)軟件企業(yè)。應(yīng)用于金融、電力、航空、通信、電子政務(wù)等 30 多個(gè)行業(yè)領(lǐng)域。武漢達(dá)夢(mèng)主攻混合型數(shù)據(jù)庫(kù) HTAP,旨在用一種數(shù)據(jù)庫(kù)模式處理客戶(hù)所有數(shù)據(jù)庫(kù)需求,適合業(yè)務(wù)廣、數(shù)據(jù)量大的綜合型客戶(hù)使用。武漢達(dá)夢(mèng)目前已掌握數(shù)據(jù)管理與數(shù)據(jù)分析領(lǐng)域的核心前沿技術(shù),擁有全部源代碼,具有完全自主知識(shí)產(chǎn)權(quán)。其主要產(chǎn)品有:達(dá)夢(mèng) HTAP 數(shù)據(jù)庫(kù)管理系統(tǒng) DM8、達(dá)夢(mèng)大數(shù)據(jù)集群軟件 DMMPP 等產(chǎn)品。
圖表44: 達(dá)夢(mèng)數(shù)據(jù)庫(kù)產(chǎn)品
達(dá)夢(mèng)主推透明分布式數(shù)據(jù)庫(kù)(DMTDD)技術(shù)。達(dá)夢(mèng)提出的?DMTDD?技術(shù)包括靈活橫向擴(kuò)展、完整的 SQL?特性支持、多副本數(shù)據(jù)異地容災(zāi)的特點(diǎn)。結(jié)合了分布式數(shù)據(jù)庫(kù)高可擴(kuò)展、高可用、高并發(fā)處理能力,并支持傳統(tǒng)數(shù)據(jù)庫(kù)開(kāi)發(fā)接口和業(yè)務(wù)開(kāi)發(fā)框架的技術(shù)架構(gòu)。
(1)靈活橫向擴(kuò)展:DM8?TDD?采用計(jì)算存儲(chǔ)分離的系統(tǒng)架構(gòu),實(shí)現(xiàn)計(jì)算、日志、存儲(chǔ)三層分離,可實(shí)現(xiàn)各層獨(dú)立擴(kuò)展、按需配置設(shè)備的特點(diǎn)。
(2)完整的 SQL?特性支持:支持多表連接查詢(xún)、子查詢(xún)、視圖嵌套查詢(xún)、遞歸表達(dá)式查詢(xún)等高級(jí)查詢(xún)語(yǔ)法。提供存儲(chǔ)過(guò)程、觸發(fā)器、Package、序列等高級(jí)功能特性。
(3)多副本數(shù)據(jù)異地容災(zāi):支持異地部署,通過(guò)將數(shù)據(jù)副本存儲(chǔ)在不同的容災(zāi)域,實(shí)現(xiàn)數(shù) ??據(jù)的異地容災(zāi)。日志服務(wù)本身具備副本與容災(zāi)能力,可在每個(gè)數(shù)據(jù)中心分別部署日志服務(wù)節(jié)點(diǎn)。數(shù)據(jù)庫(kù)服務(wù)在主機(jī)房按需部署,在本地和異地備用機(jī)房日常無(wú)需部署,只需在檢測(cè)到災(zāi)害時(shí),即時(shí)啟動(dòng)。
圖表45: 達(dá)夢(mèng)透明分布式數(shù)據(jù)庫(kù)(DMTDD)
為解決能源行業(yè)神華集團(tuán)加強(qiáng)集中管控能力、解決信息孤島問(wèn)題、提升跨區(qū)交互能力、進(jìn)行復(fù)雜統(tǒng)計(jì)、提高應(yīng)用型容災(zāi)的需求,武漢達(dá)夢(mèng)使用 DM7 數(shù)據(jù)庫(kù)管理系統(tǒng)以及相關(guān)數(shù)據(jù)集群、DMETL 組件、DMHS 同步套件等產(chǎn)品、DMHS 數(shù)據(jù)同步工具,從而保證業(yè)務(wù)系統(tǒng)的連續(xù)性和跨站點(diǎn)的高可用性。此外,據(jù)公司官網(wǎng),神華集團(tuán)數(shù)據(jù)庫(kù)工程使用普通 PC SERVER 的達(dá)夢(mèng)數(shù)據(jù)庫(kù)服務(wù)器成功替換 Oracle 一體機(jī),降低用戶(hù)成本。同時(shí),達(dá)夢(mèng)采用現(xiàn)有設(shè)備創(chuàng)建同城容災(zāi)系統(tǒng),保障系統(tǒng)穩(wěn)定運(yùn)行。
圖表46: 達(dá)夢(mèng)能源行業(yè)解決方案示意圖
巨杉數(shù)據(jù)庫(kù):自研金融級(jí)分布式數(shù)據(jù)庫(kù)獨(dú)立廠商
巨杉數(shù)據(jù)庫(kù)成立于 2011 年,是一家專(zhuān)注分布式數(shù)據(jù)庫(kù)技術(shù)研發(fā)的自研數(shù)據(jù)庫(kù)獨(dú)立廠商。針對(duì)市場(chǎng)對(duì)業(yè)務(wù)中臺(tái)、微服務(wù)架構(gòu)、非結(jié)構(gòu)數(shù)據(jù)管理、敏捷開(kāi)發(fā)的不同需求,SequoiaDB 巨杉數(shù)據(jù)庫(kù)已推出:DP(湖倉(cāng)一體數(shù)據(jù)平臺(tái))、TP(事務(wù)型數(shù)據(jù)庫(kù))、CM(內(nèi)容管理數(shù)據(jù)庫(kù)) 和 DOC(文檔型數(shù)據(jù)庫(kù))四大產(chǎn)品線(xiàn)。
企業(yè)基因:從商用首發(fā)時(shí)間看,巨杉數(shù)據(jù)庫(kù)是國(guó)內(nèi)最早進(jìn)行商業(yè)化布局的分布式數(shù)據(jù)庫(kù)。2011 年,SequoiaDB 巨杉數(shù)據(jù)庫(kù)作為獨(dú)立數(shù)據(jù)庫(kù)公司開(kāi)始研發(fā),進(jìn)行原生分布式架構(gòu)布局。2013 年 SequoiaDB v1.0 產(chǎn)品化正式商用并進(jìn)軍企業(yè)級(jí)領(lǐng)域,開(kāi)始為客戶(hù)提供產(chǎn)品及技術(shù)服務(wù)支持。
商業(yè)模式:打造企業(yè)級(jí)產(chǎn)品標(biāo)桿。銀行業(yè)是體現(xiàn)數(shù)據(jù)庫(kù)產(chǎn)品能力的標(biāo)桿行業(yè),據(jù)賽迪顧問(wèn),2019 年中國(guó)金融 IT 市場(chǎng)規(guī)模中,銀行 IT 占據(jù)了 50%以上的市場(chǎng)份額。一家銀行歷經(jīng)了幾十年的法律和業(yè)務(wù)規(guī)則的演進(jìn),通常擁有超過(guò)上百種的業(yè)務(wù)系統(tǒng)。因此業(yè)界公認(rèn),在選擇技術(shù)產(chǎn)品的過(guò)程中,銀行對(duì)于數(shù)據(jù)穩(wěn)定性、安全性和數(shù)據(jù)處理性能等企業(yè)級(jí)功能,要求是最為嚴(yán)苛的。銀行作為企業(yè)級(jí)產(chǎn)品應(yīng)用的標(biāo)桿行業(yè),能被其采用的產(chǎn)品均達(dá)到了金融級(jí)產(chǎn)品的最高標(biāo)準(zhǔn),自然更能夠滿(mǎn)足其他行業(yè)的要求。
巨杉采用企業(yè)級(jí)服務(wù)的商業(yè)化策略,對(duì)于重視穩(wěn)定性的基礎(chǔ)軟件數(shù)據(jù)庫(kù)而言,相較于開(kāi)源模式在版本迭代的穩(wěn)定性上具有更符合企業(yè)運(yùn)行標(biāo)準(zhǔn)的競(jìng)爭(zhēng)優(yōu)勢(shì)。借此,巨杉數(shù)據(jù)庫(kù)不斷向金融等關(guān)鍵行業(yè)拓展。自 2014 年首次進(jìn)入金融行業(yè)以來(lái),已經(jīng)在國(guó)內(nèi)金融行業(yè)進(jìn)行了大規(guī)模的實(shí)踐與使用,應(yīng)用場(chǎng)景也覆蓋了聯(lián)機(jī)交易、數(shù)據(jù)中臺(tái)、內(nèi)容管理以及實(shí)時(shí)數(shù)據(jù)服務(wù)等多類(lèi)業(yè)務(wù)。
圖表47: 巨杉數(shù)據(jù)庫(kù)發(fā)展歷程
自研內(nèi)核:自研內(nèi)核具有領(lǐng)先性。巨杉數(shù)據(jù)庫(kù)堅(jiān)持從零開(kāi)始打造原生分布式數(shù)據(jù)庫(kù)引擎, 專(zhuān)注數(shù)據(jù)庫(kù)技術(shù)研發(fā),聚焦金融賽道,致力于以金融行業(yè)為核心,打造安全可靠、高性能, 適合全行業(yè)通用的分布式數(shù)據(jù)庫(kù)產(chǎn)品。基于分布式技術(shù)架構(gòu),研發(fā)出引擎級(jí)多模及 STP 邏輯時(shí)鐘協(xié)議分布式數(shù)據(jù)庫(kù)技術(shù),能夠?qū)崿F(xiàn)分布式交易與 ACID 與傳統(tǒng)技術(shù)完全兼容,架構(gòu)及功能特性與傳統(tǒng)數(shù)據(jù)庫(kù)完全兼容,提供跨引擎事務(wù)支持和一致性保障。基于多副本隔離機(jī)制,其 HTAP 混合負(fù)載能力能夠?qū)崿F(xiàn)計(jì)算、I/O 資源互不干擾的OLTP/OLAP 混合負(fù)載管理, 充分釋放資源,進(jìn)一步提升系統(tǒng)穩(wěn)定性。巨杉數(shù)據(jù)庫(kù)支持多種級(jí)別的容災(zāi)部署形態(tài),如同城雙中心、同城三中心、兩地三中心甚至三地五中心等,獨(dú)創(chuàng)四級(jí)熔斷容災(zāi)安全保護(hù)機(jī)制, 充分保證數(shù)據(jù)安全,滿(mǎn)足核心交易業(yè)務(wù)的嚴(yán)苛要求。
圖表48: 巨杉數(shù)據(jù)庫(kù)架構(gòu)
客戶(hù):巨杉主要為金融業(yè)提供數(shù)據(jù)庫(kù)產(chǎn)品。巨杉數(shù)據(jù)庫(kù)具備豐富的服務(wù)大型企業(yè)的解決方案和經(jīng)驗(yàn),據(jù)公司官網(wǎng),巨杉數(shù)據(jù)庫(kù)已在超過(guò) 100?家大型銀行及金融機(jī)構(gòu)的生產(chǎn)業(yè)務(wù)規(guī)模上線(xiàn)應(yīng)用。其中民生銀行的生產(chǎn)環(huán)境集群包含超過(guò) 160?臺(tái)物理服務(wù)器,三副本數(shù)據(jù)量達(dá)2460TB,基于巨杉數(shù)據(jù)庫(kù)實(shí)現(xiàn)的非結(jié)構(gòu)化數(shù)據(jù)管理平臺(tái)已接入的各類(lèi)系統(tǒng)達(dá)到 100 套。
圖表49: 巨杉數(shù)據(jù)庫(kù)在民生銀行的應(yīng)用架構(gòu)
同時(shí),巨杉數(shù)據(jù)庫(kù)的應(yīng)用范圍已擴(kuò)展至證券、保險(xiǎn)、電信、政府、能源、互聯(lián)網(wǎng)、交通等多個(gè)行業(yè)。據(jù)公司官網(wǎng),目前,巨杉數(shù)據(jù)庫(kù)的企業(yè)用戶(hù)總數(shù)超過(guò) 1000 家。目前,巨杉數(shù)據(jù)庫(kù)支持超過(guò) 4096 節(jié)點(diǎn),超 10PB 級(jí)別存儲(chǔ)容量,已成功協(xié)助客戶(hù)在高達(dá) 1.2 萬(wàn)億數(shù)據(jù)量生產(chǎn)環(huán)境下,提供安全穩(wěn)定、可靈活擴(kuò)展、高性能、高并發(fā)的數(shù)據(jù)底座。
圖表50: 巨杉數(shù)據(jù)庫(kù)主要客戶(hù)
生態(tài):助力技術(shù)生態(tài)體系建設(shè)。巨杉數(shù)據(jù)庫(kù)積極參與信創(chuàng)生態(tài)建設(shè),據(jù) 2021?年信創(chuàng)產(chǎn)業(yè)技術(shù)與應(yīng)用大會(huì),截至 2021?年 3?月,巨杉已經(jīng)與鯤鵬、飛騰、統(tǒng)信、銀河麒麟等產(chǎn)品完成兼容認(rèn)證,合作伙伴總數(shù)超 50 家,為企業(yè)客戶(hù)打開(kāi)豐富的上下游產(chǎn)品生態(tài)。
2019 年,巨杉數(shù)據(jù)庫(kù)搭建「巨杉大學(xué)」認(rèn)證與學(xué)習(xí)體系,講師團(tuán)隊(duì)由巨杉數(shù)據(jù)庫(kù)官方的數(shù)據(jù)庫(kù)架構(gòu)師、資深分布式技術(shù)專(zhuān)家以及開(kāi)源社區(qū)技術(shù)大咖共同組成。目前,已有超 180 家金融機(jī)構(gòu),30 余家知名技術(shù)服務(wù)開(kāi)發(fā)商參加巨杉大學(xué)計(jì)劃。截至 2020 年底,經(jīng)過(guò)短短 1年的發(fā)展,巨杉大學(xué)已認(rèn)證工程師超過(guò) 1 萬(wàn)人,網(wǎng)站用戶(hù)注冊(cè)數(shù)量超過(guò) 5 萬(wàn)人,為分布式技術(shù)業(yè)界發(fā)展提供堅(jiān)實(shí)的人才積淀。
PingCAP TiDB:開(kāi)源分布式關(guān)系型數(shù)據(jù)庫(kù)
建立以分布式數(shù)據(jù)庫(kù)為統(tǒng)一中心的架構(gòu)。TiDB 是 PingCAP 公司自主設(shè)計(jì)、研發(fā)的開(kāi)源分布式關(guān)系型數(shù)據(jù)庫(kù),是一款同時(shí)支持在線(xiàn)事務(wù)處理與在線(xiàn)分析處理的融合型分布式數(shù)據(jù)庫(kù)產(chǎn)品。2015 年 9月,借鑒 Google Spanner 及 F1 論文的實(shí)現(xiàn),TiDB 在 Github 上開(kāi)源,從僅有 SQL 層及 KV 層的 beta 版本到現(xiàn)在已經(jīng)衍生出龐大家族的 4.0 版本,始終圍繞著解決分庫(kù)分表問(wèn)題,為用戶(hù)提供一站式 OLTP、OLAP、HTAP 解決方案的目標(biāo)演進(jìn)。在內(nèi)核設(shè)計(jì)上,TiDB 分布式數(shù)據(jù)庫(kù)將整體架構(gòu)拆分成了多個(gè)模塊,各模塊之間互相通信,組成完整的 TiDB 系統(tǒng)。與傳統(tǒng)的單機(jī)數(shù)據(jù)庫(kù)相比,TiDB 的純分布式架構(gòu)擁有良好的擴(kuò)展性且具有豐富的工具鏈生態(tài),覆蓋數(shù)據(jù)遷移、同步、備份等多種場(chǎng)景。
圖表51: TiDB 整體架構(gòu)圖
多應(yīng)用場(chǎng)景,適合不同業(yè)務(wù)需求。依托純分布式架構(gòu),及開(kāi)源社區(qū),TiDB 持續(xù)擴(kuò)展出豐富的應(yīng)用場(chǎng)景。一是對(duì)數(shù)據(jù)一致性及高可靠、系統(tǒng)高可用、可擴(kuò)展性、容災(zāi)要求較高的金融行業(yè)屬性的場(chǎng)景,TiDB?采用多副本+Multi-Raft?協(xié)議的方式將數(shù)據(jù)調(diào)度到不同的機(jī)房、機(jī)架、機(jī)器,當(dāng)部分機(jī)器出現(xiàn)故障時(shí)系統(tǒng)可自動(dòng)進(jìn)行切換;二是對(duì)存儲(chǔ)容量、可擴(kuò)展性、并發(fā)要求較高的海量數(shù)據(jù)及高并發(fā)的 OLTP 場(chǎng)景,TiDB 采用計(jì)算、存儲(chǔ)分離的架構(gòu),可對(duì)計(jì)算、存儲(chǔ)分別進(jìn)行擴(kuò)容和縮容,計(jì)算最大支持 512 節(jié)點(diǎn),每個(gè)節(jié)點(diǎn)最大支持 1000 并發(fā),集群容量最大支持PB?級(jí)別;三是Real-time?HTAP?場(chǎng)景,TiDB?在4.0?版本中引入列存儲(chǔ)引擎TiFlash結(jié)合行存儲(chǔ)引擎 TiKV 構(gòu)建真正的 HTAP 數(shù)據(jù)庫(kù),在增加少量存儲(chǔ)成本的情況下,可以同一個(gè)系統(tǒng)中做聯(lián)機(jī)交易處理、實(shí)時(shí)數(shù)據(jù)分析,極大地節(jié)省企業(yè)的成本;四是數(shù)據(jù)匯聚、二次加工處理的場(chǎng)景,TiDB 通過(guò) ETL 工具或者 TiDB 的同步工具將數(shù)據(jù)同步到 TiDB,在 TiDB 中直接生成報(bào)表,便于將分散在不同系統(tǒng)中的數(shù)據(jù)匯總,以便決策層了解公司的整體業(yè)務(wù)狀況及時(shí)做出決策。
“開(kāi)源社區(qū)”助力“開(kāi)源商業(yè)化”。PingCAP 擁有豐富的開(kāi)源技術(shù)社區(qū)活動(dòng),依托開(kāi)源社區(qū), 在自身快速發(fā)展過(guò)程中不斷回饋社區(qū),形成開(kāi)源社區(qū)和自身研發(fā)的有效協(xié)同。通過(guò)開(kāi)源及免費(fèi)策略,快速擴(kuò)展開(kāi)發(fā)者及技術(shù)粉絲用戶(hù)群體,以長(zhǎng)期積累未來(lái)商業(yè)變現(xiàn)的機(jī)會(huì)。據(jù)GitHub,截至?2021?年?3?月,TiDB??項(xiàng)目在?GitHub??上已總計(jì)獲得超過(guò)?27000??顆星,超?4200位開(kāi)源代碼貢獻(xiàn)者,參與企業(yè)包括美團(tuán)、知乎、小米、微眾銀行等眾多企業(yè),高度活躍的開(kāi)源社區(qū)為 TiDB 產(chǎn)品發(fā)展帶來(lái)了正向反饋閉環(huán)。在此基礎(chǔ)上,TiDB 已被廣泛應(yīng)用于互聯(lián)網(wǎng)、游戲、金融、大型企業(yè)、政府等多領(lǐng)域的領(lǐng)先企業(yè)的實(shí)際生產(chǎn)環(huán)境中,當(dāng)中還包括多個(gè)國(guó)外不同地區(qū)的用戶(hù)。
圖表52: TiDB 國(guó)內(nèi)主要用戶(hù)
阿里 Oceanbase:金融級(jí)分布式關(guān)系數(shù)據(jù)庫(kù)
發(fā)端于阿里內(nèi)部,逐步商業(yè)化。OceanBase 是由螞蟻金服、阿里巴巴完全自主研發(fā)的分布式關(guān)系型數(shù)據(jù)庫(kù),始創(chuàng)于 2010 年。應(yīng)用于支付寶全部核心業(yè)務(wù)以及阿里巴巴淘寶業(yè)務(wù)。從2017 年開(kāi)始,開(kāi)始服務(wù)外部客戶(hù)。2020 年 6 月 8 日,螞蟻集團(tuán)將自研數(shù)據(jù)庫(kù)產(chǎn)品 OceanBase 獨(dú)立進(jìn)行公司化運(yùn)作,同年 9 月,中國(guó)工商銀行開(kāi)始采用螞蟻?zhàn)匝袛?shù)據(jù)庫(kù) OceanBase,其對(duì)公(法人)理財(cái)系統(tǒng)已完成從大型主機(jī)到 OceanBase 分布式架構(gòu)的改造。Oceanbase 商業(yè)化逐步推進(jìn)。
圖表53: Oceanbase 發(fā)展歷程
OceanBase 是一個(gè)金融級(jí)分布式關(guān)系數(shù)據(jù)庫(kù)。具備在線(xiàn)水平擴(kuò)展能力;GeaBase 是一款針對(duì)特殊巨型復(fù)雜網(wǎng)絡(luò)、超大實(shí)時(shí)更新數(shù)據(jù)場(chǎng)景的分布式實(shí)時(shí)圖數(shù)據(jù)庫(kù)產(chǎn)品,擁有簡(jiǎn)單易用、性能高的特點(diǎn)。該產(chǎn)品定位是一款分布式關(guān)系數(shù)據(jù)庫(kù),適合于金融、證券等涉及交易、支付和賬務(wù)等對(duì)高可用、強(qiáng)一致要求較高,同時(shí)對(duì)性能、成本和擴(kuò)展性有需求的金融屬性場(chǎng)景,以及各種關(guān)系型結(jié)構(gòu)化存儲(chǔ)的 OLTP 應(yīng)用。
圖表54: Oceanbase 架構(gòu)
Oceanbase?主要客戶(hù)包括網(wǎng)商銀行、支付寶、淘寶網(wǎng)、阿里媽媽。其中,為了解決支付寶一致性、擴(kuò)展性、可用性、成本性能方面的業(yè)務(wù)挑戰(zhàn),OceanBase?在架構(gòu)層面引入 Paxos 協(xié)議,多重?cái)?shù)據(jù)校驗(yàn)機(jī)制,完善支付寶業(yè)務(wù)模型,多重機(jī)制保障金融級(jí)別的一致性。此外,支付寶的訂單型業(yè)務(wù)采用了"同城三中心"的部署方式,具備單機(jī)和單 IDC?故障的容災(zāi),通過(guò) RFO?的方式提供異地容災(zāi)能力,在性能和可用性方面做到了極致的權(quán)衡。賬務(wù)型業(yè)務(wù)采用"三地五中心"部署方式,除了具備單機(jī),單 IDC?的容災(zāi)能力,還具備城市級(jí)故障自動(dòng)容災(zāi)能力。據(jù)公司官網(wǎng),OceanBase?在同城容災(zāi)和異地容災(zāi)場(chǎng)景下,RPO=0,RTO<30??秒。
圖表55: Oceanbase 主要客戶(hù)
華為 GaussDB:AI 原生,支持異構(gòu)計(jì)算
AI 原生&支持異構(gòu)計(jì)算。華為 GaussDB 是一個(gè)企業(yè)級(jí) AI-Native 分布式數(shù)據(jù)庫(kù)。為超大規(guī)模數(shù)據(jù)管理提供高性?xún)r(jià)比的通用計(jì)算平臺(tái),也用于支撐各類(lèi)數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)、BI(Business Intelligence)系統(tǒng)和決策支持系統(tǒng),為上層應(yīng)用的決策分析提供服務(wù)。華為的數(shù)據(jù)庫(kù)產(chǎn)品系列命名為:GaussDB,高斯數(shù)據(jù)庫(kù)。華為 GaussDB 是一個(gè)企業(yè)級(jí) AI-Native 分布式數(shù)據(jù)庫(kù)。 GaussDB 采用 MPP(Massive Parallel Processing)架構(gòu),支持行存儲(chǔ)與列存儲(chǔ),提供 PB(Petabyte, 2 的 50 次方字節(jié))級(jí)別數(shù)據(jù)量的處理能力。華為 Gauss 數(shù)據(jù)庫(kù)是全球首款 AI-Native 數(shù)據(jù)庫(kù),能夠同時(shí)支持 X86、ARM、GPU、 NPU 等異構(gòu)計(jì)算。
圖表56: GaussDB 產(chǎn)品
GaussDB:三大產(chǎn)品線(xiàn)系列。據(jù)華為官網(wǎng),目前華為已經(jīng)開(kāi)發(fā)有三個(gè)產(chǎn)品系列:GaussDB100、 GaussDB 200、 GaussDB 300。 1) GaussDB 100:主要以 OLTP 為主。目前該產(chǎn)品已經(jīng)應(yīng)用在招商銀行。 2) GaussDB 200:以 OLAP 為主,兼顧 OATP。該產(chǎn)品目前已經(jīng)在工商銀行得到上線(xiàn)應(yīng)用。 3) GaussDB300:HTAP,是企業(yè)級(jí)分布式HTAP 數(shù)據(jù)庫(kù)(Hybrid Transaction andAnalytical Process,混合事務(wù)和分析處理)。
圖表57: Gauss 數(shù)據(jù)庫(kù)產(chǎn)品線(xiàn)
華為 GaussDB 產(chǎn)品主要用于互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、電商、金融、游戲。在電商應(yīng)用中,數(shù)據(jù)庫(kù)可支持熱銷(xiāo)商品展示、秒殺推薦等數(shù)據(jù)面臨高并發(fā)壓力的場(chǎng)景。此外,云數(shù)據(jù)庫(kù)兼容 Redis 生態(tài),高并發(fā)分布式緩存服務(wù) Redis 提供超過(guò) 10 萬(wàn)的高 QPS,輕松應(yīng)對(duì)高并發(fā)訪問(wèn),業(yè)務(wù)爆發(fā)時(shí)可以通過(guò)一鍵擴(kuò)容,滿(mǎn)足秒殺場(chǎng)景下的訪問(wèn)量增長(zhǎng)產(chǎn)生的計(jì)算需求。
圖表58: Gauss 電商類(lèi)應(yīng)用架構(gòu)示意圖
總結(jié):分布式數(shù)據(jù)庫(kù)或誕生新龍頭,關(guān)注六大評(píng)判維度
1、數(shù)據(jù)量增大、類(lèi)型豐富、計(jì)算場(chǎng)景擴(kuò)展,分布式數(shù)據(jù)庫(kù)或成為新的增量
數(shù)據(jù)庫(kù)行業(yè)發(fā)展與計(jì)算載體變革緊密相關(guān),而隨著計(jì)算載體的變革,在新市場(chǎng)內(nèi)往往會(huì)誕生新的數(shù)據(jù)庫(kù)龍頭。從發(fā)展變革看,大型機(jī)向小型機(jī)的變革,數(shù)據(jù)庫(kù)在事務(wù)處理中的應(yīng)用逐步增加,催生了 Oracle 為代表的關(guān)系型數(shù)據(jù)庫(kù)廠商;隨著云計(jì)算的興起,以 AWS 為代表的新興數(shù)據(jù)庫(kù)廠商逐步興起。
分布式數(shù)據(jù)庫(kù)或成為新的增量。隨著數(shù)據(jù)的累積,分析型任務(wù)的重要性逐步提升,擅長(zhǎng)于事務(wù)支持、結(jié)構(gòu)化數(shù)據(jù)查詢(xún)的傳統(tǒng)關(guān)系型數(shù)據(jù)庫(kù)市場(chǎng)增長(zhǎng)逐漸放緩,據(jù) T4.ai 預(yù)測(cè),全球關(guān)系型數(shù)據(jù)庫(kù)市場(chǎng)規(guī)模 2018-2022E?CAGR?為 6%,較 2012-2017?的 11%或?qū)⒂兴陆怠A硪环矫?#xff0c;數(shù)據(jù)類(lèi)型持續(xù)豐富,從結(jié)構(gòu)化數(shù)據(jù)向非結(jié)構(gòu)化數(shù)據(jù)延伸,支持非結(jié)構(gòu)化數(shù)據(jù)的查詢(xún)方法變得日益重要。而分布式數(shù)據(jù)庫(kù)、數(shù)據(jù)倉(cāng)庫(kù)在大數(shù)據(jù)分析中展現(xiàn)出了較好的支持性, 綜上,我們認(rèn)為分布式數(shù)據(jù)庫(kù)或成為數(shù)據(jù)庫(kù)領(lǐng)域新增量。
2、商業(yè)模式:企業(yè)級(jí)服務(wù)&開(kāi)源社區(qū),核心在于解決客戶(hù)的問(wèn)題
數(shù)據(jù)庫(kù)作為基礎(chǔ)軟件,在 IT 架構(gòu)中扮演承上啟下的重要作用,因此相比于功能的快速更新, 數(shù)據(jù)庫(kù)的安全與穩(wěn)定性更為重要。開(kāi)源社區(qū)有助于快速積累用戶(hù),但企業(yè)級(jí)產(chǎn)品通過(guò)更加緊密的組織方式,保障了開(kāi)發(fā)者的響應(yīng)速度,在提供企業(yè)級(jí)服務(wù)方面具有優(yōu)勢(shì)。
3、內(nèi)核基礎(chǔ):自主研發(fā)能力重要性上升
原廠自研在穩(wěn)定性上具備優(yōu)勢(shì)。原廠自研的數(shù)據(jù)庫(kù)廠商能夠提供企業(yè)級(jí)原廠服務(wù),相比于提供第三方服務(wù)的廠商,更有助于從源頭解決問(wèn)題,在安全性和穩(wěn)定性上具備優(yōu)勢(shì);在功能的迭代上,掌握源代碼的自研廠商能夠主導(dǎo)功能的迭代,相較于開(kāi)源社區(qū),在穩(wěn)定性上更有優(yōu)勢(shì),與企業(yè)級(jí)客戶(hù)的需求更為契合。
我們總結(jié)了評(píng)判數(shù)據(jù)庫(kù)的六個(gè)維度,除了上文提到的商業(yè)架構(gòu)、內(nèi)核基礎(chǔ)外,還包括品牌基因、技術(shù)架構(gòu)、商業(yè)落地、人才體系
(1)品牌基因:影響技術(shù)路線(xiàn)、側(cè)重領(lǐng)域、應(yīng)用場(chǎng)景等。包含品牌的背景,商用首發(fā)時(shí)間,資金背景,創(chuàng)始團(tuán)隊(duì)背景、廠商主營(yíng)業(yè)務(wù)等。品牌基因反映出數(shù)據(jù)庫(kù)的品牌特性,品牌基因?qū)?shù)據(jù)庫(kù)的技術(shù)路線(xiàn)、側(cè)重領(lǐng)域、應(yīng)用場(chǎng)景均會(huì)產(chǎn)生一定的影響,在選擇數(shù)據(jù)庫(kù)廠商時(shí), 品牌基因是重要的考量因素。我們認(rèn)為,國(guó)產(chǎn)數(shù)據(jù)庫(kù)廠商大致可以分為傳統(tǒng)數(shù)據(jù)庫(kù)、創(chuàng)新品牌、大廠子產(chǎn)品三類(lèi),不同類(lèi)廠商的優(yōu)勢(shì)領(lǐng)域有所區(qū)別。
(2)技術(shù)架構(gòu):分析型、大數(shù)據(jù)場(chǎng)景適合分布式數(shù)據(jù)庫(kù)。集中式數(shù)據(jù)庫(kù)在事務(wù)性支持上遵循 ACID?原則,在事務(wù)支持上具備優(yōu)勢(shì)。分布式數(shù)據(jù)庫(kù)在高并發(fā)支持、擴(kuò)展性上具備優(yōu)勢(shì)。而近年來(lái),分布式數(shù)據(jù)庫(kù)不斷發(fā)展,在提供高彈性、支持高并發(fā)的同時(shí),與關(guān)系型數(shù)據(jù)庫(kù)強(qiáng)事務(wù)性支持的特性進(jìn)一步結(jié)合。
(3)商業(yè)落地:金融、電信場(chǎng)景體現(xiàn)穩(wěn)定性。一般來(lái)說(shuō),金融、電信類(lèi)場(chǎng)景對(duì)于安全、穩(wěn)定性有較強(qiáng)的訴求,能夠首先在金融、電信類(lèi)場(chǎng)景落地通常意味著在性能、安全等方面達(dá)到了較高的標(biāo)準(zhǔn);因此金融、電信領(lǐng)域落地情況可以大致作為數(shù)據(jù)庫(kù)安全、穩(wěn)定性的篩選維度之一;此外能夠積極向其他場(chǎng)景延伸則體現(xiàn)出數(shù)據(jù)庫(kù)產(chǎn)品的延伸性,有助于不斷打開(kāi)新的市場(chǎng)空間。
(4)人才體系:體現(xiàn)生態(tài)建設(shè)成效。公開(kāi)的人才體系包含自營(yíng)社區(qū)、培訓(xùn)認(rèn)證體系等部分。我們認(rèn)為,數(shù)據(jù)庫(kù)廠商通過(guò)推出針對(duì)自由數(shù)據(jù)庫(kù)產(chǎn)品的培訓(xùn)認(rèn)證,在提升數(shù)據(jù)庫(kù)人才水平的同時(shí)培養(yǎng)了使用者的使用習(xí)慣,有助于生態(tài)的建設(shè)。另一方面,社區(qū)論壇作為技術(shù)愛(ài)好者的交流空間,從側(cè)面體現(xiàn)出數(shù)據(jù)庫(kù)產(chǎn)品的活躍度,是生態(tài)建設(shè)成效的體現(xiàn)。
風(fēng)險(xiǎn)提示
市場(chǎng)競(jìng)爭(zhēng)加劇風(fēng)險(xiǎn)。分布式數(shù)據(jù)庫(kù)快速發(fā)展,但參與者眾多,存在競(jìng)爭(zhēng)加劇的風(fēng)險(xiǎn)。
芯片及 AI 行業(yè)發(fā)展導(dǎo)致 IT 投資傾斜風(fēng)險(xiǎn)。隨著芯片及 AI 行業(yè)迅速發(fā)展,存在 IT 投資向芯片、AI 領(lǐng)域傾斜,對(duì)數(shù)據(jù)庫(kù)領(lǐng)域投資產(chǎn)生影響的風(fēng)險(xiǎn)。
免責(zé)聲明
分析師聲明
本人,謝春生、郭雅麗,茲證明本報(bào)告所表達(dá)的觀點(diǎn)準(zhǔn)確地反映了分析師對(duì)標(biāo)的證券或發(fā)行人的個(gè)人意見(jiàn);彼以往、現(xiàn)在或未來(lái)并無(wú)就其研究報(bào)告所提供的具體建議或所表迖的意見(jiàn)直接或間接收取任何報(bào)酬。
一般聲明及披露
本報(bào)告由華泰證券股份有限公司(已具備中國(guó)證監(jiān)會(huì)批準(zhǔn)的證券投資咨詢(xún)業(yè)務(wù)資格,以下簡(jiǎn)稱(chēng)“本公司”)制作。本報(bào)告所載資料是僅供接收人的嚴(yán)格保密資料。本報(bào)告僅供本公司及其客戶(hù)和其關(guān)聯(lián)機(jī)構(gòu)使用。本公司不因接收人收到本報(bào)告而視其為客戶(hù)。
本報(bào)告基于本公司認(rèn)為可靠的、已公開(kāi)的信息編制,但本公司及其關(guān)聯(lián)機(jī)構(gòu)(以下統(tǒng)稱(chēng)為“華泰”)對(duì)該等信息的準(zhǔn)確性及完整性不作任何保證。
本報(bào)告所載的意見(jiàn)、評(píng)估及預(yù)測(cè)僅反映報(bào)告發(fā)布當(dāng)日的觀點(diǎn)和判斷。在不同時(shí)期,華泰可能會(huì)發(fā)出與本報(bào)告所載意見(jiàn)、評(píng)估及預(yù)測(cè)不一致的研究報(bào)告。同時(shí),本報(bào)告所指的證券或投資標(biāo)的的價(jià)格、價(jià)值及投資收入可能會(huì)波動(dòng)。以往表現(xiàn)并不能指引未來(lái),未來(lái)回報(bào)并不能得到保證,并存在損失本金的可能。華泰不保證本報(bào)告所含信息保持在最新?tīng)顟B(tài)。華泰對(duì)本報(bào)告所含信息可在不發(fā)出通知的情形下做出修改,投資者應(yīng)當(dāng)自行關(guān)注相應(yīng)的更新或修改。
本公司不是 FINRA 的注冊(cè)會(huì)員,其研究分析師亦沒(méi)有注冊(cè)為 FINRA 的研究分析師/不具有 FINRA 分析師的注冊(cè)資格。
華泰力求報(bào)告內(nèi)容客觀、公正,但本報(bào)告所載的觀點(diǎn)、結(jié)論和建議僅供參考,不構(gòu)成購(gòu)買(mǎi)或出售所述證券的要約或招攬。該等觀點(diǎn)、建議并未考慮到個(gè)別投資者的具體投資目的、財(cái)務(wù)狀況以及特定需求,在任何時(shí)候均不構(gòu)成對(duì)客戶(hù)私人投資建議。投資者應(yīng)當(dāng)充分考慮自身特定狀況,并完整理解和使用本報(bào)告內(nèi)容,不應(yīng)視本報(bào)告為做出投資決策的唯一因素。對(duì)依據(jù)或者使用本報(bào)告所造成的一切后果,華泰及作者均不承擔(dān)任何法律責(zé)任。任何形式的分享證券投資收益或者分擔(dān)證券投資損失的書(shū)面或口頭承諾均為無(wú)效。
除非另行說(shuō)明,本報(bào)告中所引用的關(guān)于業(yè)績(jī)的數(shù)據(jù)代表過(guò)往表現(xiàn),過(guò)往的業(yè)績(jī)表現(xiàn)不應(yīng)作為日后回報(bào)的預(yù)示。華泰不承諾也不保證任何預(yù)示的回報(bào)會(huì)得以實(shí)現(xiàn),分析中所做的預(yù)測(cè)可能是基于相應(yīng)的假設(shè),任何假設(shè)的變化可能會(huì)顯著影響所預(yù)測(cè)的回報(bào)。
華泰及作者在自身所知情的范圍內(nèi),與本報(bào)告所指的證券或投資標(biāo)的不存在法律禁止的利害關(guān)系。在法律許可的情況下,華泰可能會(huì)持有報(bào)告中提到的公司所發(fā)行的證券頭寸并進(jìn)行交易,為該公司提供投資銀行、財(cái)務(wù)顧問(wèn)或者金融產(chǎn)品等相關(guān)服務(wù)或向該公司招攬業(yè)務(wù)。
華泰的銷(xiāo)售人員、交易人員或其他專(zhuān)業(yè)人士可能會(huì)依據(jù)不同假設(shè)和標(biāo)準(zhǔn)、采用不同的分析方法而口頭或書(shū)面發(fā)表與本報(bào)告意見(jiàn)及建議不一致的市場(chǎng)評(píng)論和/或交易觀點(diǎn)。華泰沒(méi)有將此意見(jiàn)及建議向報(bào)告所有接收者進(jìn)行更新的義務(wù)。華泰 ???的資產(chǎn)管理部門(mén)、自營(yíng)部門(mén)以及其他投資業(yè)務(wù)部門(mén)可能獨(dú)立做出與本報(bào)告中的意見(jiàn)或建議不一致的投資決策。投資者應(yīng)當(dāng)考慮到華泰及/或其相關(guān)人員可能存在影響本報(bào)告觀點(diǎn)客觀性的潛在利益沖突。投資者請(qǐng)勿將本報(bào)告視為投資或其他決定的唯一信賴(lài)依據(jù)。有關(guān)該方面的具體披露請(qǐng)參照本報(bào)告尾部。
本報(bào)告并非意圖發(fā)送、發(fā)布給在當(dāng)?shù)胤苫虮O(jiān)管規(guī)則下不允許向其發(fā)送、發(fā)布的機(jī)構(gòu)或人員,也并非意圖發(fā)送、發(fā)布給因可得到、使用本報(bào)告的行為而使華泰違反或受制于當(dāng)?shù)胤苫虮O(jiān)管規(guī)則的機(jī)構(gòu)或人員。
本報(bào)告版權(quán)僅為本公司所有。未經(jīng)本公司書(shū)面許可,任何機(jī)構(gòu)或個(gè)人不得以翻版、復(fù)制、發(fā)表、引用或再次分發(fā)他人 (無(wú)論整份或部分)等任何形式侵犯本公司版權(quán)。如征得本公司同意進(jìn)行引用、刊發(fā)的,需在允許的范圍內(nèi)使用,并需在使用前獲取獨(dú)立的法律意見(jiàn),以確定該引用、刊發(fā)符合當(dāng)?shù)剡m用法規(guī)的要求,同時(shí)注明出處為“華泰證券研究所”,且不得對(duì)本報(bào)告進(jìn)行任何有悖原意的引用、刪節(jié)和修改。本公司保留追究相關(guān)責(zé)任的權(quán)利。所有本報(bào)告中使用的商標(biāo)、服務(wù)標(biāo)記及標(biāo)記均為本公司的商標(biāo)、服務(wù)標(biāo)記及標(biāo)記。
中國(guó)香港
本報(bào)告由華泰證券股份有限公司制作,在香港由華泰金融控股(香港)有限公司向符合《證券及期貨條例》及其附屬法律規(guī)定的機(jī)構(gòu)投資者和專(zhuān)業(yè)投資者的客戶(hù)進(jìn)行分發(fā)。華泰金融控股(香港)有限公司受香港證券及期貨事務(wù)監(jiān)察委員會(huì)監(jiān)管,是華泰國(guó)際金融控股有限公司的全資子公司,后者為華泰證券股份有限公司的全資子公司。在香港獲得本報(bào)告的人員若有任何有關(guān)本報(bào)告的問(wèn)題,請(qǐng)與華泰金融控股(香港)有限公司聯(lián)系。
香港-重要監(jiān)管披露
- 華泰金融控股(香港)有限公司的雇員或其關(guān)聯(lián)人士沒(méi)有擔(dān)任本報(bào)告中提及的公司或發(fā)行人的高級(jí)人員。更多信息請(qǐng)參見(jiàn)下方 “美國(guó)-重要監(jiān)管披露”。
美國(guó)
在美國(guó)本報(bào)告由華泰證券(美國(guó))有限公司向符合美國(guó)監(jiān)管規(guī)定的機(jī)構(gòu)投資者進(jìn)行發(fā)表與分發(fā)。華泰證券(美國(guó))有限公司是美國(guó)注冊(cè)經(jīng)紀(jì)商和美國(guó)金融業(yè)監(jiān)管局(FINRA)的注冊(cè)會(huì)員。對(duì)于其在美國(guó)分發(fā)的研究報(bào)告,華泰證券(美國(guó))有限公司根據(jù)《1934 年證券交易法》(修訂版)第 15a-6 條規(guī)定以及美國(guó)證券交易委員會(huì)人員解釋,對(duì)本研究報(bào)告內(nèi)容負(fù)責(zé)。華泰證券(美國(guó))有限公司聯(lián)營(yíng)公司的分析師不具有美國(guó)金融監(jiān)管(FINRA)分析師的注冊(cè)資格,可能不屬于華泰證券(美國(guó))有限公司的關(guān)聯(lián)人員,因此可能不受 FINRA 關(guān)于分析師與標(biāo)的公司溝通、公開(kāi)露面和所持交易證券的限制。華泰證券(美國(guó))有限公司是華泰國(guó)際金融控股有限公司的全資子公司,后者為華泰證券股份有限公司的全資子公司。任何直接從華泰證券(美國(guó))有限公司收到此報(bào)告并希望就本報(bào)告所述任何證券進(jìn)行交易的人士, 應(yīng)通過(guò)華泰證券(美國(guó))有限公司進(jìn)行交易。
美國(guó)-重要監(jiān)管披露
- 分析師謝春生、郭雅麗本人及相關(guān)人士并不擔(dān)任本報(bào)告所提及的標(biāo)的證券或發(fā)行人的高級(jí)人員、董事或顧問(wèn)。分析
師及相關(guān)人士與本報(bào)告所提及的標(biāo)的證券或發(fā)行人并無(wú)任何相關(guān)財(cái)務(wù)利益。本披露中所提及的“相關(guān)人士”包括FINRA?定義下分析師的家庭成員。分析師根據(jù)華泰證券的整體收入和盈利能力獲得薪酬,包括源自公司投資銀行業(yè)務(wù)的收入。
- 華泰證券股份有限公司、其子公司和/或其聯(lián)營(yíng)公司, 及/或不時(shí)會(huì)以自身或代理形式向客戶(hù)出售及購(gòu)買(mǎi)華泰證券研究所覆蓋公司的證券/衍生工具,包括股票及債券(包括衍生品)華泰證券研究所覆蓋公司的證券/衍生工具,包括股票及債券(包括衍生品)。
- 華泰證券股份有限公司、其子公司和/或其聯(lián)營(yíng)公司, 及/或其高級(jí)管理層、董事和雇員可能會(huì)持有本報(bào)告中所提到的任何證券(或任何相關(guān)投資)頭寸,并可能不時(shí)進(jìn)行增持或減持該證券(或投資)。因此,投資者應(yīng)該意識(shí)到可能存在利益沖突。
評(píng)級(jí)說(shuō)明
投資評(píng)級(jí)基于分析師對(duì)報(bào)告發(fā)布日后 6 至 12 個(gè)月內(nèi)行業(yè)或公司回報(bào)潛力(含此期間的股息回報(bào))相對(duì)基準(zhǔn)表現(xiàn)的預(yù)期(A?股市場(chǎng)基準(zhǔn)為滬深?300?指數(shù),香港市場(chǎng)基準(zhǔn)為恒生指數(shù),美國(guó)市場(chǎng)基準(zhǔn)為標(biāo)普?500?指數(shù)),具體如下:
行業(yè)評(píng)級(jí)
增持:預(yù)計(jì)行業(yè)股票指數(shù)超越基準(zhǔn)
中性:預(yù)計(jì)行業(yè)股票指數(shù)基本與基準(zhǔn)持平減持:預(yù)計(jì)行業(yè)股票指數(shù)明顯弱于基準(zhǔn)
公司評(píng)級(jí)
買(mǎi)入:預(yù)計(jì)股價(jià)超越基準(zhǔn) 15%以上增持:預(yù)計(jì)股價(jià)超越基準(zhǔn) 5%~15%
持有:預(yù)計(jì)股價(jià)相對(duì)基準(zhǔn)波動(dòng)在-15%~5%之間賣(mài)出:預(yù)計(jì)股價(jià)弱于基準(zhǔn) 15%以上
暫停評(píng)級(jí):已暫停評(píng)級(jí)、目標(biāo)價(jià)及預(yù)測(cè),以遵守適用法規(guī)及/或公司政策
無(wú)評(píng)級(jí):股票不在常規(guī)研究覆蓋范圍內(nèi)。投資者不應(yīng)期待華泰提供該等證券及/或公司相關(guān)的持續(xù)或補(bǔ)充信息
?
法律實(shí)體披露
中國(guó):華泰證券股份有限公司具有中國(guó)證監(jiān)會(huì)核準(zhǔn)的“證券投資咨詢(xún)”業(yè)務(wù)資格,經(jīng)營(yíng)許可證編號(hào)為:91320000704041011J ????????
香港:華泰金融控股(香港)有限公司具有香港證監(jiān)會(huì)核準(zhǔn)的“就證券提供意見(jiàn)”業(yè)務(wù)資格,經(jīng)營(yíng)許可證編號(hào)為:AOK809
美國(guó):華泰證券(美國(guó))有限公司為美國(guó)金融業(yè)監(jiān)管局(FINRA)成員,具有在美國(guó)開(kāi)展經(jīng)紀(jì)交易商業(yè)務(wù)的資格,經(jīng)營(yíng)業(yè)務(wù)許可編號(hào)為:CRD#:298809/SEC#:8-70231
?
華泰證券股份有限公司
南京
南京市建鄴區(qū)江東中路228?號(hào)華泰證券廣場(chǎng)1?號(hào)樓/郵政編碼:210019
電話(huà):86?25?83389999/傳真:86?25?83387521
電子郵件:ht-rd@htsc.com
北京
北京市西城區(qū)太平橋大街豐盛胡同28?號(hào)太平洋保險(xiǎn)大廈A?座18?層/郵政編碼:100032
電話(huà):86?10?63211166/傳真:86?10?63211275
電子郵件:ht-rd@htsc.com
深圳
深圳市福田區(qū)益田路5999?號(hào)基金大廈10?樓/郵政編碼:518017
電話(huà):86?755?82493932/傳真:86?755?82492062
電子郵件:ht-rd@htsc.com
上海
上海市浦東新區(qū)東方路18?號(hào)保利廣場(chǎng)E?棟23?樓/郵政編碼:200120
電話(huà):86?21?28972098/傳真:86?21 28972068
電子郵件:ht-rd@htsc.com
?
華泰金融控股(香港)有限公司
香港中環(huán)皇后大道中 99 號(hào)中環(huán)中心 58 樓 5808-12 室
電話(huà):+852-3658-6000/傳真:+852-2169-0770
電子郵件:research@htsc.com?http://www.htsc.com.hk
?
華泰證券(美國(guó))有限公司
美國(guó)紐約哈德遜城市廣場(chǎng) 10 號(hào) 41 樓(紐約 10001)
電話(huà):+212-763-8160/傳真:+917-725-9702
電子郵件: Huatai@htsc-us.com?http://www.htsc-us.com
?
?版權(quán)所有2021年華泰證券股份有限公司
?
總結(jié)
以上是生活随笔為你收集整理的分布式数据库或成为新增量的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: java获取字典所有的key_java字
- 下一篇: 禁用IP的mysql+php设计