李飞飞演讲实录 | 云原生数据库2.0:一站式全链路数据管理与服务
一、淺談云原生
(一)云原生,是未來使用云的標(biāo)準(zhǔn)方式
我認(rèn)為云原生是未來使用云的標(biāo)準(zhǔn)方式,云計算資源無處不在、取之不盡、用之不竭,不用關(guān)心云資源在哪里、有多少。就像今天我們使用自來水一樣,沒有?會費盡心思考慮水從哪里來。
(二)阿里云全面引領(lǐng)云原生分布式數(shù)據(jù)庫發(fā)展方向
阿里云在云原生數(shù)據(jù)庫領(lǐng)域做了多年的實踐、嘗試與探索,與開發(fā)者一起成長。我們認(rèn)為接下來云原生數(shù)據(jù)庫必須關(guān)注和發(fā)展的領(lǐng)域有以下五個:
1)云原生分布式
將云原生和分布式技術(shù)深度融合,將Share Nothing、Share Storage、Share Everything架構(gòu)深度融合。
2)智能化
利用AI、機(jī)器學(xué)習(xí)的技術(shù),讓數(shù)據(jù)庫系統(tǒng)能夠?qū)崿F(xiàn)自動駕駛的能力,讓開發(fā)者可以更好地管理和使用數(shù)據(jù)庫的服務(wù),如自動調(diào)參、索引推薦、異常檢測等。
3)安全可信
安全可信的能力十分重要,比如說如何確保數(shù)據(jù)是全鏈路的、加密的、安全的,在存儲、傳輸、計算過程中都能夠提供安全可信的能力。
4)在離線一體化
減少數(shù)據(jù)鏈路,數(shù)據(jù)從在線處理、到在線分析、到離線的存儲,能否提供一體化的體驗,讓開發(fā)者可以更簡單、更便捷地訪問和處理數(shù)據(jù)。
5)物聯(lián)網(wǎng)多模
面對AIOT、物聯(lián)網(wǎng)、車聯(lián)網(wǎng)的蓬勃發(fā)展,能否打造一個面向開發(fā)者與應(yīng)用的物聯(lián)網(wǎng)多模的數(shù)據(jù)庫。
以上是我們認(rèn)為接下來非常重要的五個方向,也正因為在這些方向的耕耘,阿里云在去年獲得了Gartner全球數(shù)據(jù)庫領(lǐng)導(dǎo)者的突破。
二、阿里云數(shù)據(jù)庫 – 數(shù)據(jù)管理生命周期
相信對于任何一個開發(fā)者而言,在數(shù)據(jù)層面最關(guān)心的是數(shù)據(jù)管理生命周期。下面站在開發(fā)者的視角,闡述數(shù)據(jù)的全鏈路生命周期到底是什么。
第一步是數(shù)據(jù)的生產(chǎn)和集成,在這一步如何更高效地做數(shù)據(jù)集成、數(shù)據(jù)清洗、數(shù)據(jù)傳輸、數(shù)據(jù)備份。當(dāng)做完這步以后,下一步是數(shù)據(jù)的實時處理,這里面就是我們非常熟悉的傳統(tǒng)關(guān)系型數(shù)據(jù)庫、在線交易、OLTP等。緊接著就是數(shù)據(jù)分析和發(fā)現(xiàn),用戶如何做數(shù)據(jù)脫敏、數(shù)據(jù)的血緣關(guān)系等。
以上就是數(shù)據(jù)管理的生命全周期,我們在上面構(gòu)建不同的解決方案,和開發(fā)者、合作伙伴一起面向應(yīng)用、行業(yè)、客戶去打造最終的Killer APP。
下面就從生命周期的各個階段來闡述一下我們?yōu)殚_發(fā)者提供了哪些工具,開發(fā)者基于這些工具可以做哪些事情。
(一)數(shù)據(jù)生產(chǎn)與集成
數(shù)據(jù)生產(chǎn)與集成是數(shù)據(jù)的第一生命周期,就像新生兒一樣,數(shù)據(jù)來到這個世界必須要經(jīng)歷采集,然后是存儲和處理。
如上圖所示,在這個過程中阿里云提供了DTS(Data Transmission Service),支持17種以上不同的數(shù)據(jù)源,可以做實時增量或者全量的同步,讓應(yīng)用非常簡潔地實現(xiàn)數(shù)據(jù)從多元異構(gòu)的數(shù)據(jù)源到多元異構(gòu)的目標(biāo)端實時的數(shù)據(jù)同步。
DBS可以實現(xiàn)跨云的備份、云上云下數(shù)據(jù)備份的統(tǒng)一,讓數(shù)據(jù)在多云多端之間無縫流動。
DMS(Database Management Service)可以幫助用戶做任務(wù)編排、數(shù)據(jù)分析、血緣分析等一系列事情。
以上構(gòu)成了阿里云在數(shù)據(jù)生產(chǎn)和集成的基礎(chǔ)能力。
(二)數(shù)據(jù)實時處理
數(shù)據(jù)生產(chǎn)和集成之后是數(shù)據(jù)的實時處理。
作為開發(fā)者,我們最關(guān)心的就是確保在任何情況下,在線交易場景的應(yīng)用永遠(yuǎn)在線、數(shù)據(jù)永遠(yuǎn)不丟失,在這里我們提供了不同的選擇。
1)云數(shù)據(jù)庫 RDS:提供企業(yè)級數(shù)據(jù)庫自治能力
首先,阿里云提供自己的云數(shù)據(jù)庫RDS。
每個云廠商都有RDS,阿里云的RDS和其他RDS有什么不同呢?
發(fā)展到云原生數(shù)據(jù)庫2.0,阿里云RDS最大的特點就是提供企業(yè)級的數(shù)據(jù)庫自治能力(Autonomous Database Service)。
首先,通過Kubernetes構(gòu)建一個云原生的管控平臺,所有的管控能力都進(jìn)行了微服務(wù)化和容器化部署,這樣可以屏蔽底層多元異構(gòu)的資源,為開發(fā)者提供一個云原生的開發(fā)環(huán)境和部署環(huán)境。
在這個上面,我們利用AI和Machine Learning的技術(shù),構(gòu)建了自動駕駛數(shù)據(jù)庫平臺。為開發(fā)者提供了許多能力,比如自動壓測,我們可以自動生成壓測數(shù)據(jù),讓它的工作負(fù)載與在真實環(huán)境幾乎一樣,這樣開發(fā)者可以更好地調(diào)測在線系統(tǒng)。另外,我們提供了索引推薦、參數(shù)調(diào)優(yōu)等一系列自動化自治服務(wù)能力。
此外,困擾開發(fā)者的許多問題,比如在線應(yīng)用運行速度變得很慢,線程池被打滿等,通過DAS(Database Autonomy Service)可以幫助開發(fā)者更快更好地發(fā)現(xiàn)與解決。
2)云原生關(guān)系型數(shù)據(jù)庫 PolarDB
除了阿里云RDS之外,云原生數(shù)據(jù)庫2.0最核心的能力之一就是云原生關(guān)系型數(shù)據(jù)庫PolarDB。
為了讓開發(fā)者能夠更好地在PolarDB上開發(fā)應(yīng)用,我們確保PolarDB 100% 兼容 MySQL、100% 兼容 PostgreSQL、高度兼容 Oracle 語法,讓開發(fā)者實現(xiàn)輕松上云。
很多企業(yè)和開發(fā)者有向全球部署的需求,比如在線教育、游戲,需要我們的應(yīng)用能夠就近服務(wù)用戶,阿里云推出了全球部署的能力,稱為Global Database。這表示PolarDB可以實現(xiàn)跨AZ(Available Zone)的部署,實現(xiàn)RPO等于0,非常低的RTO。通過跨AZ的能力數(shù)據(jù)實時同步,可以實現(xiàn)用戶在開發(fā)者的應(yīng)用上就近訪問。
為了讓開發(fā)者更好地體驗到阿里云的產(chǎn)品,我們推出了I/O帶寬免費、性價比更高的PolarDB實例,價格僅為其他云廠商云原生數(shù)據(jù)庫的30%—40%。
除此之外,我們還進(jìn)行了性能測試。
我們用開發(fā)者非常熟悉的SysBench,連接事務(wù)處理、讀寫混合測試,測試了CPU 密集型和I/O密集型。
如上圖所示,我們對比了PolarDB和CPU密集型、I/O密集型兩個云原生數(shù)據(jù)庫在SysBench上的標(biāo)準(zhǔn)性能測試,可以看到Polar DB在兩種不同工作負(fù)載的情況下都展現(xiàn)出非常優(yōu)異的性能。
3)云原生分布式數(shù)據(jù)庫PolarDB-X
開發(fā)者經(jīng)常面臨海量數(shù)據(jù)高并發(fā)、超高并發(fā)的場景。針對這種場景,阿里云推出了PolarDB-X,即PolarDB的分布式版本,也就是將云原生架構(gòu)存儲計算分離,上面再構(gòu)建一層架構(gòu)來支持一體化分布式數(shù)據(jù)庫。
PolarDB-X支持海量高并發(fā)、全局二級索引、HTAP復(fù)雜查詢、分布式事務(wù)、在線彈性擴(kuò)展。
以上圖的全局二級索引為例,它支持ACID,這樣讓開發(fā)者可以更關(guān)注業(yè)務(wù)應(yīng)用的開發(fā),而不需要關(guān)注分庫、分表這樣復(fù)雜的邏輯。
我們用X-Paxos來支持兩個數(shù)據(jù)副本、一個日志副本,而且我們的三副本可以做到跨AZ部署、支持同城跨機(jī)房的RPO等于0。
(三)數(shù)據(jù)分析與發(fā)現(xiàn)
實時數(shù)據(jù)庫處理之后,當(dāng)積累了大量的交易數(shù)據(jù),如何在數(shù)據(jù)里面發(fā)現(xiàn)信息?這就來到了數(shù)據(jù)分析和發(fā)現(xiàn)階段。
云原生數(shù)據(jù)倉庫AnalyticDB(簡稱ADB)是云原生架構(gòu),計算存儲分離,計算資源按需彈性,相對傳統(tǒng)方式,成本可以下降3倍。
我們在這種云原生的架構(gòu)上實現(xiàn)了冷熱數(shù)據(jù)分層,1TB可以低至114元/月,一份存儲多種計算是未來數(shù)據(jù)分析領(lǐng)域發(fā)展的大趨勢,用一個存儲多種計算引擎可以讓我們適應(yīng)工作負(fù)載,到底是離線的ETL、還是在線的交互式分析,整體成本可以大幅度下降。
利用前文的這些技術(shù),可以幫助開發(fā)者實現(xiàn)在離線一體化的開發(fā)和應(yīng)用,支持離線ETL以及在線的交互式分析,本質(zhì)上就是將MTB架構(gòu)和BSP模型完美地結(jié)合在一起。
我們也高度兼容生態(tài),并且我們很快會推出Spark兼容版,將這些開源的生態(tài)在我們的云原生數(shù)倉ADB里面完美結(jié)合,實現(xiàn)基于負(fù)載的智能化調(diào)度和混合應(yīng)用的支持。
(四)數(shù)據(jù)開發(fā)和管理
最后是數(shù)據(jù)開發(fā)和管理。
我們面向數(shù)據(jù)庫開發(fā)者提供一站式的在線數(shù)據(jù)平臺,阿里云的開發(fā)者社區(qū)支持了幾十萬數(shù)據(jù)庫開發(fā)者利用DMS的能力,訪問和管理多元異構(gòu)的數(shù)據(jù)庫資源。
DMS支持開發(fā)者們所有耳熟能詳?shù)臄?shù)據(jù)庫,從阿里云的PolarDB、PolarDB-X、RDS、AnalyticDB等,再到MySQL、Oracle、SQL Server等。
接入以后,它提供數(shù)據(jù)資產(chǎn)、數(shù)據(jù)庫設(shè)計、數(shù)據(jù)庫開發(fā)、數(shù)據(jù)集成、數(shù)據(jù)服務(wù)等一站式的能力,幫助開發(fā)者實現(xiàn)數(shù)據(jù)化運維、容災(zāi)/多活、T+1/實時/歸檔、數(shù)據(jù)集中處理、BI報表、多維分析等能力。
三、阿里云數(shù)據(jù)庫開源發(fā)布
(一)阿里云數(shù)據(jù)庫產(chǎn)品開源路徑
阿里云作為全球云原生數(shù)據(jù)庫的領(lǐng)導(dǎo)者,將成為第一家宣布核心的云原生數(shù)據(jù)庫技術(shù)進(jìn)行開源的云廠商,邀請開發(fā)者一起共建云原生數(shù)據(jù)庫2.0。
作為全球數(shù)據(jù)庫領(lǐng)導(dǎo)者,我們將云原生數(shù)據(jù)庫PolarDB for PG Paxos高可用集群版開源,目前在Github上開源公開訪問。
在9月份,我們會推出基于HLC混合時鐘的高擴(kuò)展分布式版本,在明年會推出Share Nothing的Sharding和插件化版本,在MySQL生態(tài)很早就開源了RDS AliSQL,如今做一個重磅升級,RDS會推出RDS GalaxySQL,之后會推出Paxos高可用性版,然后是云原生的分布式版。
(二)阿里云數(shù)據(jù)庫開源計劃:打造云原生分布式數(shù)據(jù)庫生態(tài)
我們看一下具體做哪些事情?
上圖中是我們?yōu)镸ySQL和PG生態(tài)兩大社區(qū)準(zhǔn)備開源的組件。
數(shù)據(jù)庫正在加速云化,云原生以及分布式技術(shù)正在重塑數(shù)據(jù)庫整個技術(shù)棧。阿里云在自身互聯(lián)網(wǎng)業(yè)務(wù)和云數(shù)據(jù)庫服務(wù)有豐富的實踐經(jīng)驗,在高可用、分布式、云原生、存計分離有技術(shù)積累。這些技術(shù)以組件和系統(tǒng)的方式開放出來,與開源社區(qū)一起共建云原生分布式數(shù)據(jù)庫生態(tài)。所有開源的組件都采用對開發(fā)者最友好的協(xié)議,遵循Apache Version 2.0協(xié)議,歡迎開發(fā)者和我們一起共建全球領(lǐng)先、有中國特色的云原生數(shù)據(jù)庫2.0社區(qū)。
比如通過開源的PolarDB for PG版本,利用X-Paxos協(xié)議,幫助開發(fā)者快速實現(xiàn)RPO等于0,兼容及高可用數(shù)據(jù)庫。拋棄傳統(tǒng)的主備模式,走向三節(jié)點的模式,所有開源的組件都是即插即拔即用,讓開發(fā)者快速享受到PolarDB的能力,并且基于現(xiàn)有的PG、MySQL生態(tài)持續(xù)發(fā)展,歡迎大家加入云原生數(shù)據(jù)庫2.0的開源社區(qū)。
源碼開放地址:https://github.com/alibaba/PolarDB-for-PostgreSQL
【相關(guān)閱讀】
阿里云開源PolarDB數(shù)據(jù)庫,與社區(qū)共建云原生分布式數(shù)據(jù)庫生態(tài)
云原生數(shù)據(jù)庫 2.0:一站式全鏈路數(shù)據(jù)管理與服務(wù)
原文鏈接:https://developer.aliyun.com/article/784518?
版權(quán)聲明:本文內(nèi)容由阿里云實名注冊用戶自發(fā)貢獻(xiàn),版權(quán)歸原作者所有,阿里云開發(fā)者社區(qū)不擁有其著作權(quán),亦不承擔(dān)相應(yīng)法律責(zé)任。具體規(guī)則請查看《阿里云開發(fā)者社區(qū)用戶服務(wù)協(xié)議》和《阿里云開發(fā)者社區(qū)知識產(chǎn)權(quán)保護(hù)指引》。如果您發(fā)現(xiàn)本社區(qū)中有涉嫌抄襲的內(nèi)容,填寫侵權(quán)投訴表單進(jìn)行舉報,一經(jīng)查實,本社區(qū)將立刻刪除涉嫌侵權(quán)內(nèi)容。 與50位技術(shù)專家面對面20年技術(shù)見證,附贈技術(shù)全景圖總結(jié)
以上是生活随笔為你收集整理的李飞飞演讲实录 | 云原生数据库2.0:一站式全链路数据管理与服务的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 深入理解领域驱动设计中的聚合
- 下一篇: 阿里云上海ACE同城会 | 数据库前沿技