分布式事务选型的取舍 | 建议收藏
點(diǎn)擊上方“朱小廝的博客”,選擇“設(shè)為星標(biāo)”
回復(fù)”1024“獲取獨(dú)家整理的學(xué)習(xí)資料
微服務(wù)興起的這幾年涌現(xiàn)出不少分布式事務(wù)框架,比如ByteTCC、TCC-transaction、EasyTransaction以及最近很火爆的Seata。最近剛看了Seata的源碼(v0.5.2),借機(jī)記錄一下自己對分布式事務(wù)的一些理解。(3年前這類框架還沒成熟,因項目需要自己也寫過一個柔性事務(wù)框架)。
本文分五部分,首先明確分布式事務(wù)概念的演變,然后簡單說下為什么大家不用XA,第三部分闡述兩階段提交的“提升”,第四部分介紹Seata的架構(gòu)的亮點(diǎn)與問題,第五部分談下分布式事務(wù)的取舍。
限于篇幅一些網(wǎng)上可搜索的細(xì)節(jié)本文不展開闡述(例如XA、Saga、TCC、Seata等原理的的詳細(xì)介紹)。
一、分布式事務(wù)的泛化
提起分布式事務(wù),最早指涉及的是多個資源的數(shù)據(jù)庫事務(wù)問題。
wiki對分布式事務(wù)的定義:A distributed transaction is a database transaction in which two or more network hosts are involved.
不過事務(wù)一詞含義隨著SOA架構(gòu)逐漸擴(kuò)大,根據(jù)上下文不同,可分為兩類:
System transaction;
Business transaction。
前者多指數(shù)據(jù)庫事務(wù),后者則多對應(yīng)一個業(yè)務(wù)交易。
與此同時,分布式事務(wù)的含義也在泛化,尤其SOA、微服務(wù)概念流行起來后,多指的是一個業(yè)務(wù)場景,需要編排很多獨(dú)立部署的服務(wù)時,如何保證交易整體的原子性與一致性問題。這類分布式事務(wù)也稱作長事務(wù)(long-lived transaction),例如一個定行程的交易,它由購買航班、租車以及預(yù)訂酒店構(gòu)成,而航班預(yù)訂可能需要一兩天才能確認(rèn)。為了統(tǒng)一對概念的理解,本文默認(rèn)指的都是這類長事務(wù)。
分布式事務(wù)概念泛化的同時,也帶來了一個技術(shù)問題,微服務(wù)下這類分布式事務(wù)的ACID該如何保證?是否仍然可以用傳統(tǒng)兩階段提交/XA去解決?很可惜,基于數(shù)據(jù)庫的XA有點(diǎn)像扶不起的阿斗,中看不中用。
二、為什么XA大家都不用?
其實也并非不用,例如在IBM大型機(jī)上基于CICS很多跨資源是基于XA協(xié)議實現(xiàn)的分布式事務(wù),事實上XA也算分布式事務(wù)處理的規(guī)范了,但在為什么互聯(lián)網(wǎng)中很少使用,究其原因我覺得有以下幾個:
性能(阻塞性協(xié)議,增加響應(yīng)時間、鎖時間、死鎖);
數(shù)據(jù)庫支持完善度(MySQL 5.7之前都有缺陷);
協(xié)調(diào)者依賴獨(dú)立的J2EE中間件(早期重量級Weblogic、Jboss、后期輕量級Atomikos、Narayana和Bitronix);
運(yùn)維復(fù)雜,DBA缺少這方面經(jīng)驗;
并不是所有資源都支持XA協(xié)議;
大廠懂所以不使用,小公司不懂所以不敢用。
準(zhǔn)確講XA是一個規(guī)范、協(xié)議,它只是定義了一系列的接口,只是目前大多數(shù)實現(xiàn)XA的都是數(shù)據(jù)庫或者M(jìn)Q,所以提起XA往往多指基于資源層的底層分布式事務(wù)解決方案。其實現(xiàn)在也有些數(shù)據(jù)分片框架或者中間件也支持XA協(xié)議,畢竟它的兼容性、普遍性更好。
三、兩階段提交的“提升”
基于數(shù)據(jù)庫的XA協(xié)議本質(zhì)上就是兩階段提交,但由于性能原因在互聯(lián)網(wǎng)高并發(fā)場景下并不適用。如果數(shù)據(jù)庫只能保證本地ACID時,那么其中出現(xiàn)交易異常后,如何實現(xiàn)整個交易原子性A,從而保證一致性C呢?另外在處理過程中如何保證隔離性呢?
最直接的方法就是按照邏輯依次調(diào)用服務(wù),但出現(xiàn)異常怎么辦?那就對那些已經(jīng)成功的進(jìn)行補(bǔ)償,補(bǔ)償成功就一致了,這種樸素的模型就是Saga。但Saga這種方式并不能保證隔離性,于是出現(xiàn)了TCC。在實際交易邏輯前先做業(yè)務(wù)檢查、對涉及到的業(yè)務(wù)資源進(jìn)行“預(yù)留”,或者說是一種“中間狀態(tài)”,如果都預(yù)留成功則完成這些預(yù)留資源的真正業(yè)務(wù)處理,典型的如票務(wù)座位等場景。
當(dāng)然還有像Ebay提出的基于消息表,即可靠消息最終一致模型,但本質(zhì)上這也屬于Saga模式的一種特定實現(xiàn),它的關(guān)鍵點(diǎn)有兩個:
基于應(yīng)用共享事務(wù)記錄執(zhí)行軌跡;
然后通過異步重試確保交易最終一致(這也使得這種方式不適用那些業(yè)務(wù)上允許補(bǔ)償回滾的場景)。
這類分布式事務(wù)場景并不是微服務(wù)才出現(xiàn)的,在SOA時代其實就有了,常見的Saga、TCC、可靠消息最終一致等模型也都是很多年前就有了,只是最近幾年隨著微服務(wù)興起,這些方案又重新被人關(guān)注了起來。
「Saga」參考鏈接:https://www.cs.cornell.edu/andru/cs711/2002fa/reading/sagas.pdf
仔細(xì)對比這些方案與XA,會發(fā)現(xiàn)這些方案本質(zhì)上都是將兩階段提交從資源層提升到了應(yīng)用層。
Saga的核心就是補(bǔ)償,一階段就是服務(wù)的正常順序調(diào)用(數(shù)據(jù)庫事務(wù)正常提交),如果都執(zhí)行成功,則第二階段則什么都不做;但如果其中有執(zhí)行發(fā)生異常,則依次調(diào)用其補(bǔ)償服務(wù)(一般多逆序調(diào)用未已執(zhí)行服務(wù)的反交易)來保證整個交易的一致性。應(yīng)用實施成本一般。
TCC的特點(diǎn)在于業(yè)務(wù)資源檢查與加鎖,一階段進(jìn)行校驗,資源鎖定,如果第一階段都成功,二階段對鎖定資源進(jìn)行交易邏輯,否則,對鎖定資源進(jìn)行釋放。應(yīng)用實施成本較高。
基于可靠消息最終一致,一階段服務(wù)正常調(diào)用,同時同事務(wù)記錄消息表,二階段則進(jìn)行消息的投遞,消費(fèi)。應(yīng)用實施成本較低。
具體到基于這些模型實現(xiàn)的分布式事務(wù)框架,也多借鑒了DTP(Distributed Transaction Processing)模型。
DTP(Distributed Transaction Processing)參考鏈接:http://pubs.opengroup.org/onlinepubs/009680699/toc.pdf
▲ DTP模型
RM負(fù)責(zé)本地事務(wù)的提交,同時完成分支事務(wù)的注冊、鎖的判定,扮演事務(wù)參與者角色。
TM負(fù)責(zé)整體事務(wù)的提交與回滾的指令的觸發(fā),扮演事務(wù)的總體協(xié)調(diào)者角色。
不同框架在實現(xiàn)時,各組件角色的功能、部署形態(tài)會根據(jù)需求進(jìn)行調(diào)整,例如TM有的是以jar包形式與應(yīng)用部署在一起,有的則剝離出來需要單獨(dú)部署(例如Seata中將TM的主要功能放到一個邏輯上集中的Server上,叫做TC( Transaction Coordinator ))
四、Seata架構(gòu)得與失
今年初,阿里發(fā)布了開源分布式事務(wù)框架Fescar,后來跟螞蟻TCC方案整合后改名為Seata,目前版本雖然只到0.6,但GitHub star已經(jīng)過9k,一方面可見阿里在圈內(nèi)推廣能力,另外一方面也說明大家對阿里分布式事務(wù)框架的期待。
Seata的使用方式以及原理在其github wiki上已經(jīng)闡述的很清晰,網(wǎng)上也已有很多源代碼剖析的文章。接下來我們通過分析Seata AT模式原理,來看看它的亮點(diǎn)與問題。
「Seata的使用方式以及原理」參考鏈接:https://github.com/seata/seata/wiki
Seata對MT以及TCC的支持亮點(diǎn)有限,這兩種模式更多是為了兼容已有應(yīng)用生態(tài)。
Seata團(tuán)隊畫了一個的詳細(xì)調(diào)用流程圖,對照此圖閱讀其源碼會輕松很多。
▲ Seata執(zhí)行流程圖
1、亮點(diǎn)
相比與其它分布式事務(wù)框架,Seata架構(gòu)的亮點(diǎn)主要有幾個:
應(yīng)用層基于SQL解析實現(xiàn)了自動補(bǔ)償,從而最大程度的降低業(yè)務(wù)侵入性;
將分布式事務(wù)中TC(事務(wù)協(xié)調(diào)者)獨(dú)立部署,負(fù)責(zé)事務(wù)的注冊、回滾;
通過全局鎖實現(xiàn)了寫隔離與讀隔離。
這些特性的具體實現(xiàn)機(jī)制其官網(wǎng)以及github上都有詳細(xì)介紹,這里不展開介紹。
2、性能損耗
我們看看Seata增加了哪些開銷(純內(nèi)存運(yùn)算類的忽略不計):
一條Update的SQL,則需要全局事務(wù)xid獲取(與TC通訊)、before image(解析SQL,查詢一次數(shù)據(jù)庫)、after image(查詢一次數(shù)據(jù)庫)、insert undo log(寫一次數(shù)據(jù)庫)、before commit(與TC通訊,判斷鎖沖突),這些操作都需要一次遠(yuǎn)程通訊RPC,而且是同步的。
另外undo log寫入時blob字段的插入性能也是不高的。每條寫SQL都會增加這么多開銷,粗略估計會增加5倍響應(yīng)時間(二階段雖然是異步的,但其實也會占用系統(tǒng)資源,網(wǎng)絡(luò)、線程、數(shù)據(jù)庫)。
前后鏡像如何生成?
通過druid解析SQL,然后復(fù)用業(yè)務(wù)SQL中的where條件,然后生成Select SQL執(zhí)行。
3、性價比
為了進(jìn)行自動補(bǔ)償,需要對所有交易生成前后鏡像并持久化,可是在實際業(yè)務(wù)場景下,這個是成功率有多高,或者說分布式事務(wù)失敗需要回滾的有多少比率?這個比例在不同場景下是不一樣的,考慮到執(zhí)行事務(wù)編排前,很多都會校驗業(yè)務(wù)的正確性,所以發(fā)生回滾的概率其實相對較低。按照二八原則預(yù)估,即為了20%的交易回滾,需要將80%的成功交易的響應(yīng)時間增加5倍,這樣的代價相比于讓應(yīng)用開發(fā)一個補(bǔ)償交易是否是值得?值得我們深思。
業(yè)界還有種思路,通過數(shù)據(jù)庫binlog恢復(fù)SQL執(zhí)行前后鏡像,這樣省去了同步undo log生成記錄,減少了性能損耗,同時對業(yè)務(wù)零侵入,個人感覺是一種更好的方式。
4、全局鎖
1)熱點(diǎn)數(shù)據(jù)
Seata在每個分支事務(wù)中會攜帶對應(yīng)的鎖信息,在before commit階段會依次獲取鎖(因為需要將所有SQL執(zhí)行完才能拿到所有鎖信息,所以放在commit前判斷)。相比XA,Seata 雖然在一階段成功后會釋放數(shù)據(jù)庫鎖,但一階段在commit前全局鎖的判定也拉長了對數(shù)據(jù)鎖的占有時間,這個開銷比XA的prepare低多少需要根據(jù)實際業(yè)務(wù)場景進(jìn)行測試。全局鎖的引入實現(xiàn)了隔離性,但帶來的問題就是阻塞,降低并發(fā)性,尤其是熱點(diǎn)數(shù)據(jù),這個問題會更加嚴(yán)重。
2)回滾鎖釋放時間
Seata在回滾時,需要先刪除各節(jié)點(diǎn)的undo log,然后才能釋放TC內(nèi)存中的鎖,所以如果第二階段是回滾,釋放鎖的時間會更長。
3)死鎖問題
Seata的引入全局鎖會額外增加死鎖的風(fēng)險,但如果實現(xiàn)死鎖,會不斷進(jìn)行重試,最后靠等待全局鎖超時,這種方式并不優(yōu)雅,也延長了對數(shù)據(jù)庫鎖的占有時間。
「Seata的引入全局鎖會額外增加死鎖的風(fēng)險」參考鏈接:https://github.com/seata/awesome-seata/blob/master/wiki/en-us/Fescar-AT.md
5、其他問題
1)對于部分采用Seata的應(yīng)用,如何保證數(shù)據(jù)不臟讀、幻讀?
Seata提供了一個@GlobalLock的注解,可以提供輕量級全局鎖判定的功能(不生成undo log),但還是需要集成使用Seata。
2)TC在邏輯上是單點(diǎn),如何做到高可用、高性能還是需要后續(xù)版本不斷優(yōu)化。
3)單機(jī)多數(shù)據(jù)源跨服務(wù)目前不支持。
五、分布式事務(wù)的取舍
嚴(yán)格的ACID事務(wù)對隔離性的要求很高,在事務(wù)執(zhí)行中必須將所有的資源鎖定, 對于長事務(wù)來說,整個事務(wù)期間對數(shù)據(jù)的獨(dú)占,將嚴(yán)重影響系統(tǒng)并發(fā)性能。因此,在高并發(fā)場景中,對ACID的部分特性進(jìn)行放松從而提高性能,這便產(chǎn)生了BASE柔性事務(wù)。柔性事務(wù)的理念則是通過業(yè)務(wù)邏輯將互斥鎖操作從資源層面上移至業(yè)務(wù)層面。通過放寬對強(qiáng)一致性要求,來換取系統(tǒng)吞吐量的提升。另外提供自動的異常恢復(fù)機(jī)制,可以在發(fā)生異常后也能確保事務(wù)的最終一致。
基于XA的分布式事務(wù)如果要嚴(yán)格保證ACID,實際需要事務(wù)隔離級別為SERLALIZABLE。
由上可見柔性事務(wù)需要應(yīng)用層進(jìn)行參與,因此這類分布式事務(wù)框架一個首要的功能就是怎么最大程度降低業(yè)務(wù)改造成本,然后就是盡可能提高性能(響應(yīng)時間、吞吐),最好是保證隔離性。
一個好的分布式事務(wù)框架應(yīng)用盡可能滿足以下特性:
業(yè)務(wù)改造成本低;
性能損耗低;
隔離性保證完整。
但如同CAP,這三個特性是相互制衡的,往往只能滿足其中兩個,我們可以畫一個三角約束:
基于業(yè)務(wù)補(bǔ)償?shù)腟aga滿足1.2;TCC滿足2.3;Seata滿足1.3。
當(dāng)然如果我們要自己設(shè)計一個分布式事務(wù)框架,還需要考慮很多其它特性,在明確目標(biāo)場景偏好后進(jìn)行權(quán)衡取舍,這些特性包括但不限于以下:
業(yè)務(wù)侵入性(基于注解、XML,補(bǔ)償邏輯);
隔離性(寫隔離/讀隔離/讀未提交,業(yè)務(wù)隔離/技術(shù)隔離);
TM/TC部署形態(tài)(單獨(dú)部署、與應(yīng)用部署一起);
錯誤恢復(fù)(自動恢復(fù)、手動恢復(fù));
性能(回滾的概率、付出的代價,響應(yīng)時間、吞吐);
高可用(注冊中心、數(shù)據(jù)庫);
持久化(數(shù)據(jù)庫、文件、多副本一致算法);
同步/異步(2PC執(zhí)行方式);
日志清理(自動、手動);
......
六、結(jié)語
分布式事務(wù)一直是業(yè)界難題,難在于CAP定理,在于分布式系統(tǒng)8大錯誤假設(shè),在于FLP不可能原理,在于我們習(xí)慣于單機(jī)事務(wù)ACID做對比。無論是數(shù)據(jù)庫領(lǐng)域XA、Google percolator或Calvin模型,還是微服務(wù)下Saga、TCC、可靠消息等方案,都沒有完美解決分布式事務(wù)問題,它們不過是各自在性能、一致性、可用性等方面做取舍,尋求某些場景偏好下的權(quán)衡。
「分布式系統(tǒng)8大錯誤假設(shè)」參考鏈接:http://%5Bhttps://en.wikipedia.org/wiki/Fallacies_of_distributed_computing%5D(https://en.wikipedia.org/wiki/Fallacies_of_distributed_computing)
「FLP不可能原理」參考鏈接:html%5D(https://www.cnblogs.com/firstdream/p/6585923.html)
其實由于網(wǎng)絡(luò)的不確定性,分布式下很多問題都是難題,最好的方案是避免分布式事務(wù):)
最后回到主題,Seata解決了分布式事務(wù)難題了嗎?看你最在意哪方面了。如果你希望業(yè)務(wù)盡量少感知,DB操作簡單,那它會給你帶來驚喜;但如果你更看重響應(yīng)時間,DB寫操作較多,調(diào)用鏈條較長,那它可能會讓失望。最后希望Seata開源項目越做越好!
作者:溫衛(wèi)斌,就職于中國民生銀行信息科技部,目前負(fù)責(zé)分布式技術(shù)平臺設(shè)計與研發(fā),主要關(guān)注分布式數(shù)據(jù)相關(guān)領(lǐng)域。
來源:DBAplus社群
想知道更多?掃描下面的二維碼關(guān)注我
相關(guān)推薦:
《科普 | 明星公司之Netflix》
《看我如何作死 | 將CPU、IO打爆》
《看我如何作死 | 網(wǎng)絡(luò)延遲、丟包、中斷一個都沒落下》
《干貨 |?阿里巴巴混沌測試工具ChaosBlade兩萬字解讀》
加技術(shù)群入口(備注:技術(shù)):>>>Learn More<<
免費(fèi)資料入口(備注:1024):>>>Learn More<<
免費(fèi)星球入口:>>>Free<<<
內(nèi)推通道>>>>
點(diǎn)個"在看"唄^_^
總結(jié)
以上是生活随笔為你收集整理的分布式事务选型的取舍 | 建议收藏的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 推荐 | 8 个 SpringBoot
- 下一篇: 程序员十大心愿,程序员:你这么了解我的心