异地多活场景下的数据同步之道 | 珍藏版
在當(dāng)今互聯(lián)網(wǎng)行業(yè),大多數(shù)互聯(lián)網(wǎng)從業(yè)者對"單元化"、"異地多活"這些詞匯已經(jīng)耳熟能詳。而數(shù)據(jù)同步是異地多活的基礎(chǔ),所有具備數(shù)據(jù)存儲能力的組件如:數(shù)據(jù)庫、緩存、MQ等,數(shù)據(jù)都可以進(jìn)行同步,形成一個龐大而復(fù)雜的數(shù)據(jù)同步拓?fù)洹?/p>
本文將先從概念上介紹單元化、異地多活、就近訪問等基本概念。之后,將以數(shù)據(jù)庫為例,講解在數(shù)據(jù)同步的情況下,如何解決數(shù)據(jù)回環(huán)、數(shù)據(jù)沖突、數(shù)據(jù)重復(fù)等典型問題。
1 什么是單元化
如果僅僅從"單元化”這個詞匯的角度來說,我們可以理解為將數(shù)據(jù)劃分到多個單元進(jìn)行存儲。"單元"是一個抽象的概念,通常與數(shù)據(jù)中心(IDC)概念相關(guān),一個單元可以包含多個IDC,也可以只包含一個IDC。本文假設(shè)一個單元只對應(yīng)一個IDC。
考慮一開始只有一個IDC的情況,所有用戶的數(shù)據(jù)都會寫入同一份底層存儲中,如下圖所示:
?? ???這種架構(gòu)是大多數(shù)中小型互聯(lián)網(wǎng)公司采用的方案,存在以下幾個問題:
? ? ? 1 不同地區(qū)的用戶體驗不同。一個IDC必然只能部署在一個地區(qū),例如部署在北京,那么北京的用戶訪問將會得到快速響應(yīng);但是對于上海的用戶,訪問延遲一般就會大一點,上海到北京的一個RTT可能有20ms左右。
?? ?? 2 容災(zāi)問題。這里容災(zāi)不是單臺機器故障,而是指機房斷電,自然災(zāi)害,或者光纖被挖斷等重大災(zāi)害。一旦出現(xiàn)這種問題,將無法正常為用戶提供訪問,甚至出現(xiàn)數(shù)據(jù)丟失的情況。這并不是不可能,例如:2015年,支付寶杭州某數(shù)據(jù)中心的光纜就被挖斷過;2018年9月,云棲大會上,螞蟻金服當(dāng)場把杭州兩個數(shù)據(jù)中心的網(wǎng)線剪斷。? ? ??
? ? ?為了解決這些問題,我們可以將服務(wù)部署到多個不同的IDC中,不同IDC之間的數(shù)據(jù)互相進(jìn)行同步。如下圖:
?
? ? ?通過這種方式,我們可以解決單機房遇到的問題:
?? ?? 1 用戶體驗。不同的用戶可以選擇離自己最近的機房進(jìn)行訪問。
?? ?? 2 容災(zāi)問題。當(dāng)一個機房掛了之后,我們可以將這個機房用戶的流量調(diào)度到另外一個正常的機房,由于不同機房之間的數(shù)據(jù)是實時同步的,用戶流量調(diào)度過去后,也可以正常訪問數(shù)據(jù) (故障發(fā)生那一刻的少部分?jǐn)?shù)據(jù)可能會丟失)。
? ? ? ? ?需要注意的是,關(guān)于容災(zāi),存在一個容災(zāi)級別的劃分,例如:單機故障,機架(rack)故障,機房故障,城市級故障等。我們這里只討論機房故障和城市故障。
-
機房容災(zāi) :?上面的案例中,我們使用了2個IDC,但是2個IDC并不能具備機房容災(zāi)能力。至少需要3個IDC,例如,一些基于多數(shù)派協(xié)議的一致性組件,如zookeeper,redis、etcd、consul等,需要得到大部分節(jié)點的同意。例如我們部署了3個節(jié)點,在只有2個機房的情況下, 必然是一個機房部署2個節(jié)點,一個機房部署一個節(jié)點。當(dāng)部署了2個節(jié)點的機房掛了之后,只剩下一個節(jié)點,無法形成多數(shù)派。在3機房的情況下,每個機房部署一個節(jié)點,任意一個機房掛了,還剩2個節(jié)點,還是可以形成多數(shù)派。這也就是我們常說的"兩地三中心”。
-
城市級容災(zāi):在發(fā)生重大自然災(zāi)害的情況下,可能整個城市的機房都無法訪問。一些組件,例如螞蟻的ocean base,為了達(dá)到城市級容災(zāi)的能力,使用的是"三地五中心"的方案。這種情況下,3個城市分別擁有2、2、1個機房。當(dāng)整個城市發(fā)生災(zāi)難時,其他兩個城市至少可以保證有3個機房依然是存活的,同樣可以形成多數(shù)派。
小結(jié):如果僅僅是考慮不同地區(qū)的用戶數(shù)據(jù)就近寫入距離最近的IDC,這是純粹意義上的”單元化”。不同單元之間的數(shù)據(jù)實時進(jìn)行同步,相互備份對方的數(shù)據(jù),才能做到真正意義上"異地多活”。實現(xiàn)單元化,技術(shù)層面我們要解決的事情很多,例如:流量調(diào)度,即如何讓用戶就近訪問附近的IDC;數(shù)據(jù)互通,如何實現(xiàn)不同機房之間數(shù)據(jù)的相互同步。流量調(diào)度不在本文的討論范疇內(nèi),數(shù)據(jù)同步是本文講解的重點。
2 如何實現(xiàn)數(shù)據(jù)同步
需要同步的組件有很多,例如數(shù)據(jù)庫,緩存等,這里以多個Mysql集群之間的數(shù)據(jù)同步為例進(jìn)行講解,實際上緩存的同步思路也是類似。
2.1 基礎(chǔ)知識
為了了解如何對不同mysql的數(shù)據(jù)相互進(jìn)行同步,我們先了解一下mysql主從復(fù)制的基本架構(gòu),如下圖所示:
通常一個mysql集群有一主多從構(gòu)成。用戶的數(shù)據(jù)都是寫入主庫Master,Master將數(shù)據(jù)寫入到本地二進(jìn)制日志binary log中。從庫Slave啟動一個IO線程(I/O Thread)從主從同步binlog,寫入到本地的relay log中,同時slave還會啟動一個SQL Thread,讀取本地的relay log,寫入到本地,從而實現(xiàn)數(shù)據(jù)同步。
基于這個背景知識,我們就可以考慮自己編寫一個組件,其作用類似與mysql slave,也是去主庫上拉取binlog,只不過binlog不是保存到本地,而是將binlog轉(zhuǎn)換成sql插入到目標(biāo)mysql集群中,實現(xiàn)數(shù)據(jù)的同步。
?? ?? ? 這并非是一件不可能完成的事,MySQL官網(wǎng)上已經(jīng)提供好所有你自己編寫一個mysql slave 同步binlog所需的相關(guān)背景知識,訪問這個鏈接:https://dev.mysql.com/doc/internals/en/client-server-protocol.html,你將可以看到mysql 客戶端與服務(wù)端的通信協(xié)議。下圖紅色框中展示了Mysql主從復(fù)制的相關(guān)協(xié)議:
?? ??? ?
?? ?? ? 當(dāng)然,筆者的目的并不是希望讀者真正的按照這里的介紹嘗試編寫一個mysql 的slave,只是想告訴讀者,模擬mysql slave拉取binlog并非是一件很神奇的事,只要你的網(wǎng)絡(luò)基礎(chǔ)知識夠扎實,完全可以做到。然而,這是一個龐大而復(fù)雜的工作。以一人之力,要完成這個工作,需要占用你大量的時間。好在,現(xiàn)在已經(jīng)有很多開源的組件,已經(jīng)實現(xiàn)了按照這個協(xié)議可以模擬成一個mysql的slave,拉取binlog。例如:
-
阿里巴巴開源的canal
-
美團(tuán)開源的puma
-
linkedin開源的databus? ? ? ?...
?? ?? 你可以利用這些組件來完成數(shù)據(jù)同步,而不必重復(fù)造輪子。 假設(shè)你采用了上面某個開源組件進(jìn)行同步,需要明白的是這個組件都要完成最基本的2件事:從源庫拉取binlog并進(jìn)行解析,筆者把這部分功能稱之為binlog syncer;將獲取到的binlog轉(zhuǎn)換成SQL插入目標(biāo)庫,這個功能稱之為sql writer。
?? ?? 為什么劃分成兩塊獨立的功能?因為binlog訂閱解析的實際應(yīng)用場景并不僅僅是數(shù)據(jù)同步,如下圖:
? ? ?? ?如圖所示,我們可以通過binlog來做很多事,如:
-
實時更新搜索引擎,如es中的索引信息
-
實時更新redis中的緩存
-
發(fā)送到kafka供下游消費,由業(yè)務(wù)方自定義業(yè)務(wù)邏輯處理等
-
...
? ? ?? ?因此,通常我們把binlog syncer單獨作為一個模塊,其只負(fù)責(zé)解析從數(shù)據(jù)庫中拉取并解析binlog,并在內(nèi)存中緩存(或持久化存儲)。另外,binlog syncer另外提一個sdk,業(yè)務(wù)方通過這個sdk從binlog syncer中獲取解析后的binlog信息,然后完成自己的特定業(yè)務(wù)邏輯處理。
?? ?? ? 顯然,在數(shù)據(jù)同步的場景下,我們可以基于這個sdk,編寫一個組件專門用于將binlog轉(zhuǎn)換為sql,插入目標(biāo)庫,實現(xiàn)數(shù)據(jù)同步,如下圖所示:
?? ??? ?北京用戶的數(shù)據(jù)不斷寫入離自己最近的機房的DB,通過binlog syncer訂閱這個庫binlog,然后下游的binlog writer將binlog轉(zhuǎn)換成SQL,插入到目標(biāo)庫。上海用戶類似,只不過方向相反,不再贅述。通過這種方式,我們可以實時的將兩個庫的數(shù)據(jù)同步到對端。當(dāng)然事情并非這么簡單,我們有一些重要的事情需要考慮。
2.2 如何獲取全量+增量數(shù)據(jù)?
? ? ?? ?通常,mysql不會保存所有的歷史binlog。原因在于,對于一條記錄,可能我們會更新多次,這依然是一條記錄,但是針對每一次更新操作,都會產(chǎn)生一條binlog記錄,這樣就會存在大量的binlog,很快會將磁盤占滿。因此DBA通常會通過一些配置項,來定時清理binlog,只保留最近一段時間內(nèi)的binlog。
? ? ? ?例如,官方版的mysql提供了expire_logs_days配置項,可以設(shè)置保存binlog的天數(shù),筆者這里設(shè)置為0,表示默認(rèn)不清空,如果將這個值設(shè)置大于0,則只會保存指定的天數(shù)。
? ? ? 另外一些mysql 的分支,如percona server,還可以指定保留binlog文件的個數(shù)。我們可以通過show binary logs來查看當(dāng)前mysql存在多少個binlog文件,如下圖:
?
? ? ?? ?通常,如果binlog如果從來沒被清理過,那么binlog文件名字后綴通常是000001,如果不是這個值,則說明可能已經(jīng)被清理過。當(dāng)然,這也不是絕對,例如執(zhí)行"reset master”命令,可以將所有的binlog清空,然后從000001重新開始計數(shù)。
? ? ? ?Whatever! 我們知道了,binlog可能不會一直保留,所以直接同步binlog,可能只能獲取到部分?jǐn)?shù)據(jù)。因此,通常的策略是,由DBA先dump一份源庫的完整數(shù)據(jù)快照,增量部分,再通過binlog訂閱解析進(jìn)行同步。
2.3?如何解決重復(fù)插入
考慮以下情況下,源庫中的一條記錄沒有唯一索引。對于這個記錄的binlog,通過sql writer將binlog轉(zhuǎn)換成sql插入目標(biāo)庫時,拋出了異常,此時我們并不知道知道是否插入成功了,則需要進(jìn)行重試。如果之前已經(jīng)是插入目標(biāo)庫成功,只是目標(biāo)庫響應(yīng)時網(wǎng)絡(luò)超時(socket timeout)了,導(dǎo)致的異常,這個時候重試插入,就會存在多條記錄,造成數(shù)據(jù)不一致。
因此,通常,在數(shù)據(jù)同步時,通常會限制記錄必須有要有主鍵或者唯一索引。
2.4?如何解決唯一索引沖突
?由于兩邊的庫都存在數(shù)據(jù)插入,如果都使用了同一個唯一索引,那么在同步到對端時,將會產(chǎn)生唯一索引沖突。對于這種情況,通常建議是使用一個全局唯一的分布式ID生成器來生成唯一索引,保證不會產(chǎn)生沖突。
另外,如果真的產(chǎn)生沖突了,同步組件應(yīng)該將沖突的記錄保存下來,以便之后的問題排查。
2.5?對于DDL語句如何處理
如果數(shù)據(jù)庫表中已經(jīng)有大量數(shù)據(jù),例如千萬級別、或者上億,這個時候?qū)τ谶@個表的DDL變更,將會變得非常慢,可能會需要幾分鐘甚至更長時間,而DDL操作是會鎖表的,這必然會對業(yè)務(wù)造成極大的影響。
因此,同步組件通常會對DDL語句進(jìn)行過濾,不進(jìn)行同步。DBA在不同的數(shù)據(jù)庫集群上,通過一些在線DDL工具(如gh-ost),進(jìn)行表結(jié)構(gòu)變更。
2.6?如何解決數(shù)據(jù)回環(huán)問題
數(shù)據(jù)回環(huán)問題,是數(shù)據(jù)同步過程中,最重要的問題。我們針對INSERT、UPDATE、DELETE三個操作來分別進(jìn)行說明:
INSERT操作
假設(shè)在A庫插入數(shù)據(jù),A庫產(chǎn)生binlog,之后同步到B庫,B庫同樣也會產(chǎn)生binlog。由于是雙向同步,這條記錄,又會被重新同步回A庫。由于A庫應(yīng)存在這條記錄了,產(chǎn)生沖突。
UPDATE操作
先考慮針對A庫某條記錄R只有一次更新的情況,將R更新成R1,之后R1這個binlog會被同步到B庫,B庫又將R1同步會A庫。對于這種情況下,A庫將不會產(chǎn)生binlog。因為A庫記錄當(dāng)前是R1,B庫同步回來的還是R1,意味著值沒有變。
在一個更新操作并沒有改變某條記錄值的情況下,mysql是不會產(chǎn)生binlog,相當(dāng)于同步終止。下圖演示了當(dāng)更新的值沒有變時,mysql實際上不會做任何操作:
? ??
?? ??? ?上圖演示了,數(shù)據(jù)中原本有一條記錄(1,"tianshouzhi”),之后執(zhí)行一個update語句,將id=1的記錄的name值再次更新為”tianshouzhi”,意味著值并沒有變更。這個時候,我們看到mysql 返回的影響的記錄函數(shù)為0,也就是說,并不會產(chǎn)生真是的更新操作。
?? ???? ?然而,這并不意味UPDATE 操作沒有問題,事實上,其比INSERT更加危險。考慮A庫的記錄R被連續(xù)更新了2次,第一次更新成R1,第二次被更新成R2;這兩條記錄變更信息都被同步到B庫,B也產(chǎn)生了R1和R2。由于B的數(shù)據(jù)也在往A同步,B的R1會被先同步到A,而A現(xiàn)在的值是R2,由于值不一樣,將會被更新成R1,并產(chǎn)生新的binlog;此時B的R2再同步會A,發(fā)現(xiàn)A的值是R1,又更新成R2,也產(chǎn)生binlog。由于B同步回A的操作,讓A又產(chǎn)生了新的binlog,A又要同步到B,如此反復(fù),陷入無限循環(huán)中。
DELETE操作
?? ??? ?同樣存在先后順序問題。例如先插入一條記錄,再刪除。B在A刪除后,又將插入的數(shù)據(jù)同步回A,接著再將A的刪除操作也同步回A,每次都會產(chǎn)生binlog,陷入無限回環(huán)。
?? ??? ?關(guān)于數(shù)據(jù)回環(huán)問題,筆者有著血的教訓(xùn),曾經(jīng)因為筆者的誤操作,將一個庫的數(shù)據(jù)同步到了自身,最終也導(dǎo)致無限循環(huán),原因分析與上述提到的UPDATE、DELETE操作類似,讀者可自行思考。
?? ??? ?針對上述數(shù)據(jù)同步到過程中可能會存在的數(shù)據(jù)回環(huán)問題,最終會導(dǎo)致數(shù)據(jù)無限循環(huán),因此我們必須要解決這個問題。由于存在多種解決方案,我們將在稍后統(tǒng)一進(jìn)行講解。
?2.7 數(shù)據(jù)同步架構(gòu)設(shè)計
?? ?? ? 現(xiàn)在,讓我們先把思路先從解決數(shù)據(jù)同步的具體細(xì)節(jié)問題轉(zhuǎn)回來,從更高的層面講解數(shù)據(jù)同步的架構(gòu)應(yīng)該如何設(shè)計。稍后的內(nèi)容中,我們將講解各種避免數(shù)據(jù)回環(huán)的各種解決方案。
?? ??? ?前面的架構(gòu)中,只涉及到2個DB的數(shù)據(jù)同步,如果有多個DB數(shù)據(jù)需要相互同步的情況下,架構(gòu)將會變得非常復(fù)雜。例如:
? ? ?這個圖演示的是四個DB之間數(shù)據(jù)需要相互同步,這種拓?fù)浣Y(jié)構(gòu)非常復(fù)雜。為了解決這種問題,我們可以將數(shù)據(jù)寫入到一個數(shù)據(jù)中轉(zhuǎn)站,例如MQ中進(jìn)行保存,如下:
我們在不同的機房各部署一套MQ集群,這個機房的binlog syncer將需要同步的DB binlog數(shù)據(jù)寫入MQ對應(yīng)的Topic中。對端機房如果需要同步這個數(shù)據(jù),只需要通過binlog writer訂閱這個topic,消費topic中的binlog數(shù)據(jù),插入到目標(biāo)庫中即可。一些MQ支持consumer group的概念,不同的consumer group的消費位置offset相互隔離,從而達(dá)到一份數(shù)據(jù),同時供多個消費者進(jìn)行訂閱的能力。
當(dāng)然,一些binlog訂閱解析組件,可能實現(xiàn)了類似于MQ的功能,此時,則不需要獨立部署MQ。
那么MQ應(yīng)該選擇什么呢?別問,問就是Kafka,具體原因問廝大。
????
3 數(shù)據(jù)據(jù)回環(huán)問題解決方案
?? ??? ?數(shù)據(jù)回環(huán)問題有多種解決方案,通過排除法,一一進(jìn)行講解。
?3.1 同步操作不生成binlog
? ? ?? ?在mysql中,我們可以設(shè)置session變量,來控制當(dāng)前會話上的更新操作,不產(chǎn)生binlog。這樣當(dāng)往目標(biāo)庫插入數(shù)據(jù)時,由于不產(chǎn)生binlog,也就不會被同步會源庫了。為了演示這個效果,筆者清空了本機上的所有binlog(執(zhí)行reset master),現(xiàn)在如下圖所示:
?? ?忽略這兩個binlog event,binlog文件格式最開始就是這兩個event。
????接著,筆者執(zhí)行set sql_log_bin=0,然后插入一條語句,最后可以看到的確沒有產(chǎn)生新的binlog事件:
?? ??? ?通過這種方式,貌似可以解決數(shù)據(jù)回環(huán)問題。目標(biāo)庫不產(chǎn)生binlog,就不會被同步會源庫。但是,答案是否定的。我們是往目標(biāo)庫的master插入數(shù)據(jù),如果不產(chǎn)生binlog,目標(biāo)庫的slave也無法同步數(shù)據(jù),主從數(shù)據(jù)不一致。所以,需要排除這種方案。
?? ?? ? 提示:如果恢復(fù)set sql_log_bin=1,插入語句是會產(chǎn)生binlog,讀者可以自行模擬。
?3.2 控制binlog同步方向
?? ?? ? 既然不產(chǎn)生binlog不能解決問題。那么換一種思路,可以產(chǎn)生binlog。當(dāng)把一個binlog轉(zhuǎn)換成sql時,插入某個庫之前,我們先判斷這條記錄是不是原本就是這個庫產(chǎn)生的,如果是,那么就拋棄,也可以避免回環(huán)問題。
?? ?? ? 現(xiàn)在問題就變?yōu)?#xff0c;如何給binlog加個標(biāo)記,表示其實那個mysql集群產(chǎn)生的。這也有幾種方案,下面一一講述。
?3.2.1 ROW模式下的SQL
?? ?? ? mysql主從同步,binlog復(fù)制一般有3種模式。STATEMENT,ROW,MIXED。默認(rèn)情況下,STATEMENT模式只記錄SQL語句,ROW模式只記錄字段變更前后的值,MIXED模式是二者混合。?binlog同步一般使用的都是ROW模式,高版本Mysql主從同步默認(rèn)也是ROW模式。
我們想采取的方案是,在執(zhí)行的SQL之前加上一段特殊標(biāo)記,表示這個SQL的來源。例如
/*IDC1:DB1*/insert into users(name) values("tianbowen")?? ?? ? 其中/*IDC1:DB1*/是一個注釋,表示這個SQL原始在是IDC1的DB1中產(chǎn)生的。之后,在同步的時候,解析出SQL中的IDC信息,就能判斷出是不是自己產(chǎn)生的數(shù)據(jù)。
?? ?? ? 然而,ROW模式下,默認(rèn)只記錄變更前后的值,不記錄SQL。所以,我們要通過一個開關(guān),讓Mysql在ROW模式下也記錄INSERT、UPDATE、DELETE的SQL語句。具體做法是,在mysql的配置文件中,添加以下配置:
binlog_rows_query_log_events =1?? ?? ? 這個配置可以讓mysql在binlog中產(chǎn)生ROWS_QUERY_LOG_EVENT類型的binlog事件,其記錄的就是執(zhí)行的SQL。
? ? ? ? 通過這種方式,我們就記錄下的一個binlog最初是由哪一個集群產(chǎn)生的,之后在同步的時候,sql writer判斷目標(biāo)機房和當(dāng)前binlog中包含的機房相同,則拋棄這條數(shù)據(jù),從而避免回環(huán)。
?? ?? ? 這種思路,功能上沒問題,但是在實踐中,確非常麻煩。首先,讓業(yè)務(wù)對執(zhí)行的每條sql都加上一個這樣的標(biāo)識,幾乎不可能。另外,如果忘記加了,就不知道數(shù)據(jù)的來源了。如果采用這種方案,可以考慮在數(shù)據(jù)庫訪問層中間件層面添加支持在sql之前增加/*..*/的功能,統(tǒng)一對業(yè)務(wù)屏蔽。即使這樣,也不完美,不能保證所有的sql都通過中間件來來寫入,例如DBA的一些日常運維操作,或者手工通過mysql命令行來操作數(shù)據(jù)庫時,肯定會存在沒有添加機房信息的情況。
?? ??? ?總的來說,這個方案不是那么完美。
?3.2.2 通過附加表
?? ??? ?這種方案目前很多知名互聯(lián)網(wǎng)公司在使用。大致思路是,在db中都加一張額外的表,例如叫direction,記錄一個binlog產(chǎn)生的源集群的信息。例如
CREATE?TABLE?`direction`?(`idc`?varchar(255)?not?null,`db_cluster`?varchar(255)?not?null, ) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4idc字段用于記錄某條記錄原始產(chǎn)生的IDC,db_cluster用于記錄原始產(chǎn)生的數(shù)據(jù)庫集群(注意這里要使用集群的名稱,不能是server_id,因為可能會發(fā)生主從切換)。
??? ??假設(shè)用戶在IDC1的庫A插入的一條記錄(也可以在事務(wù)中插入多條記錄,單條記錄,即使不開啟事務(wù),mysql默認(rèn)也會開啟事務(wù)):
BEGIN; insert?into?users(name)?values("tianshouzhi”); COMMIT;那么A庫數(shù)據(jù)binlog通過sql writer同步到目標(biāo)庫B時,sql writer可以提前對事務(wù)中的信息可以進(jìn)行一些修改,,如下所示:
BEGIN; #往目標(biāo)庫同步時,首先額外插入一條記錄,表示這個事務(wù)中的數(shù)據(jù)都是A產(chǎn)生的。 insert?into?direction(idc,db_cluster)?values("IDC1”,"DB_A”) #插入原來的記錄信息 insert?into?users(name)?values("tianshouzhi”); COMMIT;之后B庫的數(shù)據(jù)往A同步時,就可以根據(jù)binlog中的第一條記錄的信息,判斷這個記錄原本就是A產(chǎn)生的,進(jìn)行拋棄,通過這種方式來避免回環(huán)。這種方案已經(jīng)已經(jīng)過很多的公司的實際驗證。
3.2.3 通過GTID
Mysql 5.6引入了GTID(全局事務(wù)id)的概念,極大的簡化的DBA的運維。在數(shù)據(jù)同步的場景下,GTID依然也可以發(fā)揮極大的威力。
GTID 由2個部分組成:
server_uuid:transaction_id其中server_uuid是mysql隨機生成的,全局唯一。transaction_id事務(wù)id,默認(rèn)情況下每次插入一個事務(wù),transaction_id自增1。注意,這里并不會對GTID進(jìn)行全面的介紹,僅說明其在數(shù)據(jù)同步的場景下,如何避免回環(huán)、數(shù)據(jù)重復(fù)插入的問題。
GTID提供了一個會話級變量gtid_next,指示如何產(chǎn)生下一個GTID。可能的取值如下:
-
AUTOMATIC: 自動生成下一個GTID,實現(xiàn)上是分配一個當(dāng)前實例上尚未執(zhí)行過的序號最小的GTID。
-
ANONYMOUS: 設(shè)置后執(zhí)行事務(wù)不會產(chǎn)生GTID,顯式指定的GTID。
?? ?默認(rèn)情況下,是AUTOMATIC,也就是自動生成的,例如我們執(zhí)行sql:
insert?into?users(name)?values("tianbowen”);
?? ?產(chǎn)生的binlog信息如下:
可以看到,GTID會在每個事務(wù)(Query->...->Xid)之前,設(shè)置這個事務(wù)下一次要使用到的GTID。
從源庫訂閱binlog的時候,由于這個GTID也可以被解析到,之后在往目標(biāo)庫同步數(shù)據(jù)的時候,我們可以顯示的的指定這個GTID,不讓目標(biāo)自動生成。也就是說,往目標(biāo)庫,同步數(shù)據(jù)時,變成了2條SQL:
SET?GTID_NEXT=?'09530823-4f7d-11e9-b569-00163e121964:1’ insert into users(name) values("tianbowen")???????由于我們顯示指定了GTID,目標(biāo)庫就會使用這個GTID當(dāng)做當(dāng)前事務(wù)ID,不會自動生成。同樣,這個操作也會在目標(biāo)庫產(chǎn)生binlog信息,需要同步回源庫。再往源庫同步時,我們按照相同的方式,先設(shè)置GTID,在執(zhí)行解析binlog后得到的SQL,還是上面的內(nèi)容
SET GTID_NEXT= '09530823-4f7d-11e9-b569-00163e121964:1'insert into users(name) values("tianbowen")???????? ? ? ? 由于這個GTID在源庫中已經(jīng)存在了,插入記錄將會被忽略,演示如下:
mysql>?SET?GTID_NEXT=?'09530823-4f7d-11e9-b569-00163e121964:1'; Query?OK,?0?rows?affected?(0.00?sec) mysql>?insert?into?users(name)?values("tianbowen"); Query OK, 0 rows affected (0.01 sec) #注意這里,影響的記錄行數(shù)為0???????注意這里,對于一條insert語句,其影響的記錄函數(shù)居然為0,也就會插入并沒有產(chǎn)生記錄,也就不會產(chǎn)生binlog,避免了循環(huán)問題。
如何做到的呢?mysql會記錄自己執(zhí)行過的所有GTID,當(dāng)判斷一個GTID已經(jīng)執(zhí)行過,就會忽略。通過如下sql查看:
mysql>?show?global?variables?like?"gtid_executed";+---------------+------------------------------------------+|?Variable_name?|?Value????????????????????????????????????|+---------------+------------------------------------------+|?gtid_executed?|?09530823-4f7d-11e9-b569-00163e121964:1-5?|+---------------+------------------------------------------+?? ?? ? 上述value部分,冒號":"前面的是server_uuid,冒號后面的1-5,是一個范圍,表示已經(jīng)執(zhí)行過1,2,3,4,5這個幾個transaction_id。這里就能解釋了,在GTID模式的情況下,為什么前面的插入語句影響的記錄函數(shù)為0了。
?? ?? ? 顯然,GTID除了可以幫助我們避免數(shù)據(jù)回環(huán)問題,還可以幫助我們解決數(shù)據(jù)重復(fù)插入的問題,對于一條沒有主鍵或者唯一索引的記錄,即使重復(fù)插入也沒有,只要GTID已經(jīng)執(zhí)行過,之后的重復(fù)插入都會忽略。
?? ?? ? 當(dāng)然,我們還可以做得更加細(xì)致,不需要每次都往目標(biāo)庫設(shè)置GTID_NEXT,這畢竟是一次網(wǎng)絡(luò)通信。sql writer在往目標(biāo)庫插入數(shù)據(jù)之前,先判斷目標(biāo)庫的server_uuid是不是和當(dāng)前binlog事務(wù)信息攜帶的server_uuid相同,如果相同,則可以直接丟棄。查看目標(biāo)庫的gtid,可以通過以下sql執(zhí)行:
mysql>?show?variables?like?"server_uuid";+---------------+--------------------------------------+|?Variable_name?|?Value????????????????????????????????|+---------------+--------------------------------------+|?server_uuid???|?09530823-4f7d-11e9-b569-00163e121964?|+---------------+--------------------------------------+?? ?? ? GTID應(yīng)該算是一個終極的數(shù)據(jù)回環(huán)解決方案,mysql原生自帶,比添加一個輔助表的方式更輕量,開銷也更低。需要注意的是,這倒并不是一定說GTID的方案就比輔助表好,因為輔助表可以添加機房等額外信息。在一些場景下,如果下游需要知道這條記錄原始產(chǎn)生的機房,還是需要使用輔助表。
4 開源組件介紹canal/otter
前面深入講解了單元化場景下數(shù)據(jù)同步的基礎(chǔ)知識。讀者可能比較感興趣的是,哪些開源組件在這些方面做的比較好。筆者建議的首選,是canal/otter組合。
canal的作用就是類似于前面所述的binlog syncer,拉取解析binlog。otter是canal的客戶端,專門用于進(jìn)行數(shù)據(jù)同步,類似于前文所講解的sql writer。并且,canal的最新版本已經(jīng)實現(xiàn)了GTID。
總結(jié)
以上是生活随笔為你收集整理的异地多活场景下的数据同步之道 | 珍藏版的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 老大难的空指针,如何优雅处理?
- 下一篇: Spring StateMachine,