消息广播的实现原理
如果大家了解分布式事務(wù)的2pc和3pc協(xié)議的話(不了解也沒關(guān)系,我們后面會講),消息廣播的過程實(shí)際上是一個簡化版本的二階段提交過程
1. leader接收到消息請求后,將消息賦予一個全局唯一的64位自增id,叫:zxid,通過zxid的大小比較既可以實(shí)現(xiàn)因果有序這個特征
2. leader為每個follower準(zhǔn)備了一個FIFO隊列(通過TCP協(xié)議來實(shí)現(xiàn),以實(shí)現(xiàn)了全局有序這一個特點(diǎn))將帶有zxid的消息作為一個提案(proposal)分發(fā)給所有的follower
3. 當(dāng)follower接收到proposal,先把proposal寫到磁盤,寫入成功以后再向leader回復(fù)一個ack?
4. 當(dāng)leader接收到合法數(shù)量(超過半數(shù)節(jié)點(diǎn))的ACK后,leader就會向這些follower發(fā)送commit命令,同時會在本地執(zhí)行該消息
5. 當(dāng)follower收到消息的commit命令以后,會提交該消息
ps:?和完整的2pc事務(wù)不一樣的地方在于,zab協(xié)議不能終止事務(wù),follower節(jié)點(diǎn)要么ACK給leader,要么拋棄leader,只需要保證過半數(shù)的節(jié)點(diǎn)響應(yīng)這個消息并提交了即可,雖然在某一個時刻follower節(jié)點(diǎn)和leader節(jié)點(diǎn)的狀態(tài)會不一致,但是也是這個特性提升了集群的整體性能。?當(dāng)然這種數(shù)據(jù)不一致的問題,zab協(xié)議提供了一種恢復(fù)模式來進(jìn)行數(shù)據(jù)恢復(fù),后續(xù)講解
這里需要注意的是:
leader的投票過程,不需要Observer的ack,也就是Observer不需要參與投票過程,但是Observer必須要同步Leader的數(shù)據(jù)從而在處理請求的時候保證數(shù)據(jù)的一致性
?
總結(jié)