當前位置：首頁 >

ZAB算法详解

發布時間：2024/4/18 39 豆豆

生活随笔收集整理的這篇文章主要介紹了 ZAB算法详解小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

前言

ZAB 協議，該協議應該是所有一致性協議中生產環境中應用最多的了。為什么呢？因為他是為 Zookeeper 設計的分布式一致性協議！

1. 什么是 ZAB 協議？ ZAB 協議介紹

ZAB 協議全稱：Zookeeper Atomic Broadcast（Zookeeper 原子廣播協議）。

Zookeeper 是一個為分布式應用提供高效且可靠的分布式協調服務。在解決分布式一致性方面，Zookeeper 并沒有使用 Paxos ，而是采用了 ZAB 協議。

ZAB 協議定義：ZAB 協議是為分布式協調服務 Zookeeper 專門設計的一種支持?崩潰恢復?和?原子廣播?協議。下面我們會重點講這兩個東西。

基于該協議，Zookeeper 實現了一種?主備模式?的系統架構來保持集群中各個副本之間數據一致性。具體如下圖所示：

上圖顯示了 Zookeeper 如何處理集群中的數據。所有客戶端寫入數據都是寫入到主進程（稱為 Leader）中，然后，由 Leader 復制到備份進程（稱為 Follower）中。從而保證數據一致性。從設計上看，和 Raft 類似。

那么復制過程又是如何的呢？復制過程類似 2PC，ZAB 只需要 Follower 有一半以上返回 Ack 信息就可以執行提交，大大減小了同步阻塞。也提高了可用性。

簡單介紹完，開始重點介紹?消息廣播?和?崩潰恢復。整個 Zookeeper 就是在這兩個模式之間切換。?簡而言之，當 Leader 服務可以正常使用，就進入消息廣播模式，當 Leader 不可用時，則進入崩潰恢復模式。

2. 消息廣播

ZAB 協議的消息廣播過程使用的是一個原子廣播協議，類似一個?二階段提交過程。對于客戶端發送的寫請求，全部由 Leader 接收，Leader 將請求封裝成一個事務 Proposal，將其發送給所有 Follwer ，然后，根據所有 Follwer 的反饋，如果超過半數成功響應，則執行 commit 操作（先提交自己，再發送 commit 給所有 Follwer）。

基本上，整個廣播流程分為 3 步驟：

1.將數據都復制到 Follwer 中

2.等待 Follwer 回應 Ack，最低超過半數即成功

3.當超過半數成功回應，則執行 commit ，同時提交自己

通過以上 3 個步驟，就能夠保持集群之間數據的一致性。實際上，在 Leader 和 Follwer 之間還有一個消息隊列，用來解耦他們之間的耦合，避免同步，實現異步解耦。

還有一些細節：

Leader 在收到客戶端請求之后，會將這個請求封裝成一個事務，并給這個事務分配一個全局遞增的唯一 ID，稱為事務ID（ZXID），ZAB 協議需要保證事務的順序，因此必須將每一個事務按照 ZXID 進行先后排序然后處理。

在 Leader 和 Follwer 之間還有一個消息隊列，用來解耦他們之間的耦合，解除同步阻塞。

zookeeper集群中為保證任何所有進程能夠有序的順序執行，只能是 Leader 服務器接受寫請求，即使是 Follower 服務器接受到客戶端的請求，也會轉發到 Leader 服務器進行處理。

實際上，這是一種簡化版本的 2PC，不能解決單點問題。等會我們會講述 ZAB 如何解決單點問題（即 Leader 崩潰問題）。

3. 崩潰恢復

剛剛我們說消息廣播過程中，Leader 崩潰怎么辦？還能保證數據一致嗎？如果 Leader 先本地提交了，然后 commit 請求沒有發送出去，怎么辦？

實際上，當 Leader 崩潰，即進入我們開頭所說的崩潰恢復模式（崩潰即：Leader 失去與過半 Follwer 的聯系）。下面來詳細講述。

假設1：Leader 在復制數據給所有 Follower 之后崩潰，怎么辦？
假設2：Leader 在收到 Ack 并提交了自己，同時發送了部分 commit 出去之后崩潰怎么辦？

針對這些問題，ZAB 定義了 2 個原則：

ZAB 協議確保那些已經在 Leader 提交的事務最終會被所有服務器提交。

ZAB 協議確保丟棄那些只在 Leader 提出/復制，但沒有提交的事務。

所以，ZAB 設計了下面這樣一個選舉算法：
能夠確保提交已經被 Leader 提交的事務，同時丟棄已經被跳過的事務。

針對這個要求，如果讓 Leader 選舉算法能夠保證新選舉出來的 Leader 服務器擁有集群中所有機器編號（即 ZXID 最大）的事務，那么就能夠保證這個新選舉出來的 Leader 一定具有所有已經提交的提案。
而且這么做有一個好處是：可以省去 Leader 服務器檢查事務的提交和丟棄工作的這一步操作。

這樣，我們剛剛假設的兩個問題便能夠解決。假設 1 最終會丟棄調用沒有提交的數據，假設 2 最終會同步所有服務器的數據。這個時候，就引出了一個問題，如何同步？

4. 數據同步

當崩潰恢復之后，需要在正式工作之前（接收客戶端請求），Leader 服務器首先確認事務是否都已經被過半的 Follwer 提交了，即是否完成了數據同步。目的是為了保持數據一致。

當所有的 Follwer 服務器都成功同步之后，Leader 會將這些服務器加入到可用服務器列表中。

實際上，Leader 服務器處理或丟棄事務都是依賴著 ZXID 的，那么這個 ZXID 如何生成呢？

答：在 ZAB 協議的事務編號 ZXID 設計中，ZXID 是一個 64 位的數字，其中低 32 位可以看作是一個簡單的遞增的計數器，針對客戶端的每一個事務請求，Leader 都會產生一個新的事務 Proposal 并對該計數器進行 + 1 操作。

而高 32 位則代表了 Leader 服務器上取出本地日志中最大事務 Proposal 的 ZXID，并從該 ZXID 中解析出對應的 epoch 值，然后再對這個值加一。

高 32 位代表了每代 Leader 的唯一性，低 32 代表了每代 Leader 中事務的唯一性。同時，也能讓 Follwer 通過高 32 位識別不同的 Leader。簡化了數據恢復流程。

基于這樣的策略：當 Follower 鏈接上 Leader 之后，Leader 服務器會根據自己服務器上最后被提交的 ZXID 和 Follower 上的 ZXID 進行比對，比對結果要么回滾，要么和 Leader 同步。

5. 總結

ZAB 協議和我們之前看的 Raft 協議實際上是有相似之處的，比如都有一個 Leader，用來保證一致性（Paxos 并沒有使用 Leader 機制保證一致性）。再有采取過半即成功的機制保證服務可用（實際上 Paxos 和 Raft 都是這么做的）。

ZAB 讓整個 Zookeeper 集群在兩個模式之間轉換，消息廣播和崩潰恢復，消息廣播可以說是一個簡化版本的 2PC，通過崩潰恢復解決了 2PC 的單點問題，通過隊列解決了 2PC 的同步阻塞問題。

而支持崩潰恢復后數據準確性的就是數據同步了，數據同步基于事務的 ZXID 的唯一性來保證。通過 + 1 操作可以辨別事務的先后順序。

選主過程詳解：https://blog.csdn.net/yizhiniu_xuyw/article/details/114877950

總結

以上是生活随笔為你收集整理的ZAB算法详解的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇： Paxos、Raft分布式一致性算法应用
下一篇： ZAB协议选主过程详解