区块链共识机制分析——论PoW,PoS,DPos和DAG的优缺点
近期,隨著區(qū)塊鏈技術(shù)在社區(qū)中的聲音越來越大,業(yè)界已經(jīng)開始從技術(shù)角度對區(qū)塊鏈進(jìn)行全方位的解讀。作為第一批區(qū)塊鏈技術(shù)的實現(xiàn),傳統(tǒng)比特幣與以太坊在共識機(jī)制、存儲機(jī)制、智能合約機(jī)制、跨鏈通訊機(jī)制等領(lǐng)域并沒有非常嚴(yán)密的設(shè)計,從而引發(fā)了一些在數(shù)據(jù)庫與存儲領(lǐng)域比較常見的問題,導(dǎo)致其數(shù)據(jù)規(guī)模無法無限增加(當(dāng)前僅幾百GB就產(chǎn)生了嚴(yán)重的性能瓶頸,幾乎不可能到達(dá)上百TB規(guī)模),吞吐量極為有限,使其不可能適應(yīng)通用分布式數(shù)據(jù)存儲或通用結(jié)算體系的要求。
作為數(shù)據(jù)庫內(nèi)核行業(yè)十幾年的老兵,筆者將會從共識、存儲、智能合約、多鏈、快速檢索、以及通用接口等幾個維度對區(qū)塊鏈技術(shù)進(jìn)行闡述,并會與數(shù)據(jù)庫及大數(shù)據(jù)分布式計算技術(shù)進(jìn)行橫向?qū)Ρ取?/p>
區(qū)塊鏈的本質(zhì)即分布式多活數(shù)據(jù)庫。
從產(chǎn)品功能的角度看,當(dāng)前的區(qū)塊鏈產(chǎn)品與數(shù)據(jù)庫相比存在極大的差距。尤其是對于在業(yè)界存在了幾十年的關(guān)系型數(shù)據(jù)庫,其主要核心功能包括增刪改查,而主要結(jié)構(gòu)則包括SQL解析、日志、數(shù)據(jù)管理、以及索引管理幾大模塊。
而大數(shù)據(jù)技術(shù)興起后,業(yè)界開始使用PC服務(wù)器替代傳統(tǒng)小型機(jī),為了避免服務(wù)器掉電導(dǎo)致的數(shù)據(jù)頁損壞,分布式數(shù)據(jù)庫或存儲普遍使用三副本對數(shù)據(jù)進(jìn)行冗余保存。
盡管從功能上看,當(dāng)前區(qū)塊鏈技術(shù)僅僅是數(shù)據(jù)庫的一個微小子集,但是其一系列設(shè)計機(jī)制,與傳統(tǒng)數(shù)據(jù)庫的內(nèi)核理念極為相似。譬如,從其傳輸和存儲的數(shù)據(jù)結(jié)構(gòu)上來看,區(qū)塊鏈的鏈?zhǔn)浇Y(jié)構(gòu)來源于傳統(tǒng)數(shù)據(jù)庫的事務(wù)日志。任何數(shù)據(jù)庫的DBA都知道,數(shù)據(jù)庫的事務(wù)日志本質(zhì)上就是不可更改的鏈?zhǔn)浇Y(jié)構(gòu),事務(wù)中的每一條操作記錄都會有一個反向指針指向該事務(wù)中的上一條記錄。因此,區(qū)塊鏈的鏈?zhǔn)浇Y(jié)構(gòu)本質(zhì)上脫胎于數(shù)據(jù)庫事務(wù)日志,同時增加了區(qū)塊之間的反向哈希值作為指針,且引入了默克爾樹結(jié)構(gòu)進(jìn)行快速數(shù)據(jù)校驗。因而,我們可以安全地進(jìn)行認(rèn)為:區(qū)塊鏈的鏈?zhǔn)浇Y(jié)構(gòu)在存儲體系中等價于數(shù)據(jù)庫的事務(wù)日志。本質(zhì)上數(shù)據(jù)庫的任何操作同樣是不可篡改的,只不過當(dāng)前大部分?jǐn)?shù)據(jù)庫不會對外暴露事務(wù)日志的解析工具,僅保存每一條記錄的最終狀態(tài)而已。
(圖1:數(shù)據(jù)庫體系結(jié)構(gòu),黃色部分代表區(qū)塊鏈同樣包含的組建)
?
1.1 一致性原理對比
?
在分布式數(shù)據(jù)庫中,當(dāng)前普遍采用PAXOS或RAFT算法進(jìn)行數(shù)據(jù)多份冗余的一致性協(xié)商。一般來說,在分布式數(shù)據(jù)庫體系中,每個數(shù)據(jù)分片由至少3個互相冗余備份的節(jié)點構(gòu)成,而在正常運行時的數(shù)據(jù)庫每個分片都會存在一個主節(jié)點與兩個從節(jié)點。其中主節(jié)點負(fù)責(zé)數(shù)據(jù)的讀寫操作,從節(jié)點進(jìn)行只讀操作。當(dāng)主節(jié)點寫入數(shù)據(jù)時,其事務(wù)日志會被實時同步給其他從節(jié)點進(jìn)行回放,以達(dá)到主從節(jié)點之間數(shù)據(jù)一致性的目標(biāo)。
(圖2:數(shù)據(jù)庫主從節(jié)點同步)
那么對比區(qū)塊鏈的體系,可以認(rèn)為數(shù)據(jù)庫領(lǐng)域的主節(jié)點即日志生成節(jié)點,其每次生成事務(wù)日志的功能,與區(qū)塊鏈中每次出塊時礦工的功能完全等價。唯一不同的是,數(shù)據(jù)庫在每次操作時對日志實時廣播到從節(jié)點中,并且在事務(wù)提交時進(jìn)行一致性判斷。而區(qū)塊鏈則采用檢查點方式,每個節(jié)點接收自己的交易請求,并將請求廣播到其他節(jié)點中,而每一次出塊操作即產(chǎn)生一個檢查點,該檢查點包含的信息即出塊節(jié)點向區(qū)塊中寫入的所有記錄。這些記錄被發(fā)送到其他節(jié)點后,每個節(jié)點對數(shù)據(jù)塊中的記錄進(jìn)行驗證并永久寫入自身的交易日志(即區(qū)塊文件)。
(圖3:區(qū)塊鏈節(jié)點互相對等)
但是,區(qū)塊鏈和數(shù)據(jù)庫在一致性選擇上最大的不同在于哪個節(jié)點成為檢查點發(fā)起的節(jié)點。數(shù)據(jù)庫由于采用了主從機(jī)制,主節(jié)點永遠(yuǎn)是日志的發(fā)起節(jié)點,而從節(jié)點永遠(yuǎn)是日志回放與驗證節(jié)點。但是區(qū)塊鏈則不同,其采用某些算法(例如PoW、PoS、DPoS等)在多個參與節(jié)點之間定期選取一個節(jié)點進(jìn)行檢查點確認(rèn),這也是區(qū)塊鏈號稱自身安全的一個理由所在:在全網(wǎng)大量的節(jié)點中攻擊者無法確定下一個檢查點確認(rèn)的節(jié)點是誰(當(dāng)然,就算攻擊者確定了下一個出塊節(jié)點,還有一系列的數(shù)字簽名機(jī)制保障事務(wù)不被偽造和篡改)。
因此我們可以安全地認(rèn)為,從檢查點節(jié)點選擇的領(lǐng)域來看,傳統(tǒng)分布式數(shù)據(jù)庫確定主節(jié)點生成事務(wù)日志的機(jī)制,是區(qū)塊鏈共識機(jī)制的一種簡單實現(xiàn)。也就是說,如果區(qū)塊鏈共識機(jī)制每次都選取同一個節(jié)點作為出塊節(jié)點,其機(jī)制基本等價于分布式數(shù)據(jù)庫的主從復(fù)制原理(數(shù)據(jù)庫按照事務(wù)提交進(jìn)行一致性驗證,區(qū)塊鏈不存在事務(wù)的概念,因此按照數(shù)據(jù)塊進(jìn)行一致性驗證)。
(圖4:數(shù)據(jù)庫以提交回滾操作作為檢查點,區(qū)塊鏈以生成區(qū)塊作為檢查點)
?
1.2 共識算法
?
由于區(qū)塊鏈體系中并不存在某個節(jié)點永久作為檢查點確認(rèn)的節(jié)點,而是每個參與節(jié)點都有機(jī)會被選舉成為該角色,因此在每個節(jié)點都能夠進(jìn)行讀寫操作時,整個區(qū)塊鏈體系從功能上等價于一個不支持事務(wù)機(jī)制的多活數(shù)據(jù)庫。而具體使用哪種算法選擇出塊節(jié)點(PoW與PoS之爭)、哪些節(jié)點在接收到數(shù)據(jù)塊時該如何驗證(PoS與DPoS之爭)、節(jié)點之間的數(shù)據(jù)以什么方式進(jìn)行傳播(DAG與鏈?zhǔn)浇Y(jié)構(gòu)之爭)、以及如何確保一條交易被大多數(shù)參與節(jié)點所接受(PBFT、Paxos、RAFT、以及各種分叉解決方案等算法之爭,Hyperledger 1.0甚至直接使用中央Kafka做排序也是醉了),則是區(qū)塊鏈共識算法需要回答的問題。不同的解決方式制約著區(qū)塊鏈的一致性、性能、吞吐量、以及可靠性。
1.2.1 挖礦
挖礦是來自于比特幣的一種說法,其本質(zhì)在于多個節(jié)點通過PoW算法選舉出一致性檢查節(jié)點。關(guān)于PoW的說明業(yè)界已有無數(shù)文章分析,這里筆者不再贅述細(xì)節(jié)。實際上,從數(shù)據(jù)管理的角度來看,PoW是一種效率極為低下的暴力機(jī)制,通過不停地循環(huán)生成隨機(jī)數(shù)并進(jìn)行散列,通過網(wǎng)絡(luò)預(yù)先廣播的規(guī)則(復(fù)雜度),讓每個參與的節(jié)點自證明其是否符合成為檢查點的資格。
對比分布式數(shù)據(jù)庫的Paxos或RAFT算法,每個參與節(jié)點默認(rèn)自身有資格成為主節(jié)點,在原本的主節(jié)點無法連通的情況下通過最新事務(wù)號或其他原則相互投票,從而選舉出新的主節(jié)點。而由于競爭節(jié)點過多,區(qū)塊鏈作為一個擁有幾萬甚至幾十萬復(fù)制節(jié)點的多活數(shù)據(jù)庫,繼續(xù)采用Raft或Paxos算法一方面復(fù)雜度太高,另一方面無法解決拜占庭問題,因此比特幣采用PoW機(jī)制,通過大家公認(rèn)的某種機(jī)制,讓每個參與節(jié)點首先自己判斷是否符合要求(即生成了隨機(jī)數(shù)后自己進(jìn)行散列并驗證)。當(dāng)節(jié)點自身認(rèn)為符合條件后,將之前生成的隨機(jī)數(shù)以及打包好的日志(數(shù)據(jù)塊)廣播給集群中其他節(jié)點,從而大幅度減少了節(jié)點間相互投票所需的復(fù)雜度。
節(jié)點通過循環(huán)生成隨機(jī)數(shù)并自我驗證的過程,即PoW中所謂的“挖礦”階段。
因此,如果把挖礦的概念擴(kuò)展,不論是PoS、PoW或DPoS算法中,節(jié)點間競爭成為檢查點的過程即挖礦過程。
1.2.2 PoW與PoS的選擇
PoW是一種極為粗暴原始,但卻又及其有效防止惡意攻擊的選舉算法。該算法與計算機(jī)內(nèi)核中多線程協(xié)作的自旋鎖有異曲同工之處,自旋鎖的原理在于通過線程自身不停循環(huán)判斷一個內(nèi)存地址狀態(tài),直到該狀態(tài)設(shè)置為空閑后,通過CPU原子操作將其置為鎖定狀態(tài),以此和其他線程進(jìn)行互斥的機(jī)制。這種機(jī)制和PoW極為相似。
而PoS更傾向于類似Raft投票機(jī)制,通過固定時間協(xié)調(diào)所有節(jié)點參與投票,根據(jù)某種規(guī)則(例如持有代幣數(shù)量、或提供存儲空間大小等)判斷每個節(jié)點的權(quán)重,最后選取權(quán)重最高的節(jié)點作為檢查點節(jié)點。而在數(shù)據(jù)庫一致性選擇的Raft算法中,普遍會根據(jù)最新事務(wù)號作為權(quán)重,多個節(jié)點之間優(yōu)先選擇包含最新事務(wù)記錄的節(jié)點作為主節(jié)點。
因此,可以看到PoW與PoS最大的區(qū)別在于,PoW在算法復(fù)雜度足夠高的前提下,基本不需要太多的節(jié)點間互相通訊和確認(rèn),對代碼的實現(xiàn)要求極低。而PoS對于多節(jié)點間一致性驗證、防偽等要求較高,但是很大程度上可以沿用傳統(tǒng)一致性選舉的思路進(jìn)行一定程度的優(yōu)化即可。
(圖5:PoW與PoS流程對比)
但是PoW的缺點與自旋鎖一樣,對于計算資源的要求極高。一個被錯誤應(yīng)用的自旋鎖可以輕易消耗掉計算機(jī)中所有的CPU資源,同樣PoW當(dāng)前被人們詬病的最大問題也在于資源消耗。PoS在這方面則沒有任何問題。
1.2.3 PoS與DPoS的選擇
類似Paxos與Raft,集群內(nèi)參與的節(jié)點越多則效率越慢。一個典型的分布式數(shù)據(jù)庫,使用單副本的效率可能會是三副本的兩倍,而三副本的效率則又是七副本的兩至三倍。因此,為了滿足足夠的吞吐量,使用PoS在進(jìn)行選舉時務(wù)必不能在成千上萬個節(jié)點之間進(jìn)行投票選舉,而是應(yīng)當(dāng)在有限的集合范圍內(nèi)進(jìn)行投票驗證。這就是DPoS的核心原理。
DPoS給出一種思路,將成千上萬個PoS節(jié)點,通過某種機(jī)制(例如持有代幣的數(shù)量)選舉出若干(奇數(shù)個)節(jié)點,在這幾個節(jié)點之間進(jìn)行投票選舉(在一些實現(xiàn)中甚至?xí)谶@些節(jié)點間以令牌環(huán)的方式進(jìn)行輪詢,進(jìn)一步減少投票開銷)出每次的檢查點(出塊)節(jié)點,而不用在網(wǎng)絡(luò)中全部節(jié)點之間進(jìn)行選擇。
這種機(jī)制能夠大幅度提升選舉效率。在幾十個最多上百節(jié)點之間進(jìn)行一致性投票一般來說可以在秒級完成并達(dá)到共識,因此DPoS機(jī)制可以將檢查點(事務(wù)確認(rèn)時間)提升到秒級,通過減少投票節(jié)點的數(shù)量或采用令牌環(huán)機(jī)制甚至可以降低到毫秒級。
(圖6:PoS對比DPoS)
但是,DPoS的性能無法無限提升。在一個完美的軟件實現(xiàn)中,其性能與吞吐量則物理制約于節(jié)點間通訊的網(wǎng)絡(luò)帶寬。一般來說,對于公網(wǎng)環(huán)境中兩個節(jié)點之間的帶寬能夠維持在上下行均5MB/s(50兆帶寬)則相當(dāng)優(yōu)秀了,大部分情況下遠(yuǎn)遠(yuǎn)無法達(dá)到該數(shù)值。而如果每條交易日志需要100字節(jié),由于網(wǎng)絡(luò)即需要廣播交易也需要廣播日志,則網(wǎng)絡(luò)帶寬消耗加倍,因此在兩個節(jié)點的單鏈中最大吞吐量不超過2.5萬每秒(5MB/100字節(jié)/2=25000),假設(shè)集群中包含更多節(jié)點,則最大吞吐量需要根據(jù)其使用的P2P同步機(jī)制成比例縮減。如果需要進(jìn)一步提升則需要進(jìn)行分鏈(類似于數(shù)據(jù)庫分片的概念),該主題將會在下面的章節(jié)詳細(xì)討論。
1.2.4 DAG與鏈?zhǔn)浇Y(jié)構(gòu)的選擇
DAG與鏈?zhǔn)浇Y(jié)構(gòu)的本質(zhì)區(qū)別在于異步與同步通訊。在前文中已經(jīng)討論過鏈?zhǔn)浇Y(jié)構(gòu)的本質(zhì)等同于數(shù)據(jù)庫事務(wù)日志,而出塊操作則為檢查點操作,那么鏈?zhǔn)浇Y(jié)構(gòu)體系可以看做是定期同步檢查點的數(shù)據(jù)庫事務(wù)同步機(jī)制。
而DAG則通過將事務(wù)操作進(jìn)行異步處理來增加網(wǎng)絡(luò)吞吐量,采用謠言傳播算法在節(jié)點間發(fā)送操作日志,并通過某種機(jī)制(IOTA每次驗證前兩條交易,并計算一個PoW代表權(quán)重)將一個權(quán)重賦給該操作。
相比起同步操作的鏈?zhǔn)浇Y(jié)構(gòu),DAG結(jié)構(gòu)與任何異步機(jī)制一樣,能夠帶來的提升在于吞吐量(真的么?后文會有描述),但是可能產(chǎn)生的問題則在于無法有效預(yù)測交易被確認(rèn)的時間與周期,并且操作之間的順序無法最終在多個節(jié)點間確認(rèn)保持一致。
由于當(dāng)前市面上DAG的實現(xiàn)相對較新,暫時還存在一些理論上未突破的局限性,包括:
如今從DAG衍生出一些其他數(shù)據(jù)結(jié)構(gòu)(例如哈希樹等),基本上只是從存儲方式上有一些特定的優(yōu)化,但是整體上與DAG所帶來的問題保持一致。
筆者認(rèn)為,DAG的異步數(shù)據(jù)分發(fā)思路完全可以與鏈?zhǔn)浇Y(jié)構(gòu)相輔相成。在最終理論完善之前其應(yīng)用場景應(yīng)當(dāng)被謹(jǐn)慎選擇,避免過早將其直接應(yīng)用于通用化范式的場景。
?
1.3 結(jié)論
?
在區(qū)塊鏈的共識機(jī)制中,其本質(zhì)與分布式數(shù)據(jù)庫的一致性算法存在極多的相似之處。拜占庭問題的引入僅僅從算法和選舉節(jié)點數(shù)量上對網(wǎng)絡(luò)結(jié)構(gòu)做出一些調(diào)整,但是并不從本質(zhì)上改變分布式系統(tǒng)一致性選舉的機(jī)制。
(圖7:區(qū)塊鏈共識機(jī)制對比)
PoW采用簡單粗暴但極為有效的方式,通過節(jié)點首先自證其資質(zhì)后才進(jìn)行廣播的方式,大幅度減少了網(wǎng)絡(luò)間的通訊壓力,但與之帶來的問題則在于自證資質(zhì)的計算資源消耗極大。
PoS采用與傳統(tǒng)分布式一致性驗證類似的機(jī)制,通過代幣數(shù)量(或存儲容量等指標(biāo))作為權(quán)重依據(jù),使用某種分布式算法選舉出每次的檢查點節(jié)點。這種機(jī)制的好處在于沒有消耗計算資源的自證資質(zhì)過程,但是帶來的問題在于每次選舉時在大量節(jié)點的網(wǎng)絡(luò)中對網(wǎng)絡(luò)壓力極大。
DPoS作為PoS的變形,通過縮小選舉節(jié)點的數(shù)量以減少網(wǎng)絡(luò)壓力,是一種典型的分治策略:將所有節(jié)點分為領(lǐng)導(dǎo)者與跟隨者,只有領(lǐng)導(dǎo)者之間達(dá)成共識后才會通知跟隨者。該機(jī)制能夠在不增加計算資源的前提下有效減少網(wǎng)絡(luò)壓力,在優(yōu)秀的軟件實現(xiàn)中將會具有較強(qiáng)的應(yīng)用價值。
DAG則采用異步機(jī)制替代鏈?zhǔn)綑z查點的同步策略,但是由于其核心不存在一個標(biāo)準(zhǔn)的一致性確認(rèn)機(jī)制(即賬本或日志體系),同時無法對操作順序進(jìn)行全局統(tǒng)一排序,因此短期看來理論基礎(chǔ)還有待突破。但是,從長期看來,DAG是一種非常新穎且有前景的機(jī)制,為傳統(tǒng)數(shù)據(jù)管理領(lǐng)域的思維打開了新的大門。
http://www.8btc.com/blockchain-concensus-mech
總結(jié)
以上是生活随笔為你收集整理的区块链共识机制分析——论PoW,PoS,DPos和DAG的优缺点的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【译】Getting Up to Spe
- 下一篇: 京东JIMI用户未来意图预测技术揭秘