當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

干货|为什么Kafka不支持读写分离

發(fā)布時間：2025/3/21 编程问答 47 豆豆

生活随笔收集整理的這篇文章主要介紹了干货|为什么Kafka不支持读写分离小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

在 Kafka 中，生產(chǎn)者寫入消息、消費者讀取消息的操作都是與 leader 副本進行交互的，從而實現(xiàn)的是一種主寫主讀的生產(chǎn)消費模型。數(shù)據(jù)庫、Redis 等都具備主寫主讀的功能，與此同時還支持主寫從讀的功能，主寫從讀也就是讀寫分離，為了與主寫主讀對應，這里就以主寫從讀來稱呼。Kafka 并不支持主寫從讀，這是為什么呢?

從代碼層面上來說，雖然增加了代碼復雜度，但在 Kafka 中這種功能完全可以支持。對于這個問題，我們可以從“收益點”這個角度來做具體分析。主寫從讀可以讓從節(jié)點去分擔主節(jié) 點的負載壓力，預防主節(jié)點負載過重而從節(jié)點卻空閑的情況發(fā)生。但是主寫從讀也有 2 個很明顯的缺點:

(1)數(shù)據(jù)一致性問題。數(shù)據(jù)從主節(jié)點轉(zhuǎn)到從節(jié)點必然會有一個延時的時間窗口，這個時間窗口會導致主從節(jié)點之間的數(shù)據(jù)不一致。某一時刻，在主節(jié)點和從節(jié)點中 A 數(shù)據(jù)的值都為 X，之后將主節(jié)點中 A 的值修改為 Y，那么在這個變更通知到從節(jié)點之前，應用讀取從節(jié)點中的 A 數(shù)據(jù)的值并不為最新的 Y，由此便產(chǎn)生了數(shù)據(jù)不一致的問題。
(2)延時問題。類似 Redis 這種組件，數(shù)據(jù)從寫入主節(jié)點到同步至從節(jié)點中的過程需要經(jīng) 歷網(wǎng)絡→主節(jié)點內(nèi)存→網(wǎng)絡→從節(jié)點內(nèi)存這幾個階段，整個過程會耗費一定的時間。而在 Kafka 中，主從同步會比 Redis 更加耗時，它需要經(jīng)歷網(wǎng)絡→主節(jié)點內(nèi)存→主節(jié)點磁盤→網(wǎng)絡→從節(jié) 點內(nèi)存→從節(jié)點磁盤這幾個階段。對延時敏感的應用而言，主寫從讀的功能并不太適用。

現(xiàn)實情況下，很多應用既可以忍受一定程度上的延時，也可以忍受一段時間內(nèi)的數(shù)據(jù)不一致的情況，那么對于這種情況，Kafka 是否有必要支持主寫從讀的功能呢?

主讀從寫可以均攤一定的負載卻不能做到完全的負載均衡，比如對于數(shù)據(jù)寫壓力很大而讀壓力很小的情況，從節(jié)點只能分攤很少的負載壓力，而絕大多數(shù)壓力還是在主節(jié)點上。而在 Kafka 中卻可以達到很大程度上的負載均衡，而且這種均衡是在主寫主讀的架構上實現(xiàn)的。我們來看一下 Kafka 的生產(chǎn)消費模型，如下圖所示。

在 Kafka 集群中有 3 個分區(qū)，每個分區(qū)有 3 個副本，正好均勻地分布在 3個 broker 上，灰色陰影的代表 leader 副本，非灰色陰影的代表 follower 副本，虛線表示 follower 副本從 leader 副本上拉取消息。當生產(chǎn)者寫入消息的時候都寫入 leader 副本，對于圖 8-23 中的情形，每個 broker 都有消息從生產(chǎn)者流入;當消費者讀取消息的時候也是從 leader 副本中讀取的，對于圖 8-23 中的情形，每個 broker 都有消息流出到消費者。

我們很明顯地可以看出，每個 broker 上的讀寫負載都是一樣的，這就說明 Kafka 可以通過主寫主讀實現(xiàn)主寫從讀實現(xiàn)不了的負載均衡。上圖展示是一種理想的部署情況，有以下幾種情況(包含但不僅限于)會造成一定程度上的負載不均衡:

(1)broker 端的分區(qū)分配不均。當創(chuàng)建主題的時候可能會出現(xiàn)某些 broker 分配到的分區(qū)數(shù) 多而其他 broker 分配到的分區(qū)數(shù)少，那么自然而然地分配到的 leader 副本也就不均。
(2)生產(chǎn)者寫入消息不均。生產(chǎn)者可能只對某些 broker 中的 leader 副本進行大量的寫入操作，而對其他 broker 中的 leader 副本不聞不問。
(3)消費者消費消息不均。消費者可能只對某些 broker 中的 leader 副本進行大量的拉取操作，而對其他 broker 中的 leader 副本不聞不問。
(4)leader 副本的切換不均。在實際應用中可能會由于 broker 宕機而造成主從副本的切換，或者分區(qū)副本的重分配等，這些動作都有可能造成各個 broker 中 leader 副本的分配不均。

對此，我們可以做一些防范措施。針對第一種情況，在主題創(chuàng)建的時候盡可能使分區(qū)分配得均衡，好在 Kafka 中相應的分配算法也是在極力地追求這一目標，如果是開發(fā)人員自定義的分配，則需要注意這方面的內(nèi)容。對于第二和第三種情況，主寫從讀也無法解決。對于第四種情況，Kafka 提供了優(yōu)先副本的選舉來達到 leader 副本的均衡，與此同時，也可以配合相應的監(jiān)控、告警和運維平臺來實現(xiàn)均衡的優(yōu)化。

在實際應用中，配合監(jiān)控、告警、運維相結合的生態(tài)平臺，在絕大多數(shù)情況下 Kafka 都能做到很大程度上的負載均衡。總的來說，Kafka 只支持主寫主讀有幾個優(yōu)點:可以簡化代碼的實現(xiàn)邏輯，減少出錯的可能;將負載粒度細化均攤，與主寫從讀相比，不僅負載效能更好，而且對用戶可控;沒有延時的影響;在副本穩(wěn)定的情況下，不會出現(xiàn)數(shù)據(jù)不一致的情況。為此， Kafka 又何必再去實現(xiàn)對它而言毫無收益的主寫從讀的功能呢?這一切都得益于 Kafka 優(yōu)秀的架構設計，從某種意義上來說，主寫從讀是由于設計上的缺陷而形成的權宜之計。

總結

以上是生活随笔為你收集整理的干货|为什么Kafka不支持读写分离的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯，歡迎將生活随笔推薦給好友。

上一篇： MySQL性能突发事件问题排查技巧
下一篇：【分享】怎样学习一门新技术？

日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

编程问答

干货|为什么Kafka不支持读写分离

總結