當(dāng)前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

rabbitmq 拉取消息太慢_面试官：消息队列这些我都要问

發(fā)布時間：2023/12/10 编程问答 42 豆豆

生活随笔收集整理的這篇文章主要介紹了 rabbitmq 拉取消息太慢_面试官：消息队列这些我都要问小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

作者：mousycoder

segmentfault.com/a/1190000021054802

消息隊列連環(huán)炮

項目里怎么樣使用 MQ 的？

為什么要使用消息隊列？

消息隊列有什么優(yōu)點和缺點？

kafka,activemq,rabbitmq,rocketmq 都有什么去唄？

如何保證消息隊列高可用？

如何保證消息不被重復(fù)消費？

如何保證消息的可靠性傳輸？

如何保證消息的順序性？

寫一個消息隊列架構(gòu)設(shè)計？

消息隊列技術(shù)選型

解決的問題：

解耦
異步
削峰

不用 MQ 系統(tǒng)耦合場景

A 系統(tǒng)產(chǎn)生了一個比較關(guān)鍵的數(shù)據(jù)，很多系統(tǒng)需要 A 系統(tǒng)將數(shù)據(jù)發(fā)過來，強(qiáng)耦合(B,C,D,E 系統(tǒng)可能參數(shù)不一樣、一會需要一會不需要數(shù)據(jù)，A 系統(tǒng)要不斷修改代碼維護(hù))

A 系統(tǒng)還要考慮 B、C、D、E 系統(tǒng)是否掛了，是否訪問超時？是否重試？

使用 MQ 系統(tǒng)解耦場景

維護(hù)這個代碼，不需要考慮人家是否調(diào)用成功，失敗超時

如果新系統(tǒng)需要數(shù)據(jù)，直接從 MQ 里消費即可，如果某個系統(tǒng)不需要這條數(shù)據(jù)就取消對 MQ 消息的消費即可。

總結(jié)：通過一個 MQ 的發(fā)布訂閱消息模型(Pub/Sub), 系統(tǒng) A 跟其他系統(tǒng)就徹底解耦了。

不用 MQ 同步高延遲請求場景

一般互聯(lián)網(wǎng)類的企業(yè)，對用戶的直接操作，一般要求每個請求都必須在 200ms以內(nèi)，對用戶幾乎是無感知的。

使用 MQ 進(jìn)行異步化之后的接口性能優(yōu)化

提高高延時接口

沒有用 MQ 時高峰期系統(tǒng)被打死的場景

高峰期每秒 5000 個請求，每秒對 MySQL 執(zhí)行 5000 條 SQL(一般MySQL每秒 2000 個請求差不多了)，如果MySQL被打死，然后整個系統(tǒng)就崩潰，用戶就沒辦法使用系統(tǒng)了。但是高峰期過了之后，每秒鐘可能就 50 個請求，對整個系統(tǒng)沒有任何壓力。

使用 MQ 進(jìn)行削峰的場景

5000 個請求寫入到 MQ 里面，系統(tǒng) A 每秒鐘最多只能處理 2000 個請求(MySQL 每秒鐘最多處理 2000 個請求)，系統(tǒng) A 從 MQ 里慢慢拉取請求，每秒鐘拉取 2000 個請求。MQ，每秒鐘 5000 個請求進(jìn)來，結(jié)果只有 2000 個請求出去，結(jié)果導(dǎo)致在高峰期(21小時)，可能有幾十萬甚至幾百萬的請求積壓在 MQ 中，這個是正常的，因為過了高峰期之后，每秒鐘就 50 個請求，但是系統(tǒng) A 還是會按照每秒 2000 個該請求的速度去處理。只要高峰期一過，系統(tǒng) A 就會快速的將積壓的消息給解決掉。

算一筆賬，每秒積壓在 MQ 里消息有 3000 條，一分鐘就會積壓 18W 條消息，一個小時就會積壓 1000 萬條消息。等高峰期一過，差不多需要 1 個多小時就可以把 1000W 條積壓的消息給處理掉

架構(gòu)中引入 MQ 后存在的問題

系統(tǒng)可用性降低

MQ 可能掛掉，導(dǎo)致整個系統(tǒng)崩潰

系統(tǒng)復(fù)雜性變高

可能發(fā)重復(fù)消息，導(dǎo)致插入重復(fù)數(shù)據(jù)；消息丟了；消息順序亂了；系統(tǒng) B,C,D 掛了，導(dǎo)致 MQ 消息積累，磁盤滿了；

一致性問題

本來應(yīng)該A,B,C,D 都執(zhí)行成功了再返回，結(jié)果A,B,C 執(zhí)行成功 D 失敗

Kafka、ActiveMQ、RabbitMQ、RocketMQ 有什么優(yōu)缺點

建議：中小型公司 RabbitMQ 大公司：RocketMQ 大數(shù)據(jù)實時計算：Kafka

消息隊列高可用

RabbtitMQ 高可用

RabbitMQ有三種模式：單機(jī)模式、普通集群模式、鏡像集群模式

單機(jī)模式

demo級

普通集群模式(非高可用)

隊列的元數(shù)據(jù)存在于多個實例中，但是消息不存在多個實例中，每次多臺機(jī)器上啟動多個 rabbitmq 實例，每個機(jī)器啟動一個。

優(yōu)點：可以多個機(jī)器消費消息，可以提高消費的吞吐量
缺點：可能會在 rabbitmq 內(nèi)部產(chǎn)生大量的數(shù)據(jù)傳輸；可用性基本沒保障，queue 所在機(jī)器宕機(jī)，就沒辦法消費了

沒有高可用性可言

鏡像集群模式(高可用，非分布式)

隊列的元數(shù)據(jù)和消息都會存在于多個實例中，每次寫消息到 queue的時候，都會自動把消息到多個實例的 queue 里進(jìn)行消息同步。也就是每個節(jié)點上都有這個 queue 的一個完整鏡像(這個 queue的全部數(shù)據(jù))。任何一個節(jié)點宕機(jī)了，其他節(jié)點還包含這個 queue的完整數(shù)據(jù)，其他 consumer 都可以到其他活著的節(jié)點上去消費數(shù)據(jù)都是 OK 的。

缺點：不是分布式的，如果這個 queue的數(shù)據(jù)量很大，大到這個機(jī)器上的容量無法容納。

開啟鏡像集群模式方法：管理控制臺，Admin頁面下，新增一個鏡像集群模式的策略，指定的時候可以要求數(shù)據(jù)同步到所有節(jié)點，也可以要求同步到指定數(shù)量的節(jié)點，然后你再次創(chuàng)建 queue 的時候，應(yīng)用這個策略，就會自動將數(shù)據(jù)同步到其他的節(jié)點上去。

Kafka 高可用架構(gòu)

broker進(jìn)程就是kafka在每臺機(jī)器上啟動的自己的一個進(jìn)程。每臺機(jī)器+機(jī)器上的broker進(jìn)程，就可以認(rèn)為是 kafka集群中的一個節(jié)點。

你創(chuàng)建一個 topic,這個topic可以劃分為多個 partition,每個 partition 可以存在于不同的 broker 上，每個 partition就存放一部分?jǐn)?shù)據(jù)。

這就是天然的分布式消息隊列，也就是說一個 topic的數(shù)據(jù)，是分散放在多個機(jī)器上的，每個機(jī)器就放一部分?jǐn)?shù)據(jù)。

分布式的真正含義是每個節(jié)點只放一部分?jǐn)?shù)據(jù)，而不是完整數(shù)據(jù)(完整數(shù)據(jù)就是HA、集群機(jī)制)
Kafka 0.8版本之前是沒有 HA 機(jī)制的，任何一個 broker 宕機(jī)了，那么就缺失一部分?jǐn)?shù)據(jù)。

Kafka 0.8以后，提供了 HA 機(jī)制，就是 replica 副本機(jī)制。

每個 partition的數(shù)據(jù)都會同步到其他機(jī)器上，形成自己的多個 replica 副本。然后所有 replica 會選舉一個 leader。那么生產(chǎn)者、消費者都會和這個 leader 打交道，然后其他 replica 就是 follow。寫的時候，leader 負(fù)責(zé)把數(shù)據(jù)同步到所有 follower上去，讀的時候就直接讀 leader 上的數(shù)據(jù)即可。

如果某個 broker宕機(jī)了，剛好也是 partition的leader，那么此時會選舉一個新的 leader出來，大家繼續(xù)讀寫那個新的 leader即可，這個就是所謂的高可用性。

leader和follower的同步機(jī)制：

寫數(shù)據(jù)的時候，生產(chǎn)者就寫 leader，然后 leader將數(shù)據(jù)落地寫本地磁盤，接著其他 follower 自己主動從 leader來pull數(shù)據(jù)。一旦所有 follower同步好數(shù)據(jù)了，就會發(fā)送 ack給 leader，leader收到所有 follower的 ack之后，就會返回寫成功的消息給生產(chǎn)者。

消費的時候，只會從 leader去讀，但是只有一個消息已經(jīng)被所有 follower都同步成功返回 ack的時候，這個消息才會被消費者讀到。

消息隊列重復(fù)數(shù)據(jù)

MQ 只能保證消息不丟，不能保證重復(fù)發(fā)送

Kafka 消費端可能出現(xiàn)的重復(fù)消費問題

每條消息都有一個 offset 代表了這個消息的順序的序號，按照數(shù)據(jù)進(jìn)入 kafka的順序，kafka會給每條數(shù)據(jù)分配一個 offset,代表了這個是數(shù)據(jù)的序號，消費者從 kafka去消費的時候，按照這個順序去消費，消費者會去提交 offset，就是告訴 kafka已經(jīng)消費到 offset=153這條數(shù)據(jù)了；zk里面就記錄了消費者當(dāng)前消費到了 offset =幾的那條消息；假如此時消費者系統(tǒng)被重啟，重啟之后，消費者會找kafka，讓kafka把上次我消費到的那個地方后面的數(shù)據(jù)繼續(xù)給我傳遞過來。

重復(fù)消息原因：(主要發(fā)生在消費者重啟后)

消費者不是說消費完一條數(shù)據(jù)就立馬提交 offset的，而是定時定期提交一次 offset。消費者如果再準(zhǔn)備提交 offset，但是還沒提交 offset的時候，消費者進(jìn)程重啟了，那么此時已經(jīng)消費過的消息的 offset并沒有提交，kafka也就不知道你已經(jīng)消費了 offset= 153那條數(shù)據(jù)，這個時候kafka會給你發(fā)offset=152,153,154的數(shù)據(jù)，此時 offset = 152,153的消息重復(fù)消費了

保證 MQ 重復(fù)消費冪等性

冪等：一個數(shù)據(jù)或者一個請求，給你重復(fù)來多次，你得確保對應(yīng)的數(shù)據(jù)是不會改變的，不能出錯。
思路：

拿數(shù)據(jù)要寫庫，首先檢查下主鍵，如果有數(shù)據(jù)，則不插入，進(jìn)行一次update
如果是寫 redis，就沒問題，反正每次都是 set ，天然冪等性
生產(chǎn)者發(fā)送消息的時候帶上一個全局唯一的id,消費者拿到消息后，先根據(jù)這個id去 redis里查一下，之前有沒消費過，沒有消費過就處理，并且寫入這個 id 到 redis，如果消費過了，則不處理。
基于數(shù)據(jù)庫的唯一鍵

保證 MQ 消息不丟

MQ 傳遞非常核心的消息，比如：廣告計費系統(tǒng)，用戶點擊一次廣告，扣費一塊錢，如果扣費的時候消息丟了，則會不斷少錢，積少成多，對公司是一個很大的損失。

RabbitMQ可能存在的數(shù)據(jù)丟失問題

生產(chǎn)者寫消息的過程中，消息都沒有到 rabbitmq，在網(wǎng)絡(luò)傳輸過程中就丟了。或者消息到了 rabbitmq，但是人家內(nèi)部出錯了沒保存下來。
RabbitMQ 接收到消息之后先暫存在主機(jī)的內(nèi)存里，結(jié)果消費者還沒來得及消費，RabbitMQ自己掛掉了，就導(dǎo)致暫存在內(nèi)存里的數(shù)據(jù)給搞丟了。
消費者消費到了這個消費，但是還沒來得及處理，自己就掛掉了，RabbitMQ 以為這個消費者已經(jīng)處理完了。

問題 1解決方案：

事務(wù)機(jī)制：(一般不采用，同步的，生產(chǎn)者發(fā)送消息會同步阻塞卡住等待你是成功還是失敗。會導(dǎo)致生產(chǎn)者發(fā)送消息的吞吐量降下來)

????channel.txSelect
try?{
????//發(fā)送消息
}?catch(Exception?e){
????channel.txRollback;
????//再次重試發(fā)送這條消息
}?
????channel.txCommit;

confirm機(jī)制：(一般采用這種機(jī)制，異步的模式，不會阻塞，吞吐量會比較高)

先把 channel 設(shè)置成 confirm 模式
發(fā)送一個消息到 rabbitmq
發(fā)送完消息后就不用管了
rabbitmq 如果接收到了這條消息，就會回調(diào)你生產(chǎn)者本地的一個接口，通知你說這條消息我已經(jīng)收到了
rabbitmq 如果在接收消息的時候報錯了，就會回調(diào)你的接口，告訴你這個消息接收失敗了，你可以再次重發(fā)。

public?void?ack(String?messageId){

}

public?void?nack(String?messageId){
????//再次重發(fā)一次這個消息
}

問題 2 解決方案：

持久化到磁盤

創(chuàng)建queue的時候?qū)⑵湓O(shè)置為持久化的，這樣就可以保證 rabbitmq持久化queue的元數(shù)據(jù)，但是不會持久化queue里的數(shù)據(jù)
發(fā)送消息的時候?qū)?deliveryMode 設(shè)置為 2，將消息設(shè)置為持久化的，此時 rabbitmq就會將消息持久化到磁盤上去。必須同時設(shè)置 2 個持久化才行。
持久化可以跟生產(chǎn)者那邊的 confirm機(jī)制配合起來，只有消息被持久化到磁盤之后，才會通知生產(chǎn)者 ack了，所以哪怕是在持久化到磁盤之前，rabbitmq掛了，數(shù)據(jù)丟了，生產(chǎn)者收不到 ack，你也可以自己重發(fā)。

缺點：可能會有一點點丟失數(shù)據(jù)的可能，消息剛好寫到了 rabbitmq中，但是還沒來得及持久化到磁盤上，結(jié)果不巧， rabbitmq掛了，會導(dǎo)致內(nèi)存里的一點點數(shù)據(jù)會丟失。

問題 3 解決方案：

原因：消費者打開了 autoAck機(jī)制(消費到一條消息，還在處理中，還沒處理完，此時消費者自動 autoAck了，通知 rabbitmq說這條消息已經(jīng)消費了，此時不巧，消費者系統(tǒng)宕機(jī)了，那條消息丟失了，還沒處理完，而且 rabbitmq還以為這個消息已經(jīng)處理掉了)

解決方案：關(guān)閉 autoAck,自己處理完了一條消息后，再發(fā)送 ack給 rabbitmq,如果此時還沒處理完就宕機(jī)了，此時rabbitmq沒收到你發(fā)的ack消息，然后 rabbitmq 就會將這條消息重新分配給其他的消費者去處理。

Kafka 可能存在的數(shù)據(jù)丟失問題

消費端弄丟數(shù)據(jù)

原因：消費者消費到那條消息后，自動提交了 offset，kafka以為你已經(jīng)消費好了這條消息，結(jié)果消費者掛了，這條消息就丟了。

例子：消費者消費到數(shù)據(jù)后寫到一個內(nèi)存 queue里緩存下，消息自動提交 offset，重啟了系統(tǒng)，結(jié)果會導(dǎo)致內(nèi)存 queue 里還沒來得及處理的數(shù)據(jù)丟失。

解決方法：kafka會自動提交 offset，那么只要關(guān)閉自動提交 offset，在處理完之后自己手動提交，可以保證數(shù)據(jù)不會丟。但是此時確實還是會重復(fù)消費，比如剛好處理完，還沒提交 offset，結(jié)果自己掛了，此時肯定會重復(fù)消費一次，做好冪等即可。

Kafka 丟掉消息

原因：kafka 某個 broker 宕機(jī)，然后重新選舉 partition 的 leader時，此時其他的 follower 剛好還有一些數(shù)據(jù)沒有同步，結(jié)果此時 leader掛了，然后選舉某個 follower成 leader之后，就丟掉了之前l(fā)eader里未同步的數(shù)據(jù)。

例子：kafka的leader機(jī)器宕機(jī)，將 follower 切換為 leader之后，發(fā)現(xiàn)數(shù)據(jù)丟了
解決方案：(保證 kafka broker端在 leader發(fā)生故障，或者leader切換時，數(shù)據(jù)不會丟)

給 topic設(shè)置 replication.factor ，這個值必須大于 1，保證每個 partition 必須至少有 2 個副本
在 kafka 服務(wù)端設(shè)置 min.insync.replicas 參數(shù)，這個值必須大于 1，這個是要求一個leader至少感知到有至少一個follower還跟自己保持聯(lián)系，沒掉隊，這樣才能確保 leader掛了還有一個follower，保證至少一個 follower能和leader保持正常的數(shù)據(jù)同步。
在 producer 端設(shè)置 acks =all，這個是要求每條數(shù)據(jù)，必須是寫入所有 replica 之后，才能認(rèn)為是寫成功了。否則會生產(chǎn)者會一直重試，此時設(shè)置 retries = MAX(很大的重試的值),要求一旦寫入失敗，就卡在這里(避免消息丟失)
kafka 生產(chǎn)者丟消息

按 2 的方案設(shè)置了 ack =all，一定不會丟。它會要求 leader 接收到消息，所有的 follower 都同步到了消息之后，才認(rèn)為本次寫成功。如果沒滿足這個條件，生產(chǎn)者會無限次重試。

消息隊列順序性

背景：mysql binlog 同步的系統(tǒng)，在mysql里增刪改一條數(shù)據(jù)，對應(yīng)出來了增刪改 3 條binlog，接著這 3 條binlog發(fā)送到 MQ 里面，到消費出來依次執(zhí)行，起碼是要保證順序的吧，不然順序變成了刪除、修改、增加。日同步數(shù)據(jù)達(dá)到上億，mysql->mysql,比如大數(shù)據(jù) team，需要同步一個mysql庫，來對公司的業(yè)務(wù)系統(tǒng)的數(shù)據(jù)做各種復(fù)雜的操作。

場景：

rabbitmq,一個queue,多個consumer，這不明顯亂了
kafka,一個topic，一個partition,一個consumer，內(nèi)部多線程，這不也亂了

RabbitMQ 消息順序錯亂

RabbitMQ 如何保證消息順序性

需要保證順序的數(shù)據(jù)放到同一個queue里

Kafka 消息順序錯亂

寫入一個 partition中的數(shù)據(jù)一定是有順序的。

生產(chǎn)者在寫的時候，可以指定一個 key，比如訂單id作為key,那么訂單相關(guān)的數(shù)據(jù)，一定會被分發(fā)到一個 partition中區(qū)，此時這個 partition中的數(shù)據(jù)一定是有順序的。Kafka 中一個 partition 只能被一個消費者消費。消費者從partition中取出數(shù)據(jù)的時候，一定是有順序的。

Kafka 保證消息順序性

如果消費者單線程消費+處理，如果處理比較耗時，處理一條消息是幾十ms，一秒鐘只能處理幾十條數(shù)據(jù)，這個吞吐量太低了。肯定要用多線程去并發(fā)處理，壓測消費者4 核 8G 單機(jī)，32 條線程，最高每秒可以處理上千條消息

消息隊列延遲以及過期失效

消費端出了問題，不消費了或者消費極其慢。接著坑爹了，你的消息隊列集群的磁盤都快寫滿了，都沒人消費，怎么辦？積壓了幾個小時，rabbitmq設(shè)置了消息過期時間后就沒了，怎么辦？

例如：

每次消費之后都要寫 mysql，結(jié)果mysql掛了，消費端 hang 不動了。
消費者本地依賴的一個東西掛了，導(dǎo)致消費者掛了。
長時間沒處理消費，導(dǎo)致 mq 寫滿了。

場景：幾千萬條數(shù)據(jù)再 MQ 里積壓了七八個小時

快速處理積壓的消息

一個消費者一秒是 1000 條，一秒 3 個消費者是 3000 條，一分鐘是 18W 條，1000 多 W 條需要一個小時恢復(fù)。

步驟：

先修復(fù) consumer 的問題，確保其恢復(fù)消費速度，然后將現(xiàn)有的 consumer 都停掉
新建一個topic,partition是原來的 10 倍，臨時建立好原先 10 倍或者 20 倍的 queue 數(shù)量
然后寫一個臨時的分發(fā)數(shù)據(jù)的 consumer 程序，這個程序部署上去消費積壓的數(shù)據(jù)，消費之后不做耗時的處理，直接均勻輪詢寫入臨時建立好的 10 倍數(shù)量的 queue
接著臨時征用 10 倍的機(jī)器來部署 consumer,每一批 consumer 消費一個臨時 queue 的數(shù)據(jù)
這種做法相當(dāng) 于是臨時將 queue 資源和 consumer 資源擴(kuò)大 10 倍，以正常 10 倍速度
等快速消費完積壓數(shù)據(jù)之后，恢復(fù)原先部署架構(gòu) ，重新用原先的 consumer機(jī)器消費消息

原來 3 個消費者需要 1 個小時可以搞定，現(xiàn)在 30 個臨時消費者需要 10 分鐘就可以搞定。

如果用的 rabbitmq，并且設(shè)置了過期時間，如果此消費在 queue里積壓超過一定的時間會被 rabbitmq清理掉，數(shù)據(jù)直接搞丟。
這個時候開始寫程序，將丟失的那批數(shù)據(jù)查出來，然后重新灌入mq里面，把白天丟的數(shù)據(jù)補(bǔ)回來。

如果消息積壓mq，長時間沒被處理掉，導(dǎo)致mq快寫完滿了，你臨時寫一個程序，接入數(shù)據(jù)來消費，寫到一個臨時的mq里，再讓其他消費者慢慢消費或者消費一個丟棄一個，都不要了，快速消費掉所有的消息，然后晚上補(bǔ)數(shù)據(jù)。

如何設(shè)計消息隊列中間件架構(gòu)

mq要支持可伸縮性，快速擴(kuò)容。設(shè)計一個分布式的 MQ，broker->topic->partition，每個 partition 放一個機(jī)器，就存一部分?jǐn)?shù)據(jù)。如果現(xiàn)在資源不夠，給 topic 增加 partition ，然后做數(shù)據(jù)遷移，增加機(jī)器。
mq數(shù)據(jù)落磁盤，避免進(jìn)程掛了數(shù)據(jù)丟了，順序?qū)?#xff0c;這樣就沒有磁盤隨機(jī)讀寫的尋址開銷，磁盤順序讀寫的性能是很高的，這個就是 kafka的思路。
mq高可用性。多副本->leader & follower-> broker 掛了重新選舉 leader 對外提供服務(wù)
支持?jǐn)?shù)據(jù) 0 丟失。

【面試題專欄】

2020年Java多線程與并發(fā)系列22道高頻面試題解析

從阿里、騰訊的面試真題中總結(jié)了這11個Redis高頻面試題

2020年Java基礎(chǔ)高頻面試題匯總(1.4W字詳細(xì)解析)

全網(wǎng)最全Spring系列面試題129道(附答案解析)

2萬字Java并發(fā)編程面試題整理(含答案，建議收藏)

85道Java微服務(wù)面試題整理(助力2020面試)

【2020年大廠面試必備】JVM與性能調(diào)優(yōu)知識點整理

2019年面試官最喜歡問的28道ZooKeeper面試題

2020面試還搞不懂MyBatis？看看這27道面試題！(含答案和思維導(dǎo)圖)

Spring Cloud+Spring Boot高頻面試題解析

2019年常見的Linux面試題及答案解析，哪些你還不會？

2019年常見Elasticsearch面試題答案解析

18道kafka高頻面試題哪些你還不會？(含答案和思維導(dǎo)圖)

2019年12道RabbitMQ高頻面試題你都會了嗎？(含答案解析)

2019年Dubbo你掌握的如何？快看看這30道高頻面試題！

?你在看嗎？

總結(jié)

以上是生活随笔為你收集整理的rabbitmq 拉取消息太慢_面试官：消息队列这些我都要问的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯，歡迎將生活随笔推薦給好友。

上一篇：充电10分钟续航120 全新iX1官图泄
下一篇：微型计算机在温室管理中的应用初探,文献综