用户请求队列化_爬虫架构消息队列应用场景及ActiveMQ、RabbitMQ、RocketMQKafka
前言:在之前的業務中,使用了Kafka和RabbitMQ兩種消息隊列,這篇文章來做一個總結。
消息隊列中間件是分布式系統中重要的組件,主要實現異步消息,應用解耦,流量削峰及消息通訊等功能。
下面舉例說明在實際應用中消息隊列是如何使用的。
歡迎工作一到五年的Java工程師朋友們加入Java程序員開發: 854393687
群內提供免費的Java架構學習資料(里面有高可用、高并發、高性能及分布式、Jvm性能調優、Spring源碼,MyBatis,Netty,Redis,Kafka,Mysql,Zookeeper,Tomcat,Docker,Dubbo,Nginx等多個知識點的架構資料)合理利用自己每一分每一秒的時間來學習提升自己,不要再用"沒有時間“來掩飾自己思想上的懶惰!趁年輕,使勁拼,給未來的自己一個交代!
一、消息隊列應用場景
1.1、異步處理
以用戶注冊,并且需要注冊郵件和短信為例。
用戶注冊后,需要發送注冊郵件和注冊短信。傳統的做法有兩種:串行和并行方式。如下圖所示:
串行和并行方式
1)串行方式:將注冊信息寫入數據庫成功后,發送注冊郵件,再發送注冊短信。以上三個任務全部完成后,返回給客戶端。
2)并行方式:將注冊信息寫入數據庫成功后,發送注冊郵件的同時,發送注冊短信。以上三個任務完成后,返回給客戶端。與串行的差別是,并行的方式可以提高處理的時間。
假設三個業務節點每個使用50毫秒鐘,不考慮網絡等其他開銷,則串行方式的時間是150毫秒,并行的時間可能是100毫秒。
因為CPU在單位時間內處理的請求數是一定的,假設CPU1秒內吞吐量是100次。則串行方式1秒內CPU可處理的請求量是7次(1000ms/150ms),并行方式處理的請求量是10次(1000ms/100ms)
小結:如以上案例描述,傳統的方式系統的性能(并發量,吞吐量,響應時間)會有瓶頸。如何解決這個問題呢?
引入消息隊列,將不是必須的業務邏輯,異步處理。改造后的架構如下:
引入消息隊列方式
按照以上約定,用戶的響應時間相當于是注冊信息寫入數據庫的時間,也就是50毫秒。注冊郵件,發送短信寫入消息隊列后,直接返回,因此寫入消息隊列的速度很快,基本可以忽略,因此用戶的響應時間可能是50毫秒。因此架構改變后,系統的吞吐量提高到每秒20 QPS。比串行提高了3倍,比并行提高了兩倍。
1.2、應用解耦
以用戶下單購買業務為例。
用戶下單后,訂單系統需要通知庫存系統。傳統的做法是,訂單系統調用庫存系統的接口。如下圖
應用耦和
傳統模式的缺點:
1)假如庫存系統無法訪問,則訂單減庫存將失敗,從而導致訂單失敗。
2)訂單系統與庫存系統耦合。
如何解決以上問題呢?引入應用消息隊列后的方案,如下圖:
應用解耦
1)訂單系統:用戶下單后,訂單系統完成持久化處理,將消息寫入消息隊列,返回用戶訂單下單成功。
2)庫存系統:訂閱下單的消息,采用拉/推的方式,獲取下單信息,庫存系統根據下單信息,進行庫存操作。
假如:在下單時庫存系統不能正常使用。也不影響正常下單,因為下單后,訂單系統寫入消息隊列就不再關心其他的后續操作了。實現訂單系統與庫存系統的應用解耦。
1.3、流量削峰
流量削峰也是消息隊列中的常用場景,一般在秒殺或團搶活動中使用廣泛。
秒殺活動,一般會因為流量過大,導致流量暴增,應用掛掉。為解決這個問題,需要在應用前端加入消息隊列。
1)可以控制活動的人數。
2)可以緩解短時間內高流量壓垮應用。
流量削峰
1)用戶的請求,服務器接收后,首先寫入消息隊列。假如消息隊列長度超過最大數量,則直接拋棄用戶請求或跳轉到錯誤頁面。
2)秒殺業務根據消息隊列中的請求信息,再做后續處理。
1.4、消息通訊
消息通訊是指,消息隊列一般都內置了高效的通信機制,因此也可以用作消息通訊。比如實現點對點消息隊列,或者聊天室等。
消息通訊
以上實際是消息隊列的兩種消息模式,點對點或發布訂閱模式。
二、常用消息隊列(ActiveMQ、RabbitMQ、RocketMQ、Kafka)比較
- 生產者消費者模式(Producer-Consumer)
- ActiveMQ-支持,RabbitMQ-支持,RocketMQ-支持,Kafka-支持。
- 發布訂閱模式(Publish-Subscribe)
- ActiveMQ-支持,RabbitMQ-支持,RocketMQ-支持,Kafka-支持。
- 請求回應模型(Request-Reply)
- ActiveMQ-支持,RabbitMQ-支持,RocketMQ-不支持,Kafka-不支持。
- API完備性
- ActiveMQ-高,RabbitMQ-高,RocketMQ-高,Kafka-高。
- 多語言支持
- ActiveMQ-支持,RabbitMQ-支持,RocketMQ-只支持JAVA,Kafka-支持。
- 單機吞吐量
- ActiveMQ-萬級,RabbitMQ-萬級,RocketMQ-萬級,Kafka-十萬級。
- 消息延遲
- ActiveMQ-無,RabbitMQ-微秒級,RocketMQ-毫秒級,Kafka-毫秒級。
- 可用性
- ActiveMQ-高(主從),RabbitMQ-高(主從),RocketMQ-非常高(分布式),Kafka-非常高(分布式)。
- 消息丟失
- ActiveMQ-低,RabbitMQ-低,RocketMQ-理論上不會丟失,Kafka-理論上不會丟失。
- 文檔的完備性
- ActiveMQ-高,RabbitMQ-高,RocketMQ-高,Kafka-高。
- 提供快速入門
- ActiveMQ-有,RabbitMQ-有,RocketMQ-有,Kafka-有。
- 社區活躍度
- ActiveMQ-高,RabbitMQ-高,RocketMQ-中,Kafka-高。
- 商業支持
- ActiveMQ-無,RabbitMQ-無,RocketMQ-阿里云,Kafka-阿里云。
總體來說:
- ActiveMQ
- 歷史悠久的開源項目,已經在很多產品中得到應用,實現了JMS1.1規范,可以和spring-jms輕松融合,實現了多種協議,不夠輕巧(源代碼比RocketMQ多),支持持久化到數據庫,對隊列數較多的情況支持不好。
- RabbitMQ
- 它比Kafka成熟,支持AMQP事務處理,在可靠性上,RabbitMQ超過Kafka,在性能方面超過ActiveMQ。
- RocketMQ
- RocketMQ是阿里開源的消息中間件,目前在Apache孵化,使用純Java開發,具有高吞吐量、高可用性、適合大規模分布式系統應用的特點。RocketMQ思路起源于Kafka,但并不是簡單的復制,它對消息的可靠傳輸及事務性做了優化,目前在阿里集團被廣泛應用于交易、充值、流計算、消息推送、日志流式處理、binglog分發等場景,支撐了阿里多次雙十一活動。
- 因為是阿里內部從實踐到產品的產物,因此里面很多接口、API并不是很普遍適用。其可靠性毋庸置疑,而且與Kafka一脈相承(甚至更優),性能強勁,支持海量堆積。
- Kafka
- Kafka設計的初衷就是處理日志的,不支持AMQP事務處理,可以看做是一個日志系統,針對性很強,所以它并沒有具備一個成熟MQ應該具備的特性。Kafka的性能(吞吐量、tps)比RabbitMQ要強,如果用來做大數據量的快速處理是比RabbitMQ有優勢的。
歡迎工作一到五年的Java工程師朋友們加入Java程序員開發: 854393687
群內提供免費的Java架構學習資料(里面有高可用、高并發、高性能及分布式、Jvm性能調優、Spring源碼,MyBatis,Netty,Redis,Kafka,Mysql,Zookeeper,Tomcat,Docker,Dubbo,Nginx等多個知識點的架構資料)合理利用自己每一分每一秒的時間來學習提升自己,不要再用"沒有時間“來掩飾自己思想上的懶惰!趁年輕,使勁拼,給未來的自己一個交代!
總結
以上是生活随笔為你收集整理的用户请求队列化_爬虫架构消息队列应用场景及ActiveMQ、RabbitMQ、RocketMQKafka的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: spring手动控制事务开启_“上帝视角
- 下一篇: 的数据湖_一文读懂云原生数据湖体系