當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

面对百亿用户数据，日均亿次请求，携程应用架构如何涅槃？

發布時間：2025/4/5 编程问答 21 豆豆

生活随笔收集整理的這篇文章主要介紹了面对百亿用户数据，日均亿次请求，携程应用架构如何涅槃？小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

https://www.infoq.cn/article/ctrip-big-data-high-concurrency-applications-architecture?utm_campaign=infoq_content&utm_source=infoq&utm_medium=feed&utm_term=global

互聯網二次革命的移動互聯網時代，如何吸引用戶、留住用戶并深入挖掘用戶價值，在激烈的競爭中脫穎而出，是各大電商的重要課題。通過各類大數據對用戶進行研究，以數據驅動產品是解決這個課題的主要手段，攜程的大數據團隊也由此應運而生；經過幾年的努力，大數據的相關技術為業務帶來了驚人的提升與幫助。

以基礎大數據的用戶意圖服務為例，通過將廣告和欄位的“千人一面”變為“千人千面”，在提升用戶便捷性，可用性，降低費力度的同時，其轉化率也得到了數倍的提升，體現了大數據服務的真正價值。

在新形勢下，傳統應用架構不得不變為大數據及新的高并發架構，來應對業務需求激增及高速迭代的需要。

一、業務高速發展帶來的應用架構挑戰

公司業務高速發展帶來哪些主要的變化，以及給我們的系統帶來了哪些挑戰？

業務需求的急速增長，訪問請求的并發量激增，2016 年 1 月份以來，業務部門的服務日均請求量激增了 5.5 倍。

業務邏輯日益復雜化，基礎業務研發部需要支撐起 OTA 數十個業務線，業務邏輯日趨復雜和繁多。

業務數據源多樣化，異構化，接入的業務線、合作公司的數據源越來越多；接入的數據結構由以前的數據庫結構化數據整合轉為 Hive 表、評論文本數據、日志數據、天氣數據、網頁數據等多元化異構數據整合。

業務的高速發展和迭代，部門一直以追求以最少的開發人力，以架構和系統的技術優化，支撐起攜程各業務線高速發展和迭代的需要。

在這種新形勢下，傳統應用架構不得不變，做為工程師也必然要自我涅槃，改為大數據及新的高并發架構，來應對業務需求激增及高速迭代的需要。計算分層分解、去 SQL、去數據庫化、模塊化拆解的相關技改工作已經刻不容緩。

以用戶意圖（AI 點金杖）的個性化服務為例，面對 BU 業務線的全面支持的迫切需要，其應用架構必須解決如下技術難點：

高訪問并發：每天近億次的訪問請求；

數據量大：每天 TB 級的增量數據，近百億條的用戶數據，上百萬的產品數據；

業務邏輯復雜：復雜個性化算法和 LBS 算法；例如：滿足一個復雜用戶請求需要大量計算和 30 次左右的 SQL 數據查詢，服務延時越來越長；

高速迭代上線：面對 OTA 多業務線的個性化、Cross-saling、Up-saling、需滿足提升轉化率的迫切需求，迭代欄位或場景要快速，同時減少研發成本。

二、應對挑戰的架構涅磐

面對這些挑戰，我們的應用系統架構應該如何涅磐？主要分如下三大方面系統詳解:

存儲的涅磐，這一點對于整個系統的吞吐量和并發量的提升起到最關鍵的作用，需要結合數據存儲模型和具體應用的場景。

計算的涅磐，可以從橫向和縱向考慮：橫向主要是增加并發度，首先想到的是分布式。縱向拆分就是要求我們找到計算的結合點從而進行分層，針對不同的層次選擇不同的計算地點。然后再將各層次計算完后的結果相結合，盡可能最大化系統整體的處理能力。

業務層架構的涅磐，要求系統的良好的模塊化設計，清楚的定義模塊的邊界，模塊自升級和可配置化。

三、應用系統的整體架構

認識到需要應對的挑戰，我們應該如何設計我們的系統呢，下面將全面的介紹下我們的應用系統整體架構。

下圖就是我們應用系統整體架構以及系統層次的模塊構成。

數據源部分， Hermes 是攜程框架部門提供的消息隊列，基于 Kafka 和 Mysql 做為底層實現的封裝，應用于系統間實時數據傳輸交互通道。Hive 和 HDFS 是攜程海量數據的主要存儲，兩者來自 Hadoop 生態體系。Hadoop 這塊大家已經很熟悉，如果不熟悉的同學只要知道 Hadoop 主要用于大數據量存儲和并行計算批處理工作。

Hive 是基于 Hadoop 平臺的數據倉庫，沿用了關系型數據庫的很多概念。比如說數據庫和表，還有一套近似于 SQL 的查詢接口的支持，在 Hive 里叫做 HQL，但是其底層的實現細節和關系型數據庫完全不一樣，Hive 底層所有的計算都是基于 MR 來完成，我們的數據工程師 90% 都數據處理工作都基于它來完成。

離線部分，包含的模塊有 MR, Hive , Mahout, SparkQL/MLLib。Hive 上面已經介紹過，Mahout 簡單理解提供基于 Hadoop 平臺進行數據挖掘的一些機器學習的算法包。Spark 類似 hadoop 也是提供大數據并行批量處理平臺，但是它是基于內存的。SparkQL 和 Spark MLLib 是基于 Spark 平臺的 SQL 查詢引擎和數據挖掘相關算法框架。我們主要用 Mahout 和 Spark MLLib 進行數據挖掘工作。

調度系統 zeus，是淘寶開源大數據平臺調度系統，于 2015 年引進到攜程，之后我們進行了重構和功能升級，做為攜程大數據平臺的作業調度平臺。

近線部分，是基于 Muise 來實現我們的近實時的計算場景，Muise 是也是攜程 OPS 提供的實時計算流處理平臺，內部是基于 Storm 實現與 HERMES 消息隊列搭配起來使用。例如，我們使用 MUSIE 通過消費來自消息隊列里的用戶實時行為，訂單記錄，結合畫像等一起基礎數據，經一系列復雜的規則和算法，實時的識別出用戶的行程意圖。

后臺 / 線上應用部分，Mysql 用于支撐后臺系統的數據庫。ElasticSearch 是基于 Lucene 實現的分布式搜索引擎，用于索引用戶畫像的數據，支持離線精準營銷的用戶篩選，同時支持線上應用推薦系統的選品功能。Hbase 基于 Hadoop 的 Hdfs 上的列存儲 Nosql 數據庫，用于后臺報表可視化系統和線上服務的數據存儲。

這里說明一下, 在線和后臺應用使用的 ElasticSearch 和 Hbase 集群是分開的，互不影響。 Redis 支持在線服務的高速緩存，用于緩存統計分析出來的熱點數據。

四、推薦系統案例

介紹完我們應用系統的整體構成，接下來分享基于這套系統架構實現的一個實例——攜程個性化推薦系統。

推薦系統的架構圖：

1 存儲的涅磐

1）Nosql (Hbase+Redis)

我們之前存儲使用的是 Mysql,? 一般關系型數據庫會做為應用系統存儲的首選。大家知道 Mysql 非商業版對分布式支持不夠，在存儲數據量不高，查詢量和計算復雜度不是很大的情況下，可以滿足應用系統絕大部分的功能需求。

我們現狀是需要安全存儲海量的數據，高吞吐，并發能力強，同時隨著數據量和請求量的快速增加，能夠通過加節點來擴容。另外還需要支持故障轉移，自動恢復，無需額外的運維成本。綜上幾個主要因素，我們進行了大量的調研和測試，最終我們選用 Hbase 和 Redis 兩個 Nosql 數據庫來取代以往使用的 Mysql,。我們把用戶意圖以及推薦產品數據以 KV 的形式存儲在 Hbase 中，我對操作 Hbase 進行一些優化，其中包括 rowkey 的設計，預分配，數據壓縮等，同時針對我們的使用場景對 Hbase 本身配置方面的也進行了調優。目前存儲的數據量已經達到 TB 級別，支持每天千萬次請求，同時保證 99% 在 50 毫秒內返回。

Redis 這塊和多數應用系統使用方式一樣，主要用于緩存熱點數據，這里就不多說了。

2）搜索引擎 (ElasticSearch)

ES 索引各業務線產品特征數據，提供基于用戶的意圖特征和產品特征復雜的多維檢索和排序功能，當前集群由 4 臺大內存物理機器構成，采用全內存索引。對比某一個復雜的查詢場景，之前用 Mysql 將近需要 30 次查詢，使用 ES 只需要一次組合查詢且在 100 毫秒內返回。目前每天千萬次搜索，99% 以上在 300 毫秒以內返回。

2 計算的涅磐

1）數據源，我們的數據源分結構化和半結構化數據以及非結構化數據。

結構化數據主要是指攜程各產線的產品維表和訂單數據，有酒店，景酒，團隊游，門票，景點等；還有一些基礎數據，比如城市表，車站等，這類數據基本上都是 T+1。每天會有流程去各 BU 的生產表拉取數據。

半結構化數據是指，攜程用戶的訪問行為數據，例如瀏覽，搜索，預訂，反饋等，這邊順便提一下，這些數據這些是由前端采集框架實時采集，然后下發到后端的收集服務，由收集服務在寫入到 Hermes 消息隊列，一路會落地到 Hadoop 上面做長期存儲，另一路近線層可以通過訂閱 Hermes 此類數據 Topic 進行近實時的計算工作。

我們還用到外部合作渠道的數據，還有一些評論數據，評論屬于非結構化的，也是 T+1 更新。

2）離線計算，主要分三個處理階段。

預處理階段，這塊主要為后續數據挖掘做一些數據的準備工作，數據去重，過濾，對缺失信息的補足。舉例來說采集下來的用戶行為數據，所含有的產品信息很少，我們會使用產品表的數據進行一些補足，確保給后續的數據挖掘使用時候盡量完整的。

數據挖掘階段，主要運用一些常用的數據挖掘算法進行模型訓練和推薦數據的輸出 (分類，聚類，回歸，CF 等)。

結果導入階段，我們通過可配置的數據導入工具將推薦數據，進行一系列轉換后，導入到 HBASE，Redis 以及建立 ES 索引， Redis 存儲的是經統計計算出的熱點數據。?

3）近線計算（用戶意圖, 產品緩存）

當用戶沒有明確的目的性情況下，很難找到滿足興趣的產品，我們不僅需要了解用戶的歷史興趣，用戶實時行為特征的抽取和理解更加重要，以便快速的推薦出符合用戶當前興趣的產品，這就是用戶意圖服務需要實現的功能。

一般來說用戶特征分成兩大類：一種是穩定的特征（用戶畫像），如用戶性別，常住地，主題偏好等特征；另一類是根據用戶行為計算獲取的特征，如用戶對酒店星級的偏好，目的地偏好，跟團游 / 自由行偏好等。基于前面所述的計算的特點，我們使用近在線計算來獲取第二類用戶特征，整體框圖如下。從圖中可以看出它的輸入數據源包括兩大類：第一類是實時的用戶行為，第二類是用戶畫像，歷史交易以及情景等離線模塊提供的數據。結合這兩類數據，經一些列復雜的近線學習算法和規則引擎，計算得出用戶當前實時意圖列表存儲到 Hbase 和 Redis 中。

攜程用戶意圖框架

近線另一個工作是產品數據緩存，攜程的業務線很多，而我們的推薦系統會推各個業務線的產品，因此我們需要調用所有業務線的產品服務接口，但隨著我們上線的場景的增加，這樣無形的增加了對業務方接口的調用壓力。而且業務線產品接口服務主要應用于業務的主流程或關鍵型應用，比較重，且 SLA 服務等級層次不齊，可能會影響到整個推薦系統的響應時間。

為了解決這兩個問題，我們設計了近在線計算來進行業務的產品信息異步緩存策略，具體的流程如下。

我們會將待推薦的產品 Id 全部通過 Kafka 異步下發，在 Storm 中我們會對各業務方的產品首先進行聚合，達到批處理個數或者時間 gap 時，再調用各業務方的接口，這樣減少對業務方接口的壓力。通過調用業務方接口更新的產品狀態臨時緩存起來（根據各業務產品信息更新周期分別設置緩存失效時間），在線計算的時候直接先讀取臨時緩存數據，緩存不存在的情況下，再擊穿到業務的接口服務。

4）在線計算（2 個關鍵業務層架構模塊介紹）

1，業務層架構 - 數據治理和訪問模塊，支持的存儲介質，目前支持的存儲介質有 Localcache，Redis，Hbase，Mysql 可以支持橫向擴展。統一配置，對同一份數據，采用統一配置，可以隨意存儲在任意介質，根據 id 查詢返回統一格式的數據，對查詢接口完全透明。

穿透策略和容災策略，Redis 只存儲了熱數據，當需要查詢冷數據則可以自動到下一級存儲如 Hbase 查詢，避免緩存資源浪費。當 Redis 出現故障時或請求數異常上漲，超過整體承受能力，此時服務降級自動生效，并可配置化。?

2，業務層架構 - 推薦策略模塊，整個流程是先將用戶意圖、用戶瀏覽，相關推薦策略生成的產品集合等做為數據輸入，接著按照場景規則，業務邏輯重新過濾，聚合、排序。最后驗證和拼裝業務線產品信息后輸出推薦結果；

我們對此流程每一步進行了一些模塊化的抽象，將重排序邏輯按步驟抽象解耦，抽象如右圖所示的多個組件，開發新接口時僅需要將內部 DSL 拼裝便可以得到滿足業務需求的推薦服務；提高了代碼的復用率和可讀性，減少了超過 50% 的開發時間；對于充分驗證的模塊的復用，有效保證了服務的質量。

轉載于:https://www.cnblogs.com/davidwang456/articles/9981584.html

總結

以上是生活随笔為你收集整理的面对百亿用户数据，日均亿次请求，携程应用架构如何涅槃？的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇： eBay的Elasticsearch性能
下一篇：关于用户画像产品构建和应用的几点经验