申通完美支撑“双11”——亿级包裹背后的云基础设施
簡(jiǎn)介:?億級(jí)包裹洪峰過(guò)境,千萬(wàn)級(jí)訂單毫秒級(jí)響應(yīng),系統(tǒng)穩(wěn)如泰山。今年雙11,申通的系統(tǒng)前所未有的流暢與平穩(wěn)。
?
今年雙11,申通的系統(tǒng)前所未有的流暢與平穩(wěn)
“雙11全站跑在阿里云上,億級(jí)包裹洪峰過(guò)境,千萬(wàn)級(jí)訂單毫秒級(jí)響應(yīng),系統(tǒng)穩(wěn)如泰山?!?申通上云的技術(shù)負(fù)責(zé)人方遙難掩驕傲地說(shuō)。
“11月1日凌晨第一波訂單高峰到來(lái),整個(gè)系統(tǒng)的響應(yīng)很快,面對(duì)超過(guò)日常數(shù)倍的接單量,系統(tǒng)的響應(yīng)時(shí)間沒(méi)有變化;在接單、自動(dòng)化分揀、巴槍掃描、快件跟蹤等核心指標(biāo)上表現(xiàn)穩(wěn)定;相應(yīng)的中間件、數(shù)據(jù)庫(kù)資源的負(fù)載也在合理的區(qū)間范圍內(nèi)波動(dòng)。”方遙在接受媒體采訪時(shí)表示。
這讓他對(duì)第二波訂單高峰信心滿滿,上云后的申通系統(tǒng)沒(méi)有讓他失望。
11月6日,方遙盯著屏幕上穩(wěn)定運(yùn)行的后臺(tái)系統(tǒng),像看自己的孩子。從8月進(jìn)入雙11備戰(zhàn),將近三個(gè)月的時(shí)間,經(jīng)歷了無(wú)數(shù)次壓測(cè),雙11第一波結(jié)束,才算輕松下來(lái)。作為申通上云負(fù)責(zé)人,他長(zhǎng)久的努力,也在此刻得到了最大的回報(bào)。
上云前,申通使用線下機(jī)房作為計(jì)算及數(shù)據(jù)存儲(chǔ)平臺(tái),一到雙11資源需求就膨脹,大促之后則閑置浪費(fèi);上云后,幾乎全部的資源都是按量購(gòu)買,用完雙11就釋放,真正做到了開(kāi)箱即用,不產(chǎn)生一天浪費(fèi)。與去年雙11當(dāng)天相比,今年11月1到3日,相比此前傳統(tǒng)IDC架構(gòu)方案,在業(yè)務(wù)量大幅提升的情況下,IT投入反而降低了30%。上云的成效顯著。
全站應(yīng)用容器化,彈性調(diào)度穩(wěn)定高效
在設(shè)計(jì)全站上云方案之初,方遙就果斷決定擁抱云原生并將所有應(yīng)用100%容器化,技術(shù)轉(zhuǎn)型的決策,是來(lái)自其強(qiáng)烈的危機(jī)感,2019年快遞行業(yè)業(yè)務(wù)量達(dá)到600億件,申通業(yè)務(wù)量達(dá)到73億件,開(kāi)始向百億件規(guī)模挺進(jìn)。
選用阿里云容器服務(wù)ACK和容器鏡像服務(wù)ACR,可以為申通帶來(lái)兩大重要好處:業(yè)務(wù)快速上線、開(kāi)箱即用的可靠彈性。
在這個(gè)快速多變的時(shí)代,企業(yè)業(yè)務(wù)“唯快不破”。通過(guò)云原生技術(shù)可以做到快速上線部署,為團(tuán)隊(duì)培養(yǎng)出應(yīng)用開(kāi)發(fā)與運(yùn)維的規(guī)范化操作,形成了將應(yīng)用代碼打包成容器鏡像再到K8s標(biāo)準(zhǔn)化部署的流程,不再需要耗費(fèi)大量時(shí)間人肉發(fā)布、也避免了因集群配置不一致而發(fā)生故障等問(wèn)題,成功轉(zhuǎn)型DevOps驅(qū)動(dòng)公司。
其次,快遞的業(yè)務(wù)是非常典型的周期性業(yè)務(wù),在業(yè)務(wù)爆發(fā)式增長(zhǎng)的時(shí)候,資源如何做到開(kāi)箱即用?而業(yè)務(wù)突發(fā)增長(zhǎng),哪有比雙11更具代表的時(shí)期呢,今年雙11就是申通是彈性調(diào)度的絕佳試驗(yàn)場(chǎng)。
當(dāng)然容器與Kubernetes技術(shù)帶來(lái)的還有更多:依賴Kubernetes為核心的數(shù)據(jù)中心通過(guò)應(yīng)用編排、業(yè)務(wù)故障自愈的能力讓整個(gè)系統(tǒng)更穩(wěn);通過(guò)監(jiān)控埋點(diǎn)、業(yè)務(wù)日志收集、鏈路監(jiān)控等手段保證了在快速迭代過(guò)程中業(yè)務(wù)系統(tǒng)的穩(wěn)定性;通過(guò)對(duì)計(jì)算資源的水位監(jiān)測(cè),結(jié)合業(yè)務(wù)的峰值情況,彈性擴(kuò)縮容或降低配規(guī)格數(shù)量,可以降低整個(gè)資源的費(fèi)用等等。
這個(gè)云原生化全站遷云的戰(zhàn)役,一場(chǎng)耗時(shí)一年有余。
經(jīng)過(guò)數(shù)不勝數(shù)的需求溝通與技術(shù)改造,在申通與阿里云同學(xué)們的不斷努力下,申通最終成功實(shí)現(xiàn)采用云原生技術(shù)和架構(gòu)實(shí)現(xiàn)核心業(yè)務(wù)搬遷上阿里云。
這個(gè)決策,為今年雙11技術(shù)創(chuàng)新埋下了伏筆:比如,應(yīng)用彈性伸縮大大降低計(jì)算成本,一年節(jié)省數(shù)百萬(wàn);又比如,快速上線更多創(chuàng)新業(yè)務(wù),今年雙11的預(yù)售商品提前下沉到用戶附近,樓上下單樓下發(fā)貨,提升顧客體驗(yàn)。
“上云只是一個(gè)開(kāi)端,云只是基礎(chǔ)設(shè)施。”方遙說(shuō),“申通的技術(shù)架構(gòu)會(huì)朝著下一代微服務(wù)架構(gòu)Mesh演進(jìn),提升復(fù)雜系統(tǒng)的可治理性。”
阿里云神龍裸金屬方案,支撐申通平滑渡過(guò)雙11
申通核心業(yè)務(wù)系統(tǒng)原架構(gòu)基于 VMware+Oracle 數(shù)據(jù)庫(kù)進(jìn)行搭建。隨著搬遷上阿里云,架構(gòu)全面轉(zhuǎn)型為基于 Kubernetes 的云原生架構(gòu)體系。其中,引入云原生數(shù)據(jù)庫(kù)并完成應(yīng)用基于容器的微服務(wù)改造是整個(gè)應(yīng)用服務(wù)架構(gòu)重構(gòu)的關(guān)鍵點(diǎn)。
綜合考慮申通實(shí)際業(yè)務(wù)需求與技術(shù)特征,最終選擇了「阿里云 ACK+ 神龍裸金屬 + 云數(shù)據(jù)庫(kù)」的云原生解決方案,實(shí)現(xiàn)核心應(yīng)用遷移上阿里云。
?
阿里云ACK+神龍裸金屬方案,于2020年609云峰會(huì)上重磅發(fā)布。申通云原生上云的基礎(chǔ)設(shè)施,就全部使用了阿里云的神龍裸金屬服務(wù)器。相較于一般云服務(wù)器(ECS),Kubernetes 搭配神龍服務(wù)器能夠獲得更優(yōu)性能及更合理的資源利用率且云上資源按需取量,對(duì)于擁有大促活動(dòng)等短期大流量業(yè)務(wù)場(chǎng)景的申通而言極為重要。
?
首先,云原生裸金屬方案,可以滿足業(yè)務(wù)快速發(fā)放和彈性的要求。神龍裸金屬服務(wù)器可分鐘級(jí)完成實(shí)例創(chuàng)建和啟動(dòng),并利用Kubernetes的調(diào)度和編排能力,通過(guò)阿里云容器K8S服務(wù)與阿里云基礎(chǔ)設(shè)施的緊密協(xié)同(SLB, VPC, NAS, SLS等等),在非常短的時(shí)間內(nèi),支持業(yè)務(wù)極速部署,輕松應(yīng)對(duì)瞬時(shí)峰值場(chǎng)景對(duì)系統(tǒng)敏捷性的要求。
第二, 神龍裸金屬的性能,加上容器的彈性,形成了天作之合。“容器+神龍裸金屬”的解決方案非常契合像雙11這種大流量、高并發(fā)的場(chǎng)景。
神龍裸金屬是云原生的最佳載體,它規(guī)格較高,可以實(shí)現(xiàn)高密度容器部署。同時(shí),神龍服務(wù)器的性能優(yōu)勢(shì)明顯,?它完全消除了虛擬化損耗,提升8%的計(jì)算性能,其類物理機(jī)特性,可進(jìn)行二次虛擬化。新一代容器服務(wù) ACK,可以將最新神龍彈性裸金屬實(shí)例的強(qiáng)大性能發(fā)揮得淋漓盡致。
數(shù)據(jù)顯示,容器運(yùn)行在云上神龍反而比非云物理機(jī)的性能要好10%-15%。因?yàn)樯颀堅(jiān)品?wù)器不僅無(wú)虛擬化開(kāi)銷,而且運(yùn)行在神龍上的每個(gè)容器都可以獨(dú)享彈性網(wǎng)卡ENI,能提升13%的網(wǎng)絡(luò)吞吐量。
結(jié)語(yǔ)
如果說(shuō),快遞行業(yè)上半場(chǎng)的競(jìng)爭(zhēng)拼的是規(guī)模、服務(wù)乃至價(jià)格,進(jìn)入下半場(chǎng),快遞企業(yè)們還需要比拼硬核的技術(shù)實(shí)力。
阿里云基礎(chǔ)設(shè)施首次支撐申通全站業(yè)務(wù)系統(tǒng),申通的雙11平穩(wěn)順滑,展現(xiàn)了無(wú)限潛力。
?
原文鏈接
本文為阿里云原創(chuàng)內(nèi)容,未經(jīng)允許不得轉(zhuǎn)載。
總結(jié)
以上是生活随笔為你收集整理的申通完美支撑“双11”——亿级包裹背后的云基础设施的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 阿里大数据云原生化实践,EMR Spar
- 下一篇: 银行业数据治理之数据资产管理